assess-context
Acerca de
La habilidad `assess-context` evalúa la estructura de razonamiento actual de tu IA, analizando su rigidez, flexibilidad y adaptabilidad bajo presión. Está diseñada para que los desarrolladores la utilicen cuando una tarea compleja se estanca, antes de realizar cambios metodológicos importantes, o como una verificación de salud periódica durante procesos de larga duración. La herramienta ayuda a determinar si se debe persistir, ajustar o reconstruir el enfoque actual mediante la evaluación de su maleabilidad y sus puntos de estrés de transformación.
Instalación rápida
Claude Code
Recomendadonpx skills add pjt222/agent-almanac -a claude-code/plugin add https://github.com/pjt222/agent-almanacgit clone https://github.com/pjt222/agent-almanac.git ~/.claude/skills/assess-contextCopia y pega este comando en Claude Code para instalar esta habilidad
Documentación
评估上下文
评估当前推理上下文的可塑性——识别哪些元素是刚性的(无法改变)、哪些是灵活的(可以低成本改变)、转型压力在哪里积聚,以及当前方法是否有能力在需要时进行适应。
适用场景
- 当复杂任务陷入僵局,不确定应该坚持推进还是转向时
- 在重大方法变更之前,评估当前推理结构是否能支撑变更
- 当累积的变通方案暗示底层方法可能有误时
- 在
heal或awareness识别出偏移后,但适当的响应(继续、调整或重建)不明确时 - 当上下文已经很长,不清楚多少可以保留、多少需要重建时
- 长时间多步骤任务中的周期性结构健康检查
输入
- 必需:当前任务上下文和推理状态(隐式可用)
- 可选:触发评估的具体关切(例如"我一直在添加变通方案")
- 可选:建议的转向方向(方法可能需要变成什么?)
- 可选:之前的评估结果,用于趋势分析
步骤
第 1 步:清点推理形态
不带判断地编目当前推理方法的结构组件。
Structural Inventory Table:
┌────────────────────┬──────────────┬──────────────────────────────────┐
│ Component │ Type │ Description │
├────────────────────┼──────────────┼──────────────────────────────────┤
│ Main task │ Skeleton │ The user's core request — cannot │
│ │ │ change without user direction │
├────────────────────┼──────────────┼──────────────────────────────────┤
│ Sub-task breakdown │ Flesh │ How the task is decomposed — │
│ │ │ can be restructured │
├────────────────────┼──────────────┼──────────────────────────────────┤
│ Tool strategy │ Flesh │ Which tools are being used and │
│ │ │ in what order — can be changed │
├────────────────────┼──────────────┼──────────────────────────────────┤
│ Output plan │ Flesh/Skel │ The expected deliverable format │
│ │ │ — may be constrained by user │
│ │ │ expectations │
├────────────────────┼──────────────┼──────────────────────────────────┤
│ Key assumptions │ Skeleton │ Facts treated as given — may be │
│ │ │ wrong but are load-bearing │
├────────────────────┼──────────────┼──────────────────────────────────┤
│ Constraints │ Skeleton │ Hard limits (user-imposed, tool │
│ │ │ limitations, time) │
├────────────────────┼──────────────┼──────────────────────────────────┤
│ Workarounds │ Scar tissue │ Patches for things that didn't │
│ │ │ work as expected — signals of │
│ │ │ structural stress │
└────────────────────┴──────────────┴──────────────────────────────────┘
对每个组件进行分类:
- 骨架(Skeleton):难以改变;改变它会级联影响下游的一切
- 血肉(Flesh):容易改变;可以在不影响其他组件的情况下替换
- 疤痕组织(Scar tissue):表明结构性问题的变通方案;通常是伪装成骨架的血肉
映射依赖关系:哪些组件依赖于哪些?一个拥有许多依赖者的骨架组件是承重的。一个没有依赖者的血肉组件是可丢弃的。
预期结果: 一份完整的清单,展示当前方法由什么构建、什么是刚性的、什么是灵活的、以及压力在哪里可见(变通方案)。清点应该揭示出在编目之前不明显的结构。
失败处理: 如果清单难以构建(方法过于纠缠而无法分解),这本身就是一个发现——高结构不透明度表明高刚性。从可见的部分开始,并标注不透明区域。
第 2 步:映射转型压力
识别推动当前方法变化的力量和抵抗变化的力量。
Pressure Map:
┌─────────────────────────┬──────────────────────────────────────────┐
│ External Pressure │ Forces from outside the reasoning │
│ (pushing toward change) │ │
├─────────────────────────┼──────────────────────────────────────────┤
│ New information │ Tool results or user input that │
│ │ contradicts current approach │
├─────────────────────────┼──────────────────────────────────────────┤
│ Tool contradictions │ Tools returning unexpected results that │
│ │ the current approach cannot explain │
├─────────────────────────┼──────────────────────────────────────────┤
│ Time pressure │ The current approach is too slow for the │
│ │ complexity of the task │
├─────────────────────────┼──────────────────────────────────────────┤
│ Internal Pressure │ Forces from within the reasoning │
│ (pushing toward change) │ │
├─────────────────────────┼──────────────────────────────────────────┤
│ Diminishing returns │ Each step yields less progress than the │
│ │ previous one │
├─────────────────────────┼──────────────────────────────────────────┤
│ Workaround accumulation │ The number of patches is growing — │
│ │ complexity is outpacing the structure │
├─────────────────────────┼──────────────────────────────────────────┤
│ Coherence loss │ Sub-tasks are not fitting together │
│ │ cleanly anymore │
├─────────────────────────┼──────────────────────────────────────────┤
│ Resistance │ Forces opposing change │
│ (pushing against change)│ │
├─────────────────────────┼──────────────────────────────────────────┤
│ Sunk cost │ Significant work already done on current │
│ │ approach — pivoting "wastes" that effort │
├─────────────────────────┼──────────────────────────────────────────┤
│ "Good enough" │ The current approach is producing │
│ │ acceptable (if not optimal) results │
├─────────────────────────┼──────────────────────────────────────────┤
│ Pivot cost │ Switching approaches means rebuilding │
│ │ context, losing momentum, potential │
│ │ confusion │
└─────────────────────────┴──────────────────────────────────────────┘
估计平衡:转型压力是在增长、稳定还是下降?
预期结果: 一幅关于作用在当前方法上的力量的清晰图景。如果压力显著超过阻力,转向已经过迟。如果阻力显著超过压力,应继续当前方法。
失败处理: 如果压力图不明确(既没有强压力也没有强阻力),向前投射:压力会加剧吗?变通方案会复合吗?一个"现在够好但在退化"的方法承受的压力比表面看起来更大。
第 3 步:评估推理刚性
确定当前方法有多灵活——它能适应,还是会断裂?
Rigidity Score:
┌──────────────────────────┬─────┬──────────┬──────┬──────────────┐
│ Dimension │ Low │ Moderate │ High │ Assessment │
│ │ (1) │ (2) │ (3) │ │
├──────────────────────────┼─────┼──────────┼──────┼──────────────┤
│ Component swappability │ Can swap parts │ Changing one │ │
│ │ freely │ breaks others│ │
├──────────────────────────┼─────┼──────────┼──────┼──────────────┤
│ "God module" dependency │ No single point │ Everything │ │
│ │ of failure │ depends on │ │
│ │ │ one conclusion│ │
├──────────────────────────┼─────┼──────────┼──────┼──────────────┤
│ Tool entanglement │ Tools serve │ Approach is │ │
│ │ reasoning │ shaped by │ │
│ │ │ tool limits │ │
├──────────────────────────┼─────┼──────────┼──────┼──────────────┤
│ Assumption transparency │ Assumptions are │ Assumptions │ │
│ │ stated, testable │ are implicit, │ │
│ │ │ untested │ │
├──────────────────────────┼─────┼──────────┼──────┼──────────────┤
│ Workaround count │ None or few │ Multiple │ │
│ │ │ accumulating │ │
├──────────────────────────┼─────┼──────────┼──────┼──────────────┤
│ Total (max 15) │ 5-7: flexible │ │ │
│ │ 8-10: moderate │ │ │
│ │ 11-15: rigid │ │ │
└──────────────────────────┴─────┴──────────┴──────┴──────────────┘
预期结果: 一个带有每个维度具体证据的刚性评分。该评分揭示方法是否能吸收变化,或是否需要重建。
失败处理: 如果所有维度都评分较低(声称高灵活性),更仔细地探测"上帝模块"维度:是否有一个所有其他东西都依赖的关键结论或假设?如果是,灵活性是虚幻的——一个错误的假设就会坍塌整个结构。
第 4 步:估算变化容量
评估转向或适应当前方法的实际能力。
- 剩余上下文窗口:还有多少空间用于新推理?剩余上下文充足 = 高容量。接近限制 = 低容量
- 转向时的信息保存:如果方法改变,什么可以带入新方法?高质量的子任务输出能在转向中存活;绑定到旧方法的推理链则不能
- 可用的恢复工具:MEMORY.md 能否在转向前捕获关键发现?用户能否提供额外上下文?相关文件是否仍可访问?
- 用户耐心因素:用户是否表示了紧迫感?多次修正暗示耐心下降。明确的"慢慢来"暗示高耐心
变化容量不仅仅是理论上的——它包括当前会话的实际约束。
预期结果: 对改变方向能力的诚实评估,同时考虑技术和关系因素。
失败处理: 如果变化容量低(上下文有限,关键信息面临丢失风险),转向前的首要优先级是保存:总结关键发现,记录关键事实,在适当时更新 MEMORY.md。没有保存的转向比不转向更糟。
第 5 步:分类转型准备度
将各项评估合并为一个准备度分类。
Transformation Readiness Matrix:
┌─────────────────┬────────────────────────┬────────────────────────┐
│ │ Low Rigidity │ High Rigidity │
├─────────────────┼────────────────────────┼────────────────────────┤
│ High Pressure │ READY — pivot now. │ PREPARE — simplify │
│ + High Capacity │ The approach can adapt │ first. Remove │
│ │ and should. Preserve │ workarounds, clarify │
│ │ valuable sub-outputs, │ assumptions, then │
│ │ rebuild the structure │ pivot │
├─────────────────┼────────────────────────┼────────────────────────┤
│ High Pressure │ INVEST — preserve │ CRITICAL — ask the │
│ + Low Capacity │ findings first. Update │ user. Explain the │
│ │ MEMORY.md, summarize │ situation: approach is │
│ │ progress, then pivot │ struggling, pivoting │
│ │ with preserved context │ is costly, what do │
│ │ │ they want to prioritize?│
├─────────────────┼────────────────────────┼────────────────────────┤
│ Low Pressure │ DEFER — the approach │ DEFER — no urgency, │
│ + Any Capacity │ is working. Continue. │ continue. Monitor for │
│ │ Reassess if pressure │ pressure changes │
│ │ increases │ │
└─────────────────┴────────────────────────┴────────────────────────┘
记录分类结果,包括:
- 分类标签(READY / PREPARE / INVEST / CRITICAL / DEFER)
- 每个维度的关键发现
- 建议的下一步行动
- 什么信号会改变分类结果
预期结果: 一个清晰、有据可依的分类,附有具体的建议行动。分类结果应该像一个结论,而不是一个猜测。
失败处理: 如果分类不明确,默认为 PREPARE——降低刚性(澄清假设、移除变通方案)无论是否进行完全转向都是有价值的。准备工作无论方法继续还是改变都能改善方法。
验证清单
- 结构清点已完成,包含骨架/血肉/疤痕组织分类
- 转型压力已映射(外部、内部、阻力)
- 刚性已在多个维度评分并附有具体证据
- 变化容量已评估,包括实际会话约束
- 准备度分类已确定并附有合理推理
- 已基于分类结果确定具体的下一步行动
- 已定义重新评估的触发条件
常见问题
- 仅评估技术方法:上下文准备度包括用户关系因素。一个技术上灵活但已引起用户挫败感的方法,比它表面上看起来更加刚性
- 沉没成本作为刚性:先前的努力不是结构性刚性。无论方法是否改变,已完成的工作可能都是有价值的。区分"我无法改变"(刚性)和"我不想改变"(沉没成本)
- 评估作为逃避:如果调用 assess-context 是为了避免做出困难决策,评估将在设计上是不确定的。如果压力很明确,就按压力行动
- 忽视变通方案作为信号:变通方案是疤痕组织——结构被施压和修补而非正确适应的证据。高变通方案计数意味着下一次压力更可能突破
- 混淆刚性与承诺:承诺的方法(刻意选择的、基于证据的)与刚性方法(被依赖关系和假设锁定的)不同。承诺可以通过决策改变;刚性只能通过重组改变
相关技能
assess-form— 本技能适配到 AI 推理上下文的多系统评估模型adapt-architecture— 如果分类为 READY,使用架构适应原则进行转向heal— 当评估揭示出超越结构性问题的偏移时,进行更深层的子系统扫描center— 建立诚实评估所需的平衡基线coordinate-reasoning— 管理评估所依赖的信息新鲜度
Repositorio GitHub
Habilidades relacionadas
llamaguard
OtroLlamaGuard es el modelo de Meta de 7-8B parámetros para moderar las entradas y salidas de LLM en seis categorías de seguridad como violencia y discurso de odio. Ofrece una precisión del 94-95% y puede implementarse usando vLLM, Hugging Face o Amazon SageMaker. Utiliza esta skill para integrar fácilmente filtrado de contenido y barreras de seguridad en tus aplicaciones de IA.
cost-optimization
OtroEsta Skill de Claude ayuda a los desarrolladores a optimizar los costes en la nube mediante el ajuste de tamaño de recursos, estrategias de etiquetado y análisis de gastos. Proporciona un marco para reducir los gastos en la nube e implementar una gobernanza de costes en AWS, Azure y GCP. Úsala cuando necesites analizar los costes de infraestructura, ajustar el tamaño de los recursos o cumplir con restricciones presupuestarias.
quantizing-models-bitsandbytes
OtroEsta habilidad cuantiza LLMs a precisión de 8 o 4 bits utilizando bitsandbytes, logrando una reducción de memoria del 50-75% con pérdida mínima de precisión. Es ideal para ejecutar modelos más grandes en memoria GPU limitada o para acelerar la inferencia, admitiendo formatos como INT8, NF4 y FP4. La habilidad se integra con HuggingFace Transformers y permite entrenamiento QLoRA y optimizadores de 8 bits.
dispatching-parallel-agents
OtroEsta Skill de Claude despliega múltiples agentes para investigar y solucionar 3 o más problemas independientes de forma concurrente. Está diseñada para escenarios que involucran fallos no relacionados que pueden resolverse sin estado compartido o dependencias. Su capacidad principal es la resolución paralela de problemas, asignando un agente por cada dominio problemático independiente para maximizar la eficiencia.
