assess-context
О программе
Навык `assess-context` оценивает текущую структуру рассуждений вашего ИИ, анализируя её жёсткость, гибкость и способность адаптироваться под давлением. Он предназначен для разработчиков и используется, когда сложная задача зашла в тупик, перед внесением серьёзных изменений в метод или в качестве периодической проверки состояния в ходе длительных процессов. Инструмент помогает определить, стоит ли продолжать работу в текущем ключе, скорректировать подход или полностью перестроить его, оценивая податливость подхода и точки напряжения при его трансформации.
Быстрая установка
Claude Code
Рекомендуетсяnpx skills add pjt222/agent-almanac -a claude-code/plugin add https://github.com/pjt222/agent-almanacgit clone https://github.com/pjt222/agent-almanac.git ~/.claude/skills/assess-contextСкопируйте и вставьте эту команду в Claude Code для установки этого навыка
Документация
评估上下文
评估当前推理上下文的可塑性——识别哪些元素是刚性的(无法改变)、哪些是灵活的(可以低成本改变)、转型压力在哪里积聚,以及当前方法是否有能力在需要时进行适应。
适用场景
- 当复杂任务陷入僵局,不确定应该坚持推进还是转向时
- 在重大方法变更之前,评估当前推理结构是否能支撑变更
- 当累积的变通方案暗示底层方法可能有误时
- 在
heal或awareness识别出偏移后,但适当的响应(继续、调整或重建)不明确时 - 当上下文已经很长,不清楚多少可以保留、多少需要重建时
- 长时间多步骤任务中的周期性结构健康检查
输入
- 必需:当前任务上下文和推理状态(隐式可用)
- 可选:触发评估的具体关切(例如"我一直在添加变通方案")
- 可选:建议的转向方向(方法可能需要变成什么?)
- 可选:之前的评估结果,用于趋势分析
步骤
第 1 步:清点推理形态
不带判断地编目当前推理方法的结构组件。
Structural Inventory Table:
┌────────────────────┬──────────────┬──────────────────────────────────┐
│ Component │ Type │ Description │
├────────────────────┼──────────────┼──────────────────────────────────┤
│ Main task │ Skeleton │ The user's core request — cannot │
│ │ │ change without user direction │
├────────────────────┼──────────────┼──────────────────────────────────┤
│ Sub-task breakdown │ Flesh │ How the task is decomposed — │
│ │ │ can be restructured │
├────────────────────┼──────────────┼──────────────────────────────────┤
│ Tool strategy │ Flesh │ Which tools are being used and │
│ │ │ in what order — can be changed │
├────────────────────┼──────────────┼──────────────────────────────────┤
│ Output plan │ Flesh/Skel │ The expected deliverable format │
│ │ │ — may be constrained by user │
│ │ │ expectations │
├────────────────────┼──────────────┼──────────────────────────────────┤
│ Key assumptions │ Skeleton │ Facts treated as given — may be │
│ │ │ wrong but are load-bearing │
├────────────────────┼──────────────┼──────────────────────────────────┤
│ Constraints │ Skeleton │ Hard limits (user-imposed, tool │
│ │ │ limitations, time) │
├────────────────────┼──────────────┼──────────────────────────────────┤
│ Workarounds │ Scar tissue │ Patches for things that didn't │
│ │ │ work as expected — signals of │
│ │ │ structural stress │
└────────────────────┴──────────────┴──────────────────────────────────┘
对每个组件进行分类:
- 骨架(Skeleton):难以改变;改变它会级联影响下游的一切
- 血肉(Flesh):容易改变;可以在不影响其他组件的情况下替换
- 疤痕组织(Scar tissue):表明结构性问题的变通方案;通常是伪装成骨架的血肉
映射依赖关系:哪些组件依赖于哪些?一个拥有许多依赖者的骨架组件是承重的。一个没有依赖者的血肉组件是可丢弃的。
预期结果: 一份完整的清单,展示当前方法由什么构建、什么是刚性的、什么是灵活的、以及压力在哪里可见(变通方案)。清点应该揭示出在编目之前不明显的结构。
失败处理: 如果清单难以构建(方法过于纠缠而无法分解),这本身就是一个发现——高结构不透明度表明高刚性。从可见的部分开始,并标注不透明区域。
第 2 步:映射转型压力
识别推动当前方法变化的力量和抵抗变化的力量。
Pressure Map:
┌─────────────────────────┬──────────────────────────────────────────┐
│ External Pressure │ Forces from outside the reasoning │
│ (pushing toward change) │ │
├─────────────────────────┼──────────────────────────────────────────┤
│ New information │ Tool results or user input that │
│ │ contradicts current approach │
├─────────────────────────┼──────────────────────────────────────────┤
│ Tool contradictions │ Tools returning unexpected results that │
│ │ the current approach cannot explain │
├─────────────────────────┼──────────────────────────────────────────┤
│ Time pressure │ The current approach is too slow for the │
│ │ complexity of the task │
├─────────────────────────┼──────────────────────────────────────────┤
│ Internal Pressure │ Forces from within the reasoning │
│ (pushing toward change) │ │
├─────────────────────────┼──────────────────────────────────────────┤
│ Diminishing returns │ Each step yields less progress than the │
│ │ previous one │
├─────────────────────────┼──────────────────────────────────────────┤
│ Workaround accumulation │ The number of patches is growing — │
│ │ complexity is outpacing the structure │
├─────────────────────────┼──────────────────────────────────────────┤
│ Coherence loss │ Sub-tasks are not fitting together │
│ │ cleanly anymore │
├─────────────────────────┼──────────────────────────────────────────┤
│ Resistance │ Forces opposing change │
│ (pushing against change)│ │
├─────────────────────────┼──────────────────────────────────────────┤
│ Sunk cost │ Significant work already done on current │
│ │ approach — pivoting "wastes" that effort │
├─────────────────────────┼──────────────────────────────────────────┤
│ "Good enough" │ The current approach is producing │
│ │ acceptable (if not optimal) results │
├─────────────────────────┼──────────────────────────────────────────┤
│ Pivot cost │ Switching approaches means rebuilding │
│ │ context, losing momentum, potential │
│ │ confusion │
└─────────────────────────┴──────────────────────────────────────────┘
估计平衡:转型压力是在增长、稳定还是下降?
预期结果: 一幅关于作用在当前方法上的力量的清晰图景。如果压力显著超过阻力,转向已经过迟。如果阻力显著超过压力,应继续当前方法。
失败处理: 如果压力图不明确(既没有强压力也没有强阻力),向前投射:压力会加剧吗?变通方案会复合吗?一个"现在够好但在退化"的方法承受的压力比表面看起来更大。
第 3 步:评估推理刚性
确定当前方法有多灵活——它能适应,还是会断裂?
Rigidity Score:
┌──────────────────────────┬─────┬──────────┬──────┬──────────────┐
│ Dimension │ Low │ Moderate │ High │ Assessment │
│ │ (1) │ (2) │ (3) │ │
├──────────────────────────┼─────┼──────────┼──────┼──────────────┤
│ Component swappability │ Can swap parts │ Changing one │ │
│ │ freely │ breaks others│ │
├──────────────────────────┼─────┼──────────┼──────┼──────────────┤
│ "God module" dependency │ No single point │ Everything │ │
│ │ of failure │ depends on │ │
│ │ │ one conclusion│ │
├──────────────────────────┼─────┼──────────┼──────┼──────────────┤
│ Tool entanglement │ Tools serve │ Approach is │ │
│ │ reasoning │ shaped by │ │
│ │ │ tool limits │ │
├──────────────────────────┼─────┼──────────┼──────┼──────────────┤
│ Assumption transparency │ Assumptions are │ Assumptions │ │
│ │ stated, testable │ are implicit, │ │
│ │ │ untested │ │
├──────────────────────────┼─────┼──────────┼──────┼──────────────┤
│ Workaround count │ None or few │ Multiple │ │
│ │ │ accumulating │ │
├──────────────────────────┼─────┼──────────┼──────┼──────────────┤
│ Total (max 15) │ 5-7: flexible │ │ │
│ │ 8-10: moderate │ │ │
│ │ 11-15: rigid │ │ │
└──────────────────────────┴─────┴──────────┴──────┴──────────────┘
预期结果: 一个带有每个维度具体证据的刚性评分。该评分揭示方法是否能吸收变化,或是否需要重建。
失败处理: 如果所有维度都评分较低(声称高灵活性),更仔细地探测"上帝模块"维度:是否有一个所有其他东西都依赖的关键结论或假设?如果是,灵活性是虚幻的——一个错误的假设就会坍塌整个结构。
第 4 步:估算变化容量
评估转向或适应当前方法的实际能力。
- 剩余上下文窗口:还有多少空间用于新推理?剩余上下文充足 = 高容量。接近限制 = 低容量
- 转向时的信息保存:如果方法改变,什么可以带入新方法?高质量的子任务输出能在转向中存活;绑定到旧方法的推理链则不能
- 可用的恢复工具:MEMORY.md 能否在转向前捕获关键发现?用户能否提供额外上下文?相关文件是否仍可访问?
- 用户耐心因素:用户是否表示了紧迫感?多次修正暗示耐心下降。明确的"慢慢来"暗示高耐心
变化容量不仅仅是理论上的——它包括当前会话的实际约束。
预期结果: 对改变方向能力的诚实评估,同时考虑技术和关系因素。
失败处理: 如果变化容量低(上下文有限,关键信息面临丢失风险),转向前的首要优先级是保存:总结关键发现,记录关键事实,在适当时更新 MEMORY.md。没有保存的转向比不转向更糟。
第 5 步:分类转型准备度
将各项评估合并为一个准备度分类。
Transformation Readiness Matrix:
┌─────────────────┬────────────────────────┬────────────────────────┐
│ │ Low Rigidity │ High Rigidity │
├─────────────────┼────────────────────────┼────────────────────────┤
│ High Pressure │ READY — pivot now. │ PREPARE — simplify │
│ + High Capacity │ The approach can adapt │ first. Remove │
│ │ and should. Preserve │ workarounds, clarify │
│ │ valuable sub-outputs, │ assumptions, then │
│ │ rebuild the structure │ pivot │
├─────────────────┼────────────────────────┼────────────────────────┤
│ High Pressure │ INVEST — preserve │ CRITICAL — ask the │
│ + Low Capacity │ findings first. Update │ user. Explain the │
│ │ MEMORY.md, summarize │ situation: approach is │
│ │ progress, then pivot │ struggling, pivoting │
│ │ with preserved context │ is costly, what do │
│ │ │ they want to prioritize?│
├─────────────────┼────────────────────────┼────────────────────────┤
│ Low Pressure │ DEFER — the approach │ DEFER — no urgency, │
│ + Any Capacity │ is working. Continue. │ continue. Monitor for │
│ │ Reassess if pressure │ pressure changes │
│ │ increases │ │
└─────────────────┴────────────────────────┴────────────────────────┘
记录分类结果,包括:
- 分类标签(READY / PREPARE / INVEST / CRITICAL / DEFER)
- 每个维度的关键发现
- 建议的下一步行动
- 什么信号会改变分类结果
预期结果: 一个清晰、有据可依的分类,附有具体的建议行动。分类结果应该像一个结论,而不是一个猜测。
失败处理: 如果分类不明确,默认为 PREPARE——降低刚性(澄清假设、移除变通方案)无论是否进行完全转向都是有价值的。准备工作无论方法继续还是改变都能改善方法。
验证清单
- 结构清点已完成,包含骨架/血肉/疤痕组织分类
- 转型压力已映射(外部、内部、阻力)
- 刚性已在多个维度评分并附有具体证据
- 变化容量已评估,包括实际会话约束
- 准备度分类已确定并附有合理推理
- 已基于分类结果确定具体的下一步行动
- 已定义重新评估的触发条件
常见问题
- 仅评估技术方法:上下文准备度包括用户关系因素。一个技术上灵活但已引起用户挫败感的方法,比它表面上看起来更加刚性
- 沉没成本作为刚性:先前的努力不是结构性刚性。无论方法是否改变,已完成的工作可能都是有价值的。区分"我无法改变"(刚性)和"我不想改变"(沉没成本)
- 评估作为逃避:如果调用 assess-context 是为了避免做出困难决策,评估将在设计上是不确定的。如果压力很明确,就按压力行动
- 忽视变通方案作为信号:变通方案是疤痕组织——结构被施压和修补而非正确适应的证据。高变通方案计数意味着下一次压力更可能突破
- 混淆刚性与承诺:承诺的方法(刻意选择的、基于证据的)与刚性方法(被依赖关系和假设锁定的)不同。承诺可以通过决策改变;刚性只能通过重组改变
相关技能
assess-form— 本技能适配到 AI 推理上下文的多系统评估模型adapt-architecture— 如果分类为 READY,使用架构适应原则进行转向heal— 当评估揭示出超越结构性问题的偏移时,进行更深层的子系统扫描center— 建立诚实评估所需的平衡基线coordinate-reasoning— 管理评估所依赖的信息新鲜度
GitHub репозиторий
Похожие навыки
llamaguard
ДругоеLlamaGuard — это модель от Meta с 7–8 миллиардами параметров для модерации входных и выходных данных больших языковых моделей по шести категориям безопасности, таким как насилие и разжигание ненависти. Она обеспечивает точность 94–95% и может быть развернута с помощью vLLM, Hugging Face или Amazon SageMaker. Используйте этот навык, чтобы легко интегрировать фильтрацию контента и защитные механизмы в ваши ИИ-приложения.
cost-optimization
ДругоеЭтот навык Claude помогает разработчикам оптимизировать облачные расходы за счет правильного подбора ресурсов, стратегий тегирования и анализа затрат. Он предоставляет framework для сокращения облачных расходов и внедрения управления затратами в AWS, Azure и GCP. Используйте его, когда вам нужно проанализировать расходы на инфраструктуру, оптимизировать ресурсы или уложиться в бюджетные ограничения.
quantizing-models-bitsandbytes
ДругоеЭтот навык выполняет квантизацию LLM до 8-битной или 4-битной точности с использованием библиотеки bitsandbytes, обеспечивая сокращение использования памяти на 50-75% при минимальной потере точности. Он идеально подходит для запуска больших моделей при ограниченной памяти GPU или для ускорения вывода, поддерживая форматы INT8, NF4 и FP4. Навык интегрируется с HuggingFace Transformers и позволяет использовать обучение QLoRA и 8-битные оптимизаторы.
dispatching-parallel-agents
ДругоеЭтот навык Claude распределяет нескольких агентов для исследования и устранения трёх и более независимых проблем параллельно. Он предназначен для сценариев с несвязанными сбоями, которые можно устранить без общего состояния или зависимостей. Ключевая возможность — параллельное решение проблем, где за каждую независимую предметную область назначается отдельный агент для максимальной эффективности.
