assess-context
Über
Die `assess-context`-Fähigkeit bewertet die aktuelle Denkstruktur Ihrer KI, analysiert deren Starrheit, Flexibilität und Anpassungsfähigkeit unter Druck. Sie ist für Entwickler konzipiert, um sie einzusetzen, wenn eine komplexe Aufgabe feststeckt, vor größeren Methodenänderungen oder als regelmäßige Gesundheitsprüfung während lang laufender Prozesse. Das Werkzeug hilft zu bestimmen, ob der aktuelle Ansatz beibehalten, angepasst oder neu aufgebaut werden sollte, indem es dessen Formbarkeit und Transformationsbelastungspunkte bewertet.
Schnellinstallation
Claude Code
Empfohlennpx skills add pjt222/agent-almanac -a claude-code/plugin add https://github.com/pjt222/agent-almanacgit clone https://github.com/pjt222/agent-almanac.git ~/.claude/skills/assess-contextKopieren Sie diesen Befehl und fügen Sie ihn in Claude Code ein, um diese Fähigkeit zu installieren
Dokumentation
评估上下文
评估当前推理上下文的可塑性——识别哪些元素是刚性的(无法改变)、哪些是灵活的(可以低成本改变)、转型压力在哪里积聚,以及当前方法是否有能力在需要时进行适应。
适用场景
- 当复杂任务陷入僵局,不确定应该坚持推进还是转向时
- 在重大方法变更之前,评估当前推理结构是否能支撑变更
- 当累积的变通方案暗示底层方法可能有误时
- 在
heal或awareness识别出偏移后,但适当的响应(继续、调整或重建)不明确时 - 当上下文已经很长,不清楚多少可以保留、多少需要重建时
- 长时间多步骤任务中的周期性结构健康检查
输入
- 必需:当前任务上下文和推理状态(隐式可用)
- 可选:触发评估的具体关切(例如"我一直在添加变通方案")
- 可选:建议的转向方向(方法可能需要变成什么?)
- 可选:之前的评估结果,用于趋势分析
步骤
第 1 步:清点推理形态
不带判断地编目当前推理方法的结构组件。
Structural Inventory Table:
┌────────────────────┬──────────────┬──────────────────────────────────┐
│ Component │ Type │ Description │
├────────────────────┼──────────────┼──────────────────────────────────┤
│ Main task │ Skeleton │ The user's core request — cannot │
│ │ │ change without user direction │
├────────────────────┼──────────────┼──────────────────────────────────┤
│ Sub-task breakdown │ Flesh │ How the task is decomposed — │
│ │ │ can be restructured │
├────────────────────┼──────────────┼──────────────────────────────────┤
│ Tool strategy │ Flesh │ Which tools are being used and │
│ │ │ in what order — can be changed │
├────────────────────┼──────────────┼──────────────────────────────────┤
│ Output plan │ Flesh/Skel │ The expected deliverable format │
│ │ │ — may be constrained by user │
│ │ │ expectations │
├────────────────────┼──────────────┼──────────────────────────────────┤
│ Key assumptions │ Skeleton │ Facts treated as given — may be │
│ │ │ wrong but are load-bearing │
├────────────────────┼──────────────┼──────────────────────────────────┤
│ Constraints │ Skeleton │ Hard limits (user-imposed, tool │
│ │ │ limitations, time) │
├────────────────────┼──────────────┼──────────────────────────────────┤
│ Workarounds │ Scar tissue │ Patches for things that didn't │
│ │ │ work as expected — signals of │
│ │ │ structural stress │
└────────────────────┴──────────────┴──────────────────────────────────┘
对每个组件进行分类:
- 骨架(Skeleton):难以改变;改变它会级联影响下游的一切
- 血肉(Flesh):容易改变;可以在不影响其他组件的情况下替换
- 疤痕组织(Scar tissue):表明结构性问题的变通方案;通常是伪装成骨架的血肉
映射依赖关系:哪些组件依赖于哪些?一个拥有许多依赖者的骨架组件是承重的。一个没有依赖者的血肉组件是可丢弃的。
预期结果: 一份完整的清单,展示当前方法由什么构建、什么是刚性的、什么是灵活的、以及压力在哪里可见(变通方案)。清点应该揭示出在编目之前不明显的结构。
失败处理: 如果清单难以构建(方法过于纠缠而无法分解),这本身就是一个发现——高结构不透明度表明高刚性。从可见的部分开始,并标注不透明区域。
第 2 步:映射转型压力
识别推动当前方法变化的力量和抵抗变化的力量。
Pressure Map:
┌─────────────────────────┬──────────────────────────────────────────┐
│ External Pressure │ Forces from outside the reasoning │
│ (pushing toward change) │ │
├─────────────────────────┼──────────────────────────────────────────┤
│ New information │ Tool results or user input that │
│ │ contradicts current approach │
├─────────────────────────┼──────────────────────────────────────────┤
│ Tool contradictions │ Tools returning unexpected results that │
│ │ the current approach cannot explain │
├─────────────────────────┼──────────────────────────────────────────┤
│ Time pressure │ The current approach is too slow for the │
│ │ complexity of the task │
├─────────────────────────┼──────────────────────────────────────────┤
│ Internal Pressure │ Forces from within the reasoning │
│ (pushing toward change) │ │
├─────────────────────────┼──────────────────────────────────────────┤
│ Diminishing returns │ Each step yields less progress than the │
│ │ previous one │
├─────────────────────────┼──────────────────────────────────────────┤
│ Workaround accumulation │ The number of patches is growing — │
│ │ complexity is outpacing the structure │
├─────────────────────────┼──────────────────────────────────────────┤
│ Coherence loss │ Sub-tasks are not fitting together │
│ │ cleanly anymore │
├─────────────────────────┼──────────────────────────────────────────┤
│ Resistance │ Forces opposing change │
│ (pushing against change)│ │
├─────────────────────────┼──────────────────────────────────────────┤
│ Sunk cost │ Significant work already done on current │
│ │ approach — pivoting "wastes" that effort │
├─────────────────────────┼──────────────────────────────────────────┤
│ "Good enough" │ The current approach is producing │
│ │ acceptable (if not optimal) results │
├─────────────────────────┼──────────────────────────────────────────┤
│ Pivot cost │ Switching approaches means rebuilding │
│ │ context, losing momentum, potential │
│ │ confusion │
└─────────────────────────┴──────────────────────────────────────────┘
估计平衡:转型压力是在增长、稳定还是下降?
预期结果: 一幅关于作用在当前方法上的力量的清晰图景。如果压力显著超过阻力,转向已经过迟。如果阻力显著超过压力,应继续当前方法。
失败处理: 如果压力图不明确(既没有强压力也没有强阻力),向前投射:压力会加剧吗?变通方案会复合吗?一个"现在够好但在退化"的方法承受的压力比表面看起来更大。
第 3 步:评估推理刚性
确定当前方法有多灵活——它能适应,还是会断裂?
Rigidity Score:
┌──────────────────────────┬─────┬──────────┬──────┬──────────────┐
│ Dimension │ Low │ Moderate │ High │ Assessment │
│ │ (1) │ (2) │ (3) │ │
├──────────────────────────┼─────┼──────────┼──────┼──────────────┤
│ Component swappability │ Can swap parts │ Changing one │ │
│ │ freely │ breaks others│ │
├──────────────────────────┼─────┼──────────┼──────┼──────────────┤
│ "God module" dependency │ No single point │ Everything │ │
│ │ of failure │ depends on │ │
│ │ │ one conclusion│ │
├──────────────────────────┼─────┼──────────┼──────┼──────────────┤
│ Tool entanglement │ Tools serve │ Approach is │ │
│ │ reasoning │ shaped by │ │
│ │ │ tool limits │ │
├──────────────────────────┼─────┼──────────┼──────┼──────────────┤
│ Assumption transparency │ Assumptions are │ Assumptions │ │
│ │ stated, testable │ are implicit, │ │
│ │ │ untested │ │
├──────────────────────────┼─────┼──────────┼──────┼──────────────┤
│ Workaround count │ None or few │ Multiple │ │
│ │ │ accumulating │ │
├──────────────────────────┼─────┼──────────┼──────┼──────────────┤
│ Total (max 15) │ 5-7: flexible │ │ │
│ │ 8-10: moderate │ │ │
│ │ 11-15: rigid │ │ │
└──────────────────────────┴─────┴──────────┴──────┴──────────────┘
预期结果: 一个带有每个维度具体证据的刚性评分。该评分揭示方法是否能吸收变化,或是否需要重建。
失败处理: 如果所有维度都评分较低(声称高灵活性),更仔细地探测"上帝模块"维度:是否有一个所有其他东西都依赖的关键结论或假设?如果是,灵活性是虚幻的——一个错误的假设就会坍塌整个结构。
第 4 步:估算变化容量
评估转向或适应当前方法的实际能力。
- 剩余上下文窗口:还有多少空间用于新推理?剩余上下文充足 = 高容量。接近限制 = 低容量
- 转向时的信息保存:如果方法改变,什么可以带入新方法?高质量的子任务输出能在转向中存活;绑定到旧方法的推理链则不能
- 可用的恢复工具:MEMORY.md 能否在转向前捕获关键发现?用户能否提供额外上下文?相关文件是否仍可访问?
- 用户耐心因素:用户是否表示了紧迫感?多次修正暗示耐心下降。明确的"慢慢来"暗示高耐心
变化容量不仅仅是理论上的——它包括当前会话的实际约束。
预期结果: 对改变方向能力的诚实评估,同时考虑技术和关系因素。
失败处理: 如果变化容量低(上下文有限,关键信息面临丢失风险),转向前的首要优先级是保存:总结关键发现,记录关键事实,在适当时更新 MEMORY.md。没有保存的转向比不转向更糟。
第 5 步:分类转型准备度
将各项评估合并为一个准备度分类。
Transformation Readiness Matrix:
┌─────────────────┬────────────────────────┬────────────────────────┐
│ │ Low Rigidity │ High Rigidity │
├─────────────────┼────────────────────────┼────────────────────────┤
│ High Pressure │ READY — pivot now. │ PREPARE — simplify │
│ + High Capacity │ The approach can adapt │ first. Remove │
│ │ and should. Preserve │ workarounds, clarify │
│ │ valuable sub-outputs, │ assumptions, then │
│ │ rebuild the structure │ pivot │
├─────────────────┼────────────────────────┼────────────────────────┤
│ High Pressure │ INVEST — preserve │ CRITICAL — ask the │
│ + Low Capacity │ findings first. Update │ user. Explain the │
│ │ MEMORY.md, summarize │ situation: approach is │
│ │ progress, then pivot │ struggling, pivoting │
│ │ with preserved context │ is costly, what do │
│ │ │ they want to prioritize?│
├─────────────────┼────────────────────────┼────────────────────────┤
│ Low Pressure │ DEFER — the approach │ DEFER — no urgency, │
│ + Any Capacity │ is working. Continue. │ continue. Monitor for │
│ │ Reassess if pressure │ pressure changes │
│ │ increases │ │
└─────────────────┴────────────────────────┴────────────────────────┘
记录分类结果,包括:
- 分类标签(READY / PREPARE / INVEST / CRITICAL / DEFER)
- 每个维度的关键发现
- 建议的下一步行动
- 什么信号会改变分类结果
预期结果: 一个清晰、有据可依的分类,附有具体的建议行动。分类结果应该像一个结论,而不是一个猜测。
失败处理: 如果分类不明确,默认为 PREPARE——降低刚性(澄清假设、移除变通方案)无论是否进行完全转向都是有价值的。准备工作无论方法继续还是改变都能改善方法。
验证清单
- 结构清点已完成,包含骨架/血肉/疤痕组织分类
- 转型压力已映射(外部、内部、阻力)
- 刚性已在多个维度评分并附有具体证据
- 变化容量已评估,包括实际会话约束
- 准备度分类已确定并附有合理推理
- 已基于分类结果确定具体的下一步行动
- 已定义重新评估的触发条件
常见问题
- 仅评估技术方法:上下文准备度包括用户关系因素。一个技术上灵活但已引起用户挫败感的方法,比它表面上看起来更加刚性
- 沉没成本作为刚性:先前的努力不是结构性刚性。无论方法是否改变,已完成的工作可能都是有价值的。区分"我无法改变"(刚性)和"我不想改变"(沉没成本)
- 评估作为逃避:如果调用 assess-context 是为了避免做出困难决策,评估将在设计上是不确定的。如果压力很明确,就按压力行动
- 忽视变通方案作为信号:变通方案是疤痕组织——结构被施压和修补而非正确适应的证据。高变通方案计数意味着下一次压力更可能突破
- 混淆刚性与承诺:承诺的方法(刻意选择的、基于证据的)与刚性方法(被依赖关系和假设锁定的)不同。承诺可以通过决策改变;刚性只能通过重组改变
相关技能
assess-form— 本技能适配到 AI 推理上下文的多系统评估模型adapt-architecture— 如果分类为 READY,使用架构适应原则进行转向heal— 当评估揭示出超越结构性问题的偏移时,进行更深层的子系统扫描center— 建立诚实评估所需的平衡基线coordinate-reasoning— 管理评估所依赖的信息新鲜度
GitHub Repository
Verwandte Skills
llamaguard
AndereLlamaGuard ist Metas 7-8B-Parameter-Modell zur Moderation von LLM-Eingaben und -Ausgaben in sechs Sicherheitskategorien wie Gewalt und Hassrede. Es bietet eine Genauigkeit von 94-95 % und kann mit vLLM, Hugging Face oder Amazon SageMaker eingesetzt werden. Nutzen Sie diese Skill, um Inhaltsfilterung und Sicherheitsguardrails einfach in Ihre KI-Anwendungen zu integrieren.
cost-optimization
AndereDiese Claude Skill unterstützt Entwickler bei der Optimierung von Cloud-Kosten durch Ressourcen-Dimensionierung, Tagging-Strategien und Ausgabenanalysen. Sie bietet einen Rahmen zur Senkung von Cloud-Ausgaben und zur Implementierung von Kosten-Governance für AWS, Azure und GCP. Nutzen Sie sie, wenn Sie Infrastrukturkosten analysieren, Ressourcen richtig dimensionieren oder Budgetvorgaben einhalten müssen.
quantizing-models-bitsandbytes
AndereDiese Fähigkeit quantisiert LLMs auf 8-Bit- oder 4-Bit-Präzision mittels bitsandbytes und erreicht dabei eine Speicherreduzierung von 50–75 % bei minimalem Genauigkeitsverlust. Sie ist ideal für den Betrieb größerer Modelle mit begrenztem GPU-Speicher oder zur Beschleunigung von Inferenzvorgängen und unterstützt Formate wie INT8, NF4 und FP4. Die Fähigkeit integriert sich in HuggingFace Transformers und ermöglicht QLoRA-Training sowie 8-Bit-Optimierer.
dispatching-parallel-agents
AndereDiese Claude-Fähigkeit verteilt mehrere Agenten, um drei oder mehr unabhängige Probleme gleichzeitig zu untersuchen und zu beheben. Sie ist für Szenarien konzipiert, die unabhängige Fehler umfassen, die ohne gemeinsamen Zustand oder Abhängigkeiten gelöst werden können. Die Kernfähigkeit ist die parallele Problemlösung, bei der pro unabhängigem Problembereich ein Agent zugewiesen wird, um die Effizienz zu maximieren.
