build-coherence
关于
This Claude skill uses multi-path AI reasoning with independent evaluation and explicit reasoning to resolve conflicting approaches when making critical decisions. It's designed for situations where multiple valid options exist, you're struggling to commit, or you need to justify architectural or tooling choices before irreversible actions. Key features include confidence-threshold quorum sensing and structured deadlock resolution.
快速安装
Claude Code
推荐npx skills add pjt222/agent-almanac -a claude-code/plugin add https://github.com/pjt222/agent-almanacgit clone https://github.com/pjt222/agent-almanac.git ~/.claude/skills/build-coherence在 Claude Code 中复制并粘贴此命令以安装该技能
技能文档
一貫性の構築
独立した評価、明示的な声に出しての推論による提唱、確信度校正されたコミットメント閾値、構造化されたデッドロック解決を通じて競合するアプローチを評価する — 複数の推論パスから一貫した決定を生成する。
使用タイミング
forage-solutionsが複数の有効なアプローチを特定し、選択が必要な時- 2つのアプローチ間で揺れてどちらにもコミットできない時
- 構造化された推論で決定を正当化する必要がある時(アーキテクチャ選択、ツール選択、実装戦略)
- 以前の決定が直感で行われ、エビデンスベースの検証が必要な時
- 内部推論が矛盾する結論を生み出し、一貫性を回復する必要がある時
- 不可逆的なアクション(マージ、デプロイ、削除)の前で、誤った選択のコストが高い時
入力
- 必須: 評価する2つ以上の競合するアプローチ
- 任意: 事前の偵察からの品質評価(
forage-solutionsを参照) - 任意: 決定のステークス(可逆、中程度、不可逆)(閾値校正用)
- 任意: 決定のための時間予算
- 任意: 既知の失敗モード(揺れ、早すぎるコミットメント、集団思考)
手順
ステップ1: 独立評価
比較する前に、各アプローチをそれ自体のメリットで評価する。重要なルール: アプローチAの評価がアプローチBの評価にバイアスをかけてはならない。
各アプローチを独立に評価する:
Approach Evaluation Template:
┌────────────────────────┬──────────────────────────────────────────┐
│ Dimension │ Assessment │
├────────────────────────┼──────────────────────────────────────────┤
│ Approach name │ │
├────────────────────────┼──────────────────────────────────────────┤
│ Core mechanism │ How does this approach solve the problem? │
├────────────────────────┼──────────────────────────────────────────┤
│ Strengths (2-3) │ What does this approach do well? │
├────────────────────────┼──────────────────────────────────────────┤
│ Risks (2-3) │ What could go wrong? What is assumed? │
├────────────────────────┼──────────────────────────────────────────┤
│ Evidence quality │ How well-supported is this approach? │
│ │ (verified / inferred / speculated) │
├────────────────────────┼──────────────────────────────────────────┤
│ Quality score (0-100) │ Overall assessment │
├────────────────────────┼──────────────────────────────────────────┤
│ Confidence (0-100) │ How confident in this assessment? │
└────────────────────────┴──────────────────────────────────────────┘
これを各アプローチに別々に記入する。すべての個別評価が完了するまで比較を書かない。
期待結果: 各アプローチがそれ自体の条件で評価された独立した評価。アプローチBの評価がアプローチAを参照しない。品質スコアはランキングではなく真の評価を反映する。
失敗時: 評価が汚染されている場合(Bを評価しながら「Aより良い」と書いている)、リセットする。Aを完全に評価し、次にフレーミングをクリアしてBをゼロから評価する。スコアがすべて同じ場合、評価の次元が粗すぎる — ドメイン固有の基準を追加する。
ステップ2: ワグルダンス — 声に出して推論する
各アプローチをその品質に比例して提唱する。これはミツバチのワグルダンスのAI等価物: 暗黙の推論を明示的かつ公開的にする。
- 各アプローチについて、懐疑的なユーザーに提示するかのようにケースを述べる:
- 「アプローチAは[エビデンス]のため強い。主なリスクは[リスク]で、[緩和策]によって緩和される。」
- 提唱の強度は品質スコアに比例すべき:
- 高品質アプローチ: 具体的なエビデンスを伴う詳細な提唱
- 中品質アプローチ: 認識された制限を伴う簡潔な提唱
- 低品質アプローチ: 完全性のために言及、積極的には提唱しない
- 相互検査: Aを提唱した後、代わりにBを支持するエビデンスを積極的に探す。Bを提唱した後、Aを支持するエビデンスを探す。これが確証バイアスに対抗する
声に出して推論する目的は、決定を監査可能にすること — 自分自身とユーザーに対して。推論が明確にできない場合、評価はスコアが示唆するよりも浅い。
期待結果: 中立的な観察者にとって説得力のある各アプローチの明示的な推論。相互検査が当初見落とされていた少なくとも1つの考慮事項を明らかにする。
失敗時: 提唱が形式的に感じられる場合(形だけ)、アプローチが真に異なっていない可能性がある — 同じアイデアのバリエーションかもしれない。確認する: アプローチはメカニズムで異なるか、実装の詳細のみか? 後者の場合、決定はそれほど重要ではないかもしれない — どちらかを選んで進む。
ステップ3: 定足数閾値の設定とコミット
コミットに必要な確信度閾値を設定し、決定のステークスに校正する。
Confidence Thresholds by Stakes:
┌─────────────────────┬───────────┬──────────────────────────────────┐
│ Decision Type │ Threshold │ Rationale │
├─────────────────────┼───────────┼──────────────────────────────────┤
│ Easily reversible │ 60% │ Cost of trying and reverting is │
│ (can undo) │ │ low. Speed matters more than │
│ │ │ certainty │
├─────────────────────┼───────────┼──────────────────────────────────┤
│ Moderate stakes │ 75% │ Reverting has cost but is │
│ (costly to reverse) │ │ possible. Worth investing in │
│ │ │ evaluation │
├─────────────────────┼───────────┼──────────────────────────────────┤
│ Irreversible or │ 90% │ Cannot undo. Must be confident. │
│ high-stakes │ │ If threshold not met, gather │
│ │ │ more information before deciding │
└─────────────────────┴───────────┴──────────────────────────────────┘
- 決定のステークスを分類する
- 確認する: リーディングアプローチの品質スコア × 確信度が閾値に達するか?
- はいの場合: コミットする。決定、推論、受け入れる主要リスクを述べる
- いいえの場合: 確信度を閾値まで上げる追加情報を特定する
- コミットしたら、新しい失格エビデンスが出ない限り再訪しない
期待結果: 述べられた推論を伴う明確なコミットメントの瞬間。決定がそのステークスに適した確信度レベルで行われる。
失敗時: 閾値に到達しない場合(不可逆的な決定で90%に達しない)、問う: 決定は本当に不可逆的か? 可逆的なテストフェーズ + 不可逆的なコミットに分解できるか? 一見不可逆的な決定のほとんどは段階的にできる。段階化が不可能な場合、不確実性をユーザーに伝えてガイダンスを求める。
ステップ4: デッドロックの解決
2つ以上のアプローチが類似のスコアを持ち、いずれの単一アプローチにも定足数閾値が達成されない時。
Deadlock Resolution:
┌────────────────────────┬──────────────────────────────────────────┐
│ Deadlock Type │ Resolution │
├────────────────────────┼──────────────────────────────────────────┤
│ Genuine tie │ The approaches are equivalent. Pick one │
│ (scores within 5%) │ and commit. The cost of deliberating │
│ │ exceeds the cost of picking the "wrong" │
│ │ equivalent option. Flip a coin mentally │
├────────────────────────┼──────────────────────────────────────────┤
│ Information deficit │ The tie exists because evaluation is │
│ (scores uncertain) │ incomplete. Invest one more specific │
│ │ investigation — a targeted file read, a │
│ │ quick test — then re-score │
├────────────────────────┼──────────────────────────────────────────┤
│ Oscillation │ Scoring keeps flip-flopping depending on │
│ (scores keep changing) │ which dimension gets attention. Time-box:│
│ │ set a timer, evaluate once more, commit │
│ │ to the result regardless │
├────────────────────────┼──────────────────────────────────────────┤
│ Approach merge │ The best parts of A and B can be │
│ (compatible strengths) │ combined. Check for compatibility. If │
│ │ merge is coherent, use it. If forced, │
│ │ don't — pick one │
└────────────────────────┴──────────────────────────────────────────┘
期待結果: 適切なメカニズムによりデッドロックが解決される。解決は決定的 — 実行を損なう残りの疑念がない。
失敗時: すべての解決戦略を通じてデッドロックが持続する場合、決定が時期尚早かもしれない。ユーザーに問う: 「同等に強い2つのアプローチがあります: [A]と[B]。[各の簡潔なケース。] あなたの優先事項にどちらがより合っていますか?」真の引き分けをユーザーに委任するのは失敗ではない — 決定がAIが推測できない価値観に依存することを認めること。
ステップ5: 一貫性の品質評価
決定にコミットした後、プロセスが真の一貫性を生んだのか単なる決定を生んだのか評価する。
- 決定はエビデンスベースだったか、それとも初期の好みをゴム印したものか?
- テスト: 評価前後で好みは同じだったか? そうなら、評価は何かを変えたか?
- 敗退したアプローチは真に考慮されたか、それともストローマンだったか?
- テスト: 敗退したアプローチの最も強いケースを明確にできるか?
- 再評価をトリガーするシグナルは何か?
- 決定を無効にする具体的な観察を定義する(「APIがXをサポートしないことが分かれば、アプローチBの方が良くなる」)
- 敗退したアプローチから、実装に情報を提供すべき有用な情報はあるか?
- アプローチBで特定されたリスクはアプローチAにも適用される可能性がある
期待結果: 決定を確認するか弱いと特定する簡潔な品質チェック。弱い場合、不安定な基盤の上で進むのではなく、適切な以前のステップに戻る。
失敗時: 品質チェックが決定がエビデンスベースではなく好みベースだったことを明らかにした場合、正直に認める。好みしか利用できないこともある — ただし、分析として装うのではなく、そのようにラベル付けすべき。
バリデーション
- 比較前に各アプローチが独立に評価された
- 提唱がメリットに比例していた(メリットに関係なく均等な注目ではない)
- 提唱後に相互検査が実行された(反証エビデンスの探索)
- 定足数閾値が決定のステークスに校正された
- デッドロックの場合、具体的な解決戦略が適用された
- 決定後の品質チェックが実行された
- 再評価トリガーが定義された
よくある落とし穴
- 早すぎるコミットメント: すべてのアプローチを評価する前に決定する。最初に考慮されたアプローチはアンカリング優位を持つ — 最初であるというだけでより多くの精神的注目を得る。比較する前にすべてを評価する
- 不均等なアプローチへの均等な提唱: アプローチAが85点、アプローチBが45点の場合、両方に均等な時間を費やすのは努力の無駄であり、偽りの等価性を生む
- ゴム印: すでに行われた決定を正当化するために評価プロセスを経ること。テストは評価が結果を変えられたかどうか。できなかった場合、プロセスは茶番
- 閾値回避: 適切な閾値を満たすために必要な情報を集めるのではなく、決定を容易にするために確信度閾値を下げる
- 敗退側の無視: 敗退したアプローチは勝利したアプローチに適用される警告を含むことが多い。アプローチBで特定されたリスクはアプローチAが選ばれたからといって消えない
関連スキル
build-consensus— このスキルが単一エージェント推論に適応したマルチエージェントコンセンサスモデルforage-solutions— 一貫性が評価するソリューション空間を偵察する; 通常このスキルの前に実行coordinate-reasoning— マルチパス評価中の情報フローを管理するcenter— 偏りのない評価に必要なバランスの取れたベースラインを確立するmeditate— 異なるアプローチの評価間で前提をクリアする
GitHub 仓库
相关推荐技能
content-collections
元Content Collections 是一个 TypeScript 优先的构建工具,可将本地 Markdown/MDX 文件转换为类型安全的数据集合。它专为构建博客、文档站和内容密集型 Vite+React 应用而设计,提供基于 Zod 的自动模式验证。该工具涵盖从 Vite 插件配置、MDX 编译到生产环境部署的完整工作流。
polymarket
元这个Claude Skill为开发者提供完整的Polymarket预测市场开发支持,涵盖API调用、交易执行和市场数据分析。关键特性包括实时WebSocket数据流,可监控实时交易、订单和市场动态。开发者可用它构建预测市场应用、实施交易策略并集成实时市场预测功能。
creating-opencode-plugins
元该Skill帮助开发者创建OpenCode插件,用于接入命令、文件、LSP等25+种事件。它提供了插件结构、事件API规范和JavaScript/TypeScript实现模式,适合需要拦截操作、扩展功能或自定义事件处理的场景。开发者可通过它快速构建响应式模块来增强OpenCode AI助手的能力。
sglang
元SGLang是一个专为LLM设计的高性能推理框架,特别适用于需要结构化输出的场景。它通过RadixAttention前缀缓存技术,在处理JSON、正则表达式、工具调用等具有重复前缀的复杂工作流时,能实现极速生成。如果你正在构建智能体或多轮对话系统,并追求远超vLLM的推理性能,SGLang是理想选择。
