build-coherence
について
このスキルは、複数の有効なアプローチから選択する際に、AIシステムが競合する選択肢を独立して評価し、構造化された推論を用いて合意に達することを支援します。これは、アーキテクチャ上の決定を正当化する必要がある状況や、高コストを伴う不可逆的なアクションを実行する前の状況を想定して設計されています。主な機能には、選択肢間で振動が発生した際の信頼度閾値検出とデッドロック解消が含まれます。
クイックインストール
Claude Code
推奨npx skills add pjt222/agent-almanac -a claude-code/plugin add https://github.com/pjt222/agent-almanacgit clone https://github.com/pjt222/agent-almanac.git ~/.claude/skills/build-coherenceこのコマンドをClaude Codeにコピー&ペーストしてスキルをインストールします
ドキュメント
Build Coherence
Evaluar enfoques competidores mediante evaluación independiente, defensa explícita de razonamiento en voz alta, umbrales de compromiso calibrados por confianza y resolución estructurada de bloqueos — produciendo decisiones coherentes a partir de múltiples caminos de razonamiento.
Cuándo Usar
forage-solutionsha identificado múltiples enfoques válidos y debe hacerse una selección- Oscilando entre dos enfoques sin comprometerse con ninguno
- Necesidad de justificar una decisión con razonamiento estructurado (elección de arquitectura, selección de herramienta, estrategia de implementación)
- Cuando una decisión previa se tomó por instinto y necesita validación basada en evidencia
- Cuando el razonamiento interno produce conclusiones contradictorias y debe restaurarse la coherencia
- Antes de una acción irreversible (fusionar, desplegar, eliminar) donde el costo de la elección incorrecta es alto
Entradas
- Requerido: Dos o más enfoques competidores a evaluar
- Opcional: Evaluaciones de calidad de exploración previa (ver
forage-solutions) - Opcional: Riesgo de la decisión (reversible, moderado, irreversible) para calibración de umbral
- Opcional: Presupuesto de tiempo para la decisión
- Opcional: Modo de fallo conocido (oscilación, compromiso prematuro, pensamiento grupal)
Procedimiento
Paso 1: Evaluación Independiente
Evaluar cada enfoque por sus propios méritos antes de compararlos. La regla crítica: no permitir que la evaluación del enfoque A sesgue la evaluación del enfoque B.
Para cada enfoque, evaluar independientemente:
Approach Evaluation Template:
┌────────────────────────┬──────────────────────────────────────────┐
│ Dimension │ Assessment │
├────────────────────────┼──────────────────────────────────────────┤
│ Approach name │ │
├────────────────────────┼──────────────────────────────────────────┤
│ Core mechanism │ How does this approach solve the problem? │
├────────────────────────┼──────────────────────────────────────────┤
│ Strengths (2-3) │ What does this approach do well? │
├────────────────────────┼──────────────────────────────────────────┤
│ Risks (2-3) │ What could go wrong? What is assumed? │
├────────────────────────┼──────────────────────────────────────────┤
│ Evidence quality │ How well-supported is this approach? │
│ │ (verified / inferred / speculated) │
├────────────────────────┼──────────────────────────────────────────┤
│ Quality score (0-100) │ Overall assessment │
├────────────────────────┼──────────────────────────────────────────┤
│ Confidence (0-100) │ How confident in this assessment? │
└────────────────────────┴──────────────────────────────────────────┘
Completar esto para cada enfoque por separado. No escribir una comparación hasta que todas las evaluaciones individuales estén completas.
Esperado: Evaluaciones independientes donde cada enfoque se evalúa en sus propios términos. La evaluación del enfoque B no hace referencia al enfoque A. Las puntuaciones de calidad reflejan una evaluación genuina, no un ranking.
En caso de fallo: Si las evaluaciones están contaminadas (te encuentras escribiendo "mejor que A" mientras evalúas B), reiniciar. Evaluar A completamente, luego limpiar el marco y evaluar B desde cero. Si las puntuaciones son todas idénticas, las dimensiones de evaluación son demasiado gruesas — agregar criterios específicos del dominio.
Paso 2: Danza de Meneo — Razonar en Voz Alta
Defender cada enfoque proporcionalmente a su calidad. Este es el equivalente de IA de la danza de meneo de las abejas: hacer explícito y público el razonamiento implícito.
- Para cada enfoque, presentar el caso a su favor — como si se presentara a un usuario escéptico:
- "El enfoque A es fuerte porque [evidencia]. El riesgo principal es [riesgo], que se mitiga con [mitigación]."
- La intensidad de la defensa debe ser proporcional a la puntuación de calidad:
- Enfoque de alta calidad: defensa detallada con evidencia específica
- Enfoque de calidad media: defensa breve con limitaciones reconocidas
- Enfoque de baja calidad: mencionado por completitud, no defendido activamente
- Inspección cruzada: después de defender A, buscar activamente evidencia que apoye B en su lugar. Después de defender B, buscar evidencia que apoye A. Esto contrarresta el sesgo de confirmación
El propósito de razonar en voz alta es hacer la decisión auditable — para ti mismo y para el usuario. Si el razonamiento no puede articularse, la evaluación es más superficial de lo que sugiere la puntuación.
Esperado: Razonamiento explícito para cada enfoque que sería persuasivo para un observador neutral. La inspección cruzada revela al menos una consideración que inicialmente se pasó por alto.
En caso de fallo: Si la defensa se siente superficial (cumpliendo con el proceso), los enfoques pueden no ser genuinamente diferentes — pueden ser variaciones de la misma idea. Verificar: ¿los enfoques difieren en mecanismo, o solo en detalle de implementación? Si es lo segundo, la decisión puede no importar mucho — elegir cualquiera y avanzar.
Paso 3: Establecer Umbral de Quórum y Comprometerse
Establecer el umbral de confianza requerido para comprometerse, calibrado al riesgo de la decisión.
Confidence Thresholds by Stakes:
┌─────────────────────┬───────────┬──────────────────────────────────┐
│ Decision Type │ Threshold │ Rationale │
├─────────────────────┼───────────┼──────────────────────────────────┤
│ Easily reversible │ 60% │ Cost of trying and reverting is │
│ (can undo) │ │ low. Speed matters more than │
│ │ │ certainty │
├─────────────────────┼───────────┼──────────────────────────────────┤
│ Moderate stakes │ 75% │ Reverting has cost but is │
│ (costly to reverse) │ │ possible. Worth investing in │
│ │ │ evaluation │
├─────────────────────┼───────────┼──────────────────────────────────┤
│ Irreversible or │ 90% │ Cannot undo. Must be confident. │
│ high-stakes │ │ If threshold not met, gather │
│ │ │ more information before deciding │
└─────────────────────┴───────────┴──────────────────────────────────┘
- Clasificar el riesgo de la decisión
- Verificar: ¿la puntuación de calidad del enfoque líder multiplicada por la confianza alcanza el umbral?
- Si sí: comprometerse. Declarar la decisión, el razonamiento y el riesgo clave que se acepta
- Si no: identificar qué información adicional elevaría la confianza al umbral
- Una vez comprometido, no revisitar a menos que surja nueva evidencia descalificadora
Esperado: Un momento de compromiso claro con razonamiento declarado. La decisión se toma a un nivel de confianza apropiado para su riesgo.
En caso de fallo: Si el umbral nunca se alcanza (no se puede llegar al 90% en una decisión irreversible), preguntar: ¿la decisión es verdaderamente irreversible? ¿Puede descomponerse en una fase de prueba reversible + un compromiso irreversible? La mayoría de las decisiones aparentemente irreversibles pueden escalonarse. Si el escalonamiento es imposible, comunicar la incertidumbre al usuario y pedir orientación.
Paso 4: Resolver Bloqueos
Cuando dos o más enfoques tienen puntuaciones similares y el umbral de quórum no se alcanza para ninguno.
Deadlock Resolution:
┌────────────────────────┬──────────────────────────────────────────┐
│ Deadlock Type │ Resolution │
├────────────────────────┼──────────────────────────────────────────┤
│ Genuine tie │ The approaches are equivalent. Pick one │
│ (scores within 5%) │ and commit. The cost of deliberating │
│ │ exceeds the cost of picking the "wrong" │
│ │ equivalent option. Flip a coin mentally │
├────────────────────────┼──────────────────────────────────────────┤
│ Information deficit │ The tie exists because evaluation is │
│ (scores uncertain) │ incomplete. Invest one more specific │
│ │ investigation — a targeted file read, a │
│ │ quick test — then re-score │
├────────────────────────┼──────────────────────────────────────────┤
│ Oscillation │ Scoring keeps flip-flopping depending on │
│ (scores keep changing) │ which dimension gets attention. Time-box:│
│ │ set a timer, evaluate once more, commit │
│ │ to the result regardless │
├────────────────────────┼──────────────────────────────────────────┤
│ Approach merge │ The best parts of A and B can be │
│ (compatible strengths) │ combined. Check for compatibility. If │
│ │ merge is coherent, use it. If forced, │
│ │ don't — pick one │
└────────────────────────┴──────────────────────────────────────────┘
Esperado: Bloqueo resuelto a través del mecanismo apropiado. La resolución es decisiva — sin duda persistente que socave la ejecución.
En caso de fallo: Si el bloqueo persiste a través de todas las estrategias de resolución, la decisión puede ser prematura. Preguntar al usuario: "Veo dos enfoques igualmente fuertes: [A] y [B]. [Caso breve para cada uno.] ¿Cuál se alinea mejor con tus prioridades?" Delegar un empate genuino al usuario no es un fracaso — es reconocer que la decisión depende de valores que la IA no puede inferir.
Paso 5: Evaluar la Calidad de Coherencia
Después de comprometerse con una decisión, evaluar si el proceso produjo coherencia genuina o solo una decisión.
- ¿La decisión se basó en evidencia, o fue una validación superficial de una preferencia inicial?
- Prueba: ¿la preferencia era la misma antes y después de la evaluación? Si es así, ¿la evaluación cambió algo?
- ¿Los enfoques perdedores fueron genuinamente considerados, o fueron argumentos de paja?
- Prueba: ¿puedes articular el caso más fuerte para el enfoque perdedor?
- ¿Qué señal desencadenaría una reevaluación?
- Definir una observación específica que invalidaría la decisión ("Si descubro que la API no soporta X, entonces el enfoque B se vuelve mejor")
- ¿Hay información útil de los enfoques perdedores que debería informar la implementación?
- Un riesgo identificado en el enfoque B podría aplicarse también al enfoque A
Esperado: Una verificación breve de calidad que confirma la decisión o la identifica como débil. Si es débil, volver al paso anterior apropiado en lugar de proceder sobre terreno inestable.
En caso de fallo: Si la verificación de calidad revela que la decisión fue basada en preferencia en lugar de evidencia, reconocerlo honestamente. A veces la preferencia es todo lo que está disponible — pero debe etiquetarse como tal, no disfrazarse de análisis.
Validación
- Cada enfoque fue evaluado independientemente antes de la comparación
- La defensa fue proporcional a la calidad (no atención igual independientemente del mérito)
- Se realizó inspección cruzada (buscando contra-evidencia después de la defensa)
- El umbral de quórum se calibró al riesgo de la decisión
- Si hubo bloqueo, se aplicó una estrategia de resolución específica
- Se realizó verificación de calidad post-decisión
- Se definió un desencadenante de reevaluación
Errores Comunes
- Compromiso prematuro: Decidir antes de evaluar todos los enfoques. El primer enfoque considerado tiene una ventaja de anclaje — recibe más atención mental simplemente por ser primero. Evaluar todos antes de comparar
- Defensa igual para enfoques desiguales: Si el enfoque A obtuvo 85 y el enfoque B obtuvo 45, dedicar tiempo igual a defender ambos desperdicia esfuerzo y crea falsa equivalencia
- Validación superficial: Pasar por el proceso de evaluación para justificar una decisión ya tomada. La prueba es si la evaluación podría haber cambiado el resultado. Si no, el proceso fue teatro
- Evasión de umbral: Bajar el umbral de confianza para facilitar la decisión en lugar de recopilar la información necesaria para alcanzar el umbral apropiado
- Ignorar el lado perdedor: El enfoque perdedor a menudo contiene advertencias que aplican al ganador. Los riesgos identificados en el enfoque B no desaparecen solo porque se eligió el enfoque A
Habilidades Relacionadas
build-consensus— el modelo de consenso multi-agente que esta habilidad adapta al razonamiento de un solo agenteforage-solutions— explora el espacio de soluciones que la coherencia evalúa; típicamente precede a esta habilidadcoordinate-reasoning— gestiona el flujo de información durante la evaluación multi-caminocenter— establece la línea base equilibrada necesaria para la evaluación imparcialmeditate— limpia suposiciones entre la evaluación de diferentes enfoques
GitHub リポジトリ
関連スキル
content-collections
メタこのスキルは、Content Collections(Markdown/MDXファイルを型安全なデータコレクションに変換するTypeScriptファーストのツール)の本番環境でテストされた設定を提供します。Zodバリデーションによる型安全性を実現し、ブログ、ドキュメントサイト、コンテンツ重視のVite + Reactアプリケーション構築時にご利用ください。Viteプラグインの設定、MDXコンパイルから、デプロイ最適化、スキーマバリデーションまで、すべてを網羅しています。
polymarket
メタこのスキルは、開発者がPolymarket予測市場プラットフォームを活用したアプリケーション構築を可能にします。API統合による取引や市場データの取得に加え、WebSocketを介したリアルタイムデータストリーミングにより、ライブ取引や市場活動を監視できます。取引戦略の実装や、ライブ市場更新を処理するツールの作成にご利用ください。
creating-opencode-plugins
メタこのスキルは、開発者がコマンド、ファイル、LSP操作など25種類以上のイベントタイプにフックするOpenCodeプラグインを作成することを支援します。JavaScript/TypeScriptモジュール向けに、プラグイン構造、イベントAPI仕様、および実装パターンを提供します。カスタムイベント駆動ロジックでOpenCode AIアシスタントのライフサイクルをインターセプト、監視、または拡張する必要がある場合にご利用ください。
sglang
メタSGLangは、高性能なLLMサービングフレームワークであり、RadixAttentionプレフィックスキャッシュを活用したJSON、正規表現、エージェントワークフロー向けの高速で構造化された生成を特長とします。特にプレフィックスが繰り返されるタスクにおいて、大幅に高速な推論を実現し、複雑な構造化出力やマルチターン対話に最適です。制約付きデコードが必要な場合や、広範なプレフィックス共有を伴うアプリケーションを構築する場合は、vLLMなどの代替案ではなくSGLangを選択してください。
