unleash-the-agents
关于
This skill launches multiple AI agents in parallel waves to generate diverse hypotheses for complex, cross-domain problems where the solution path is unclear. It's ideal when traditional single-agent approaches stall or when broad exploration is needed over deep specialization. The output is a ranked set of hypotheses refined through convergence analysis and adversarial review.
快速安装
Claude Code
推荐npx skills add pjt222/agent-almanac -a claude-code/plugin add https://github.com/pjt222/agent-almanacgit clone https://github.com/pjt222/agent-almanac.git ~/.claude/skills/unleash-the-agents在 Claude Code 中复制并粘贴此命令以安装该技能
技能文档
Unleash the Agents
Consultar todos los agentes disponibles en olas paralelas para generar hipótesis diversas para problemas abiertos. Cada agente razona a través de su lente de dominio único — un kabalist encuentra patrones vía gematría, un martial-artist propone branching condicional, un contemplative nota la estructura sentándose con los datos. La convergencia entre perspectivas independientes es la señal primaria de que una hipótesis tiene mérito.
Cuándo Usar
- Enfrentar un problema cross-dominio donde el enfoque correcto es desconocido
- Un enfoque de un solo agente o un solo dominio se ha estancado o no ha producido señal
- El problema se beneficia de perspectivas genuinamente diversas (no solo más cómputo)
- Necesitas generación de hipótesis, no ejecución (usar equipos para ejecución)
- Decisiones de alto riesgo donde perder un ángulo no obvio carga costo real
Entradas
- Requerido: Brief del problema — descripción clara del problema, 5+ ejemplos concretos y qué cuenta como solución
- Requerido: Método de verificación — cómo probar si una hipótesis es correcta (prueba programática, revisión por experto o comparación con modelo nulo)
- Opcional: Subconjunto de agentes — agentes específicos a incluir o excluir (predeterminado: todos los agentes registrados)
- Opcional: Tamaño de ola — número de agentes por ola (predeterminado: 10)
- Opcional: Formato de salida — plantilla estructurada para respuestas de agente (predeterminado: hipótesis + razonamiento + confianza + predicción comprobable)
Procedimiento
Paso 1: Preparar el Brief
Escribir un brief de problema que cualquier agente pueda entender independientemente de la experticia de dominio. Incluir:
- Declaración del problema: Lo que estás tratando de descubrir o decidir (1-2 oraciones)
- Ejemplos: Al menos 5 ejemplos concretos de input/output o puntos de datos (más es mejor — 3 es muy pocos para que la mayoría de los agentes encuentre patrones)
- Restricciones conocidas: Lo que ya sabes, lo que ya se ha intentado
- Criterios de éxito: Cómo reconocer una hipótesis correcta
- Plantilla de salida: El formato exacto que quieres en las respuestas
## Brief: [Problem Title]
**Problem**: [1-2 sentence statement]
**Examples**:
1. [Input] → [Output] (explain what's known)
2. [Input] → [Output]
3. [Input] → [Output]
4. [Input] → [Output]
5. [Input] → [Output]
**Already tried**: [List failed approaches to avoid rediscovery]
**Success looks like**: [Testable criterion]
**Respond with**:
- Hypothesis: [Your proposed mechanism in one sentence]
- Reasoning: [Why your domain expertise suggests this]
- Confidence: [low/medium/high]
- Testable prediction: [If my hypothesis is correct, then X should be true]
Esperado: Un brief que es self-contained — un agente recibiendo solo este texto tiene todo lo necesario para razonar sobre el problema.
En caso de fallo: Si no puedes articular 5 ejemplos o un método de verificación, el problema no está listo para consulta multi-agente. Estrechar el alcance primero.
Paso 2: Planificar las Olas
Listar todos los agentes disponibles y dividirlos en olas de ~10. El orden no importa para las primeras 2 olas; para olas subsiguientes, la inyección de conocimiento entre olas mejora los resultados.
# List all agents from registry
grep ' - id: ' agents/_registry.yml | sed 's/.*- id: //' | shuf
Asignar agentes a olas. Planificar 4 olas inicialmente — puede que no necesites todas (ver early stopping en el Paso 4).
| Ola | Agentes | Variante de brief |
|---|---|---|
| 1-2 | 20 agentes | Brief estándar |
| 3 | 10 agentes + advocatus-diaboli | Brief + consenso emergente + desafío adversarial |
| 4+ | 10 agentes cada una | Brief + "X está confirmado. Enfocarse en casos límite y fallos." |
Esperado: Una tabla de asignación de olas con todos los agentes asignados. Incluir advocatus-diaboli en la Ola 3 (no después) para que el pase adversarial informe a las olas subsiguientes.
En caso de fallo: Si menos de 20 agentes están disponibles, reducir a 2-3 olas. El patrón aún funciona con tan pocos como 10 agentes, aunque las señales de convergencia son más débiles.
Paso 3: Lanzar Olas
Lanzar cada ola como agentes paralelos. Usar el modelo sonnet para eficiencia de costo (el valor viene de la diversidad de perspectivas, no de la profundidad individual).
Opción A: TeamCreate (recomendado para unleash completo)
Usar la herramienta TeamCreate de Claude Code para configurar un equipo coordinado con rastreo de tareas. TeamCreate es una herramienta diferida — primero hacer fetch vía ToolSearch("select:TeamCreate").
- Crear el equipo:
TeamCreate({ team_name: "unleash-wave-1", description: "Wave 1: open-ended hypothesis generation" }) - Crear una tarea por agente usando
TaskCreatecon el brief y encuadre específico de dominio - Generar cada agente como teammate usando la herramienta
Agentconteam_name: "unleash-wave-1"ysubagent_typeestablecido al tipo del agente (p. ej.,kabalist,geometrist) - Asignar tareas a teammates vía
TaskUpdateconowner - Monitorear el progreso vía
TaskList— los teammates marcan tareas como completadas conforme terminan - Entre olas, apagar el equipo actual vía
SendMessage({ type: "shutdown_request" })y crear el siguiente equipo con el brief actualizado (Paso 4)
Esto te da coordinación built-in: una lista de tareas compartida rastrea qué agentes han respondido, los teammates pueden ser mensajeados para seguimiento, y el lead gestiona transiciones de ola a través de la asignación de tareas.
Opción B: Spawning crudo de Agent (más simple, para ejecuciones más pequeñas)
Para cada agente en la ola, generarlo con el brief y un encuadre específico de dominio:
Use the [agent-name] agent to analyze this problem through your domain expertise.
[Paste the brief]
Think about this from your specific perspective as a [agent-description].
[For non-technical agents: add a domain-specific framing, e.g., "What patterns
does your tradition recognize in systems that exhibit this kind of threshold behavior?"]
Respond exactly in the requested format.
Lanzar todos los agentes en una ola simultáneamente usando la herramienta Agent con run_in_background: true. Esperar que la ola se complete antes de lanzar la siguiente ola (para habilitar la inyección de conocimiento entre olas en el Paso 4).
Eligiendo entre opciones
| TeamCreate | Raw Agent | |
|---|---|---|
| Mejor para | Tier 3 unleash completo (40+ agentes) | Tier 2 panel (5-10 agentes) |
| Coordinación | Lista de tareas, mensajería, propiedad | Disparar-y-olvidar, recolección manual |
| Handoff entre olas | El estado de tareas se traslada | Debe rastrearse manualmente |
| Sobrecarga | Mayor (configuración de equipo por ola) | Menor (una sola llamada de herramienta por agente) |
Esperado: Cada ola retorna ~10 respuestas estructuradas dentro de 2-5 minutos. Los agentes que fallan en responder o retornan salida fuera de formato son anotados pero no bloquean el pipeline.
En caso de fallo: Si más del 50% de una ola falla, verificar la claridad del brief. Causa común: la plantilla de salida es ambigua, o los ejemplos son insuficientes para que agentes no-de-dominio razonen sobre.
Paso 4: Inyectar Conocimiento Entre Olas (y Evaluar Early Stopping)
Después de las olas 1-2, extraer la señal emergente antes de lanzar la siguiente ola.
- Escanear respuestas de olas completadas por temas recurrentes
- Identificar la familia de hipótesis más común (la señal de convergencia)
- Verificar el umbral de early stopping: si la familia top ya excede 3x la expectativa del modelo nulo después de 20 agentes, tienes señal fuerte. Planificar la Ola 3 como una ola adversarial + refinamiento y considerar detenerse después de ella
- Actualizar el brief para la siguiente ola:
**Update from prior waves**: [N] agents independently proposed [hypothesis family].
Build on this — what explains the remaining cases where this hypothesis fails?
Do NOT simply restate this finding. Extend, challenge, or refine it.
Guía de early stopping: No todo unleash necesita todos los agentes. Para dominios de problema bien definidos (p. ej., análisis de base de código), la convergencia a menudo se estabiliza en 30-40 agentes. Para problemas abstractos o abiertos (p. ej., transformaciones matemáticas desconocidas), el roster completo añade valor porque el dominio correcto es genuinamente impredecible. Verificar la convergencia después de cada ola — si el conteo de la familia top y el ratio del modelo nulo se han estabilizado, las olas adicionales producen retornos decrecientes.
Esto previene el redescubrimiento (donde olas posteriores re-derivan independientemente lo que olas anteriores ya encontraron) y dirige a los agentes posteriores hacia los bordes del problema.
Esperado: Las olas posteriores producen hipótesis más matizadas y dirigidas que abordan brechas en el consenso emergente.
En caso de fallo: Si no aparece convergencia después de 2 olas, el problema puede ser demasiado no restringido. Considerar estrechar el alcance o proveer más ejemplos.
Paso 5: Recolectar y Deduplicar
Después de que todas las olas se completen, reunir todas las respuestas en un único documento. Deduplicar agrupando hipótesis en familias:
- Extraer todas las declaraciones de hipótesis
- Agrupar por mecanismo (no por redacción — "modular arithmetic mod 94" y "cyclic group over Z_94" son la misma familia)
- Contar descubrimientos independientes por familia
- Clasificar por convergencia: las familias descubiertas por más agentes independientemente clasifican más alto
Esperado: Una lista clasificada de familias de hipótesis con conteos de convergencia, agentes contribuyentes y predicciones comprobables representativas.
En caso de fallo: Si cada hipótesis es única (sin convergencia), la relación señal-a-ruido es muy baja. O el problema necesita más ejemplos, o los agentes necesitan un formato de salida más ajustado.
Paso 6: Verificar Contra Modelo Nulo
Probar la hipótesis top contra un modelo nulo para asegurar que la convergencia es significativa, no un artefacto de datos de entrenamiento compartidos.
- Verificación programática: Si la hipótesis produce una fórmula o algoritmo comprobable, ejecutarla contra ejemplos reservados
- Modelo nulo: Estimar la probabilidad de que N agentes converjan en la misma familia de hipótesis por azar (p. ej., si hay K familias de hipótesis razonables, la probabilidad de convergencia aleatoria es ~N/K)
- Umbral: La señal es significativa si la convergencia excede 3x la expectativa del modelo nulo
Esperado: La familia de hipótesis top significativamente excede la convergencia a nivel de azar y/o pasa la verificación programática.
En caso de fallo: Si la hipótesis top falla la verificación, verificar la familia clasificada en segundo lugar. Si ninguna familia pasa, el problema puede requerir un enfoque diferente (análisis más profundo de un solo experto, más datos o ejemplos reformulados).
Paso 7: Refinamiento Adversarial
Tiempo preferido: Ola 3, no post-síntesis. Incluir advocatus-diaboli en la Ola 3 (junto con la inyección de conocimiento entre olas) es más efectivo que un pase adversarial standalone después de que todas las olas se completen. El desafío temprano deja a las Olas 4+ refinar contra la crítica en lugar de apilarse sobre un consenso no desafiado.
Si el pase adversarial ya fue parte de la Ola 3, este paso se vuelve una verificación final. Si no (p. ej., ejecutaste todas las olas sin él), generar advocatus-diaboli (o senior-researcher) ahora. Para un pase estructurado, usar TeamCreate para levantar un equipo de revisión con ambos agentes trabajando en paralelo contra el consenso:
Here is the consensus hypothesis from [N] independent agents:
[Hypothesis]
[Supporting evidence and convergence stats]
Your job: find the strongest counterarguments. Where does this fail?
What alternative explanations are equally consistent with the evidence?
What experiment would definitively falsify this hypothesis?
Esperado: Un conjunto de contraargumentos, casos límite y un experimento de falsificación. Si la hipótesis sobrevive el escrutinio adversarial, está lista para integración. Un buen pase adversarial a veces defiende parcialmente el consenso — encontrando que el diseño es mejor que las alternativas incluso si imperfecto.
En caso de fallo: Si el agente adversarial encuentra una falla fatal, alimentar la crítica de vuelta en una ola de seguimiento dirigida (Tier 3+ modo iterativo — seleccionar 5-10 agentes mejor posicionados para abordar la crítica específica).
Paso 8: Entregar a Equipos
Unleash encuentra problemas; los equipos los resuelven. Convertir las familias de hipótesis verificadas en issues accionables, luego ensamblar equipos enfocados para resolver cada uno.
- Crear un issue de GitHub por familia de hipótesis verificada (usar la habilidad
create-github-issues) - Priorizar issues por fuerza de convergencia e impacto
- Para cada issue, ensamblar un equipo pequeño vía
TeamCreate:- Si una definición de equipo predefinida en
teams/coincide con el dominio del problema, usarla - Si no existe ningún equipo apropiado, predeterminar a
opaque-team(N shapeshifters con asignación adaptiva de rol) — maneja formas de problema desconocidas sin requerir una composición personalizada - Incluir al menos un agente no-técnico (p. ej.,
advocatus-diaboli,contemplative) — atrapan riesgos de implementación que los agentes técnicos pierden - Usar checkpoints REST entre fases para prevenir apresurarse
- Si una definición de equipo predefinida en
- El pipeline es: unleash → triage → team-per-issue → resolve
Esperado: Cada familia de hipótesis mapea a un issue rastreado con un equipo asignado. El unleash produjo el diagnóstico; los equipos producen el fix.
En caso de fallo: Si la composición del equipo no coincide con el problema, reasignar. Los agentes shapeshifter pueden investigar y diseñar pero carecen de herramientas de escritura — el lead del equipo debe aplicar sus sugerencias de código.
Validación
- Todos los agentes disponibles fueron consultados (o un subconjunto deliberado fue elegido con justificación)
- Las respuestas fueron recolectadas en un formato estructurado y parseable
- Las hipótesis fueron deduplicadas y clasificadas por convergencia independiente
- La hipótesis top fue verificada contra un modelo nulo o prueba programática
- Un pase adversarial desafió el consenso
- La hipótesis final incluye predicciones comprobables y limitaciones conocidas
Errores Comunes
- Demasiado pocos ejemplos en el brief: Los agentes necesitan 5+ ejemplos para encontrar patrones. Con 3 ejemplos, la mayoría de los agentes recurren a coincidencia de patrones de nivel superficial o eco de plantilla (repetir el brief con palabras diferentes).
- Sin camino de verificación: Sin una manera de probar hipótesis, no puedes distinguir señal de ruido. La convergencia sola es necesaria pero no suficiente.
- Respuestas metafóricas: Los agentes especialistas de dominio (mystic, shaman, kabalist) pueden responder con razonamiento metafórico rico que es difícil de parsear programáticamente. Incluir "Expresa tu hipótesis como una fórmula o algoritmo comprobable" en la plantilla de salida.
- Redescubrimiento entre olas: Sin inyección de conocimiento entre olas, las olas 3-7 redescubren independientemente lo que las olas 1-2 ya encontraron. Siempre actualizar el brief entre olas.
- Sobre-interpretar la convergencia: 43% de convergencia en una familia de mecanismo suena impresionante, pero verificar la tasa base. Si solo hay 3 familias plausibles de mecanismo, la convergencia aleatoria sería ~33%.
- Esperar dominancia de una sola familia: Los problemas abstractos (reconocimiento de patrones, criptografía) tienden a producir una familia dominante de hipótesis. Los problemas multi-dimensionales (análisis de base de código, diseño de sistema) producen convergencia más amplia entre múltiples familias válidas — esto es esperado y saludable, no un fallo del patrón.
- Encuadre genérico para agentes no-técnicos: La calidad de la contribución de un agente no-técnico depende de cómo el brief encuadra el problema en su lenguaje de dominio. "¿Qué dice tu tradición sobre sistemas en este umbral?" produce perspectiva estructural; un brief genérico no produce nada. Invertir en encuadre específico de dominio para agentes fuera del dominio natural del problema.
- Usar esto para ejecución: Este patrón genera hipótesis, no implementaciones. Una vez que tienes hipótesis verificadas, convertirlas a issues y entregar a equipos (Paso 8). El pipeline es unleash → triage → team-per-issue.
Habilidades Relacionadas
forage-solutions— optimización de colonias de hormigas para explorar espacios de solución (complementaria: alcance más estrecho, exploración más profunda)build-coherence— democracia de abejas para seleccionar entre enfoques competidores (usar después de esta habilidad para elegir entre hipótesis top)coordinate-reasoning— coordinación estigmérgica para gestionar el flujo de información entre agentescoordinate-swarm— patrones más amplios de coordinación de enjambre para sistemas distribuidosexpand-awareness— percepción abierta antes de estrechar (complementaria: usar como preparación de agente individual)meditate— limpiar el ruido de contexto antes de lanzar (recomendado antes del Paso 1)
GitHub 仓库
相关推荐技能
content-collections
元Content Collections 是一个 TypeScript 优先的构建工具,可将本地 Markdown/MDX 文件转换为类型安全的数据集合。它专为构建博客、文档站和内容密集型 Vite+React 应用而设计,提供基于 Zod 的自动模式验证。该工具涵盖从 Vite 插件配置、MDX 编译到生产环境部署的完整工作流。
polymarket
元这个Claude Skill为开发者提供完整的Polymarket预测市场开发支持,涵盖API调用、交易执行和市场数据分析。关键特性包括实时WebSocket数据流,可监控实时交易、订单和市场动态。开发者可用它构建预测市场应用、实施交易策略并集成实时市场预测功能。
creating-opencode-plugins
元该Skill帮助开发者创建OpenCode插件,用于接入命令、文件、LSP等25+种事件。它提供了插件结构、事件API规范和JavaScript/TypeScript实现模式,适合需要拦截操作、扩展功能或自定义事件处理的场景。开发者可通过它快速构建响应式模块来增强OpenCode AI助手的能力。
sglang
元SGLang是一个专为LLM设计的高性能推理框架,特别适用于需要结构化输出的场景。它通过RadixAttention前缀缓存技术,在处理JSON、正则表达式、工具调用等具有重复前缀的复杂工作流时,能实现极速生成。如果你正在构建智能体或多轮对话系统,并追求远超vLLM的推理性能,SGLang是理想选择。
