SKILL·1CF82E

forage-solutions

Name: forage-solutions
Author: pjt222

pjt222

Mis à jour 1 month ago

9 vues

Testsaidesign

À propos

Cette compétence utilise l'optimisation par colonie de fourmis pour explorer plusieurs chemins de solution en parallèle, renforçant les approches prometteuses tout en sachant quand abandonner les impasses. Elle est idéale pour déboguer des problèmes complexes sans cause racine évidente ou lorsque les solutions initiales sont sous-optimales. Les développeurs doivent l'utiliser pour tester systématiquement des hypothèses concurrentes et éviter une convergence prématurée sur une solution faible.

Installation rapide

Claude Code

Recommandé

Principal

npx skills add pjt222/agent-almanac -a claude-code

Commande PluginAlternatif

/plugin add https://github.com/pjt222/agent-almanac

Git CloneAlternatif

git clone https://github.com/pjt222/agent-almanac.git ~/.claude/skills/forage-solutions

Copiez et collez cette commande dans Claude Code pour installer cette compétence

Documentation

Forage Solutions

Explore solution space via ant colony opt — deploy indep hypotheses as scouts, reinforce promising via evidence, detect diminishing returns, know when abandon strategy + explore elsewhere.

Use When

Problem w/ multiple plausible approaches, no clear winner
First approach not working but alts unclear
Debug w/ no obvious root cause — multiple hypotheses need parallel
Search codebase for behavior source, location unknown
Previous attempts converged prematurely suboptimal
Complement build-coherence when space must be explored before decision

In

Required: Problem/goal (what foraging for?)
Required: Current knowledge state (what already known?)
Optional: Previous approaches + outcomes
Optional: Exploration constraints (time, tool availability)
Optional: Urgency (affects explore-exploit balance)

Do

Step 1: Map Landscape

Before deploying, characterize shape.

Solution Distribution Types:
┌────────────────────┬──────────────────────────────────────────────────┐
│ Type               │ Characteristics and Strategy                     │
├────────────────────┼──────────────────────────────────────────────────┤
│ Concentrated       │ One correct answer exists (bug fix, syntax       │
│ (one right fix)    │ error). Deploy many scouts quickly to locate     │
│                    │ it. Exploit immediately when found               │
├────────────────────┼──────────────────────────────────────────────────┤
│ Distributed        │ Multiple valid approaches (architecture choice,  │
│ (many valid paths) │ implementation strategy). Scouts assess quality  │
│                    │ of each. Use `build-coherence` to choose         │
├────────────────────┼──────────────────────────────────────────────────┤
│ Ephemeral          │ Solutions depend on timing or sequence (race     │
│ (time-sensitive)   │ conditions, order-dependent bugs). Fast scouting │
│                    │ with immediate exploitation. Cannot revisit       │
├────────────────────┼──────────────────────────────────────────────────┤
│ Nested             │ Solving the surface problem reveals a deeper one │
│ (layers of cause)  │ (config issue masking an architecture problem).  │
│                    │ Scout at each layer before committing to depth   │
└────────────────────┴──────────────────────────────────────────────────┘

Classify. Distribution type → how many scouts + how fast switch exploration → exploitation.

→ Clear characterization informs scouting. Feels accurate not forced.

If err: completely unknown → itself = classification. Treat as potentially distributed + deploy broad scouts. First round reveals character.

Step 2: Deploy Scout Hypotheses

Gen indep hypotheses as scouts. Each probes diff direction.

Gen 3-5 indep hypotheses about problem/solution
Each → 1 cheap test (single file read, 1 grep, 1 check)
Rate initial promise on evidence (not gut)
Deploy indep: no let A influence test of B

Scout Deployment Template:
┌───────┬──────────────────────┬──────────────────────┬──────────┐
│ Scout │ Hypothesis           │ Test (one action)    │ Promise  │
├───────┼──────────────────────┼──────────────────────┼──────────┤
│ 1     │                      │                      │ High/Med/│
│ 2     │                      │                      │ Low      │
│ 3     │                      │                      │          │
│ 4     │                      │                      │          │
│ 5     │                      │                      │          │
└───────┴──────────────────────┴──────────────────────┴──────────┘

Key: scouts assess not exploit. Quick signal each, not deep investigation first promising.

→ 3-5 indep hypotheses + cheap tests. None deeply explored yet — breadth-first pass.

If err: <3 hypotheses → (a) very constrained (concentrated — good, scout aggressive) or (b) understanding too shallow (read more context). Hypotheses not indep (variations same) → too narrow, force ≥1 contradicting others.

Step 3: Trail Reinforcement — Follow Evidence

After scout results, reinforce promising, let weak decay.

Review results: which found supporting evidence?
Strong evidence → reinforce: invest more investigation
No evidence → decay: don't investigate w/o new signals
Contradicting → inhibition: actively avoid
Monitor premature convergence: all effort to first reinforced → force 1 scout into unexplored

Trail Reinforcement Decision:
┌───────────────────────────┬──────────────────────────────────────┐
│ Scout Result              │ Action                               │
├───────────────────────────┼──────────────────────────────────────┤
│ Strong supporting evidence│ REINFORCE — deepen investigation     │
│ Weak supporting evidence  │ HOLD — one more cheap test before    │
│                           │ committing                           │
│ No evidence               │ DECAY — deprioritize, scout elsewhere│
│ Contradicting evidence    │ INHIBIT — mark as dead end           │
│ Ambiguous result          │ REFINE — hypothesis was too vague,   │
│                           │ sharpen and re-scout                 │
└───────────────────────────┴──────────────────────────────────────┘

→ Clear prioritization on evidence not preference. Strongest gets most but ≥1 alt alive.

If err: all empty → hypotheses wrong, not approach. Reframe: "What assumptions could be wrong?" Gen new from diff angle. All strong → distributed (multiple valid) → build-coherence for selection.

Step 4: Marginal Value Theorem — Know When Leave

Monitor yield. Info per effort drops below avg across all → switch.

Marginal Value Assessment:
┌────────────────────────┬──────────────────────────────────────────┐
│ Signal                 │ Action                                   │
├────────────────────────┼──────────────────────────────────────────┤
│ New information per    │ CONTINUE — this trail is productive      │
│ action is high         │                                          │
├────────────────────────┼──────────────────────────────────────────┤
│ New information per    │ PREPARE TO SWITCH — squeeze remaining    │
│ action is declining    │ value, begin scouting alternatives       │
├────────────────────────┼──────────────────────────────────────────┤
│ Last 2-3 actions       │ SWITCH — the trail is depleted. The cost │
│ yielded nothing new    │ of staying exceeds the cost of switching │
├────────────────────────┼──────────────────────────────────────────┤
│ Information contradicts│ SWITCH IMMEDIATELY — not just depleted   │
│ earlier findings       │ but misleading. Cut losses               │
└────────────────────────┴──────────────────────────────────────────┘

Important: factor switching cost. Moving to new hypothesis = loading new context = cost. Don't switch marginal gains → only when clearly depleted.

→ Deliberate continue or switch on yield assessment, not habit/frustration. Switches evidence-based not impulse.

If err: switching too frequent (oscillation) → switching cost undervalued. Commit to current N more actions before reassess. Never switching (stuck despite declining) → hard cap: after N unproductive, switch regardless sunk cost.

Step 5: Adapt Strategy

Based on results → select next phase.

Most empty, one weak → misframed. Step back + reframe: what question?
One strong, others empty → concentrated. Exploit strong w/ full attention
Multiple competing → distributed. build-coherence to select
Clear winner emerging → explore → exploit. Reduce scouting budget 10-20% (keep 1 scout active alts), commit primary effort to winning
All exhausted → solution may not exist in current space. Expand: diff tools, diff assumptions, ask user

→ Strategic decision next phase follows logically from results. Feels like conclusion not guess.

If err: no strategy feels right → foraging revealed genuine uncertainty, valid outcome. Communicate to user: "Explored N, found X. Most promising Y because Z. Pursue or additional context?"

Check

Landscape characterized before scouting
≥3 indep hypotheses gen + tested
Tests cheap (1 action each) + indep
Reinforcement on evidence not preference
Marginal value assessed before deep investigation
Strategy adapted to results not fixed plan

Traps

Premature exploitation: Dive deep first showing any promise w/o scouting alts. Most common — first good idea often not best.
Perpetual scouting: Gen hypotheses endless never commit. Set budget: after N scouts, commit best regardless.
Non-indep hypotheses: "Maybe in file A" + "maybe in file B imported by A" = not indep, share assumptions. Force genuine diversity.
Ignore inhibition: Evidence contradicts → let go. Continue investing contradicted because effort spent = sunk cost fallacy.
Scout w/o record: Not recorded → later scouts repeat. Briefly note each scout finding before moving.

→

forage-resources — multi-agent foraging model this adapts to single-agent
build-coherence — foraging reveals multiple valid needing eval
coordinate-reasoning — manages info flow between scout hypotheses + exploitation
awareness — monitors premature convergence + tunnel vision during foraging

Dépôt GitHub

pjt222/agent-almanac

Chemin: i18n/caveman-ultra/skills/forage-solutions

agentsagentskillsai-assisted-developmentclaude-codeskillsteams

FAQ

Frequently asked questions

What is the forage-solutions skill?

forage-solutions is a Claude Skill by pjt222. Skills package instructions and resources that Claude loads on demand, so Claude can perform forage-solutions-related tasks without extra prompting.

How do I install forage-solutions?

Use the install commands on this page: add forage-solutions to Claude Code as a plugin, or clone its repository into your skills directory, then restart Claude so it picks up the skill.

What category does forage-solutions belong to?

forage-solutions is in the Testing category, tagged ai and design.

Is forage-solutions free to use?

Yes. forage-solutions is listed on AIMCP and free to install. It runs inside Claude, so no separate service account is required to use the skill itself.

Compétences associées

evaluating-llms-harness

Tests

Cette compétence Claude exécute le lm-evaluation-harness pour évaluer les modèles de langage sur plus de 60 tâches académiques standardisées telles que MMLU et GSM8K. Elle est conçue pour permettre aux développeurs de comparer la qualité des modèles, de suivre les progrès de l'entraînement ou de rapporter des résultats académiques. L'outil prend en charge différents backends, incluant les modèles HuggingFace et vLLM.

Voir la compétence

cloudflare-cron-triggers

Tests

Cette compétence fournit une connaissance complète pour la mise en œuvre de Déclencheurs Cron Cloudflare afin de planifier des Workers à l'aide d'expressions cron. Elle couvre la configuration de tâches périodiques, de travaux de maintenance et de flux de travail automatisés, tout en traitant des problèmes courants tels que les expressions cron non valides et les problèmes de fuseau horaire. Les développeurs peuvent l'utiliser pour configurer des gestionnaires planifiés, tester des déclencheurs cron et intégrer avec Workflows et Green Compute.

Voir la compétence

webapp-testing

Tests

Cette Compétence Claude fournit une boîte à outils basée sur Playwright pour tester des applications web locales via des scripts Python. Elle permet la vérification frontend, le débogage d'interface utilisateur, la capture d'écrans et la consultation des journaux, tout en gérant les cycles de vie du serveur. Utilisez-la pour les tâches d'automatisation de navigateur, mais exécutez les scripts directement plutôt que de lire leur code source pour éviter la pollution du contexte.

Voir la compétence

finishing-a-development-branch

Tests

Cette compétence aide les développeurs à finaliser leur travail en vérifiant que les tests passent, puis en présentant des options d'intégration structurées. Elle guide le processus de fusion, de création de PRs ou de nettoyage des branches une fois l'implémentation terminée. Utilisez-la lorsque votre code est prêt et testé pour finaliser systématiquement le cycle de développement.

Voir la compétence