SKILL·C054C4

simulation-failure-triage

Name: simulation-failure-triage
Author: HeshamFS

HeshamFS

Mis à jour 1 month ago

9 vues

Développementai

À propos

Cette compétence aide les développeurs à trier les simulations de matériaux échouées en diagnostiquant des problèmes courants tels que la non-convergence, les erreurs NaN/Inf et les pas de temps instables. Elle propose des échelles de reprise sûres et défendables ainsi que des actions immédiates pour la récupération. Utilisez-la lorsque vous rencontrez une simulation suspecte ou échouée et avez besoin d'une première réponse structurée.

Installation rapide

Claude Code

Recommandé

Principal

npx skills add HeshamFS/materials-simulation-skills -a claude-code

Commande PluginAlternatif

/plugin add https://github.com/HeshamFS/materials-simulation-skills

Git CloneAlternatif

git clone https://github.com/HeshamFS/materials-simulation-skills.git ~/.claude/skills/simulation-failure-triage

Copiez et collez cette commande dans Claude Code pour installer cette compétence

Documentation

Simulation Failure Triage

Goal

Classify common simulation failure signatures and return immediate actions, retry ladders, and stop conditions.

Requirements

Python 3.10+
No external dependencies
Works on Linux, macOS, and Windows

Inputs to Gather

Input	Description	Example
Code	Simulation code	`LAMMPS`, `VASP`, `MOOSE`, `QE`
Stage	Setup, runtime, postprocess	`runtime`
Symptoms	Failure signs	`nan,pressure-blowup`
Log text or file	Error evidence	`Lost atoms`, `ZBRENT`
Recent change	Last modified setting	`larger timestep`

Decision Guidance

First preserve evidence: logs, inputs, executable version, and scheduler output.
Separate setup errors from numerical instability and physical model issues.
Retry with a single controlled change.
Stop retrying when the result becomes scientifically meaningless or a required model input is missing.

Script Outputs

scripts/failure_triage.py emits:

likely_causes
immediate_actions
retry_ladder
stop_conditions
evidence

Workflow

python3 skills/robustness/simulation-failure-triage/scripts/failure_triage.py \
  --code LAMMPS \
  --stage runtime \
  --symptoms nan,pressure-blowup \
  --recent-change "increased timestep" \
  --json

Error Handling

Invalid stages or oversized log files stop with exit code 2. Unknown symptoms are retained as custom evidence.

Limitations

This skill gives first-response triage. It does not guarantee that a failed simulation can be repaired.

Security

Log files are read with a 10 MB size cap.
Log text is truncated and never executed.
The script does not run external solvers.
The skill uses Bash only to run its bundled script.

References

See references/failure_patterns.md for common failure signatures and retry ladders.

Version History

1.0.0: Initial cross-code simulation failure triage skill.

Dépôt GitHub

HeshamFS/materials-simulation-skills

Chemin: skills/robustness/simulation-failure-triage

agent-skillsagentscli-toolscomputational-sciencellmmaterials-science

FAQ

Frequently asked questions

What is the simulation-failure-triage skill?

simulation-failure-triage is a Claude Skill by HeshamFS. Skills package instructions and resources that Claude loads on demand, so Claude can perform simulation-failure-triage-related tasks without extra prompting.

How do I install simulation-failure-triage?

Use the install commands on this page: add simulation-failure-triage to Claude Code as a plugin, or clone its repository into your skills directory, then restart Claude so it picks up the skill.

What category does simulation-failure-triage belong to?

simulation-failure-triage is in the Development category, tagged ai.

Is simulation-failure-triage free to use?

Yes. simulation-failure-triage is listed on AIMCP and free to install. It runs inside Claude, so no separate service account is required to use the skill itself.

Compétences associées

qmd

Développement

qmd est un outil CLI de recherche et d'indexation locale qui permet aux développeurs d'indexer et de rechercher dans des fichiers locaux en utilisant une recherche hybride combinant BM25, des embeddings vectoriels et du reranking. Il prend en charge à la fois une utilisation en ligne de commande et un mode MCP (Model Context Protocol) pour l'intégration avec Claude. L'outil utilise Ollama pour les embeddings et stocke les index localement, ce qui le rend idéal pour rechercher dans de la documentation ou des bases de code directement depuis le terminal.

Voir la compétence

subagent-driven-development

Développement

Cette compétence exécute des plans de mise en œuvre en déployant un nouveau sous-agent pour chaque tâche indépendante, avec une revue de code entre les tâches. Elle permet une itération rapide tout en maintenant des contrôles de qualité grâce à ce processus de revue. Utilisez-la lorsque vous travaillez sur des tâches principalement indépendantes au sein d'une même session pour assurer une progression continue avec des vérifications de qualité intégrées.

Voir la compétence

mcporter

Développement

La compétence mcporter permet aux développeurs de gérer et d'appeler des serveurs Model Context Protocol (MCP) directement depuis Claude. Elle fournit des commandes pour lister les serveurs disponibles, appeler leurs outils avec des arguments, et gérer l'authentification ainsi que le cycle de vie du démon. Utilisez cette compétence pour intégrer et tester les fonctionnalités des serveurs MCP dans votre flux de travail de développement.

Voir la compétence

adk-deployment-specialist

Développement

Cette compétence déploie et orchestre des agents Vertex AI ADK en utilisant le protocole A2A, gérant la découverte d'AgentCard, la soumission de tâches, et prenant en charge des outils tels que le bac à sable d'exécution de code et la banque de mémoire. Elle permet de construire des systèmes multi-agents avec des modèles d'orchestration séquentiels, parallèles ou en boucle en Python, Java ou Go. Utilisez-la lorsqu'on vous demande de déployer des agents ADK ou d'orchestrer des flux de travail d'agents sur Google Cloud.

Voir la compétence