Zurück zu Fähigkeiten

simulation-failure-triage

HeshamFS
Aktualisiert 2 days ago
6 Ansichten
40
3
40
Auf GitHub ansehen
Entwicklungai

Über

Diese Fähigkeit unterstützt Entwickler bei der Priorisierung fehlgeschlagener Materialsimulationen, indem sie häufige Probleme wie Nicht-Konvergenz, NaN/Inf-Fehler und instabile Zeitschritte diagnostiziert. Sie schlägt sichere, vertretbare Wiederholungsstufen und sofortige Maßnahmen zur Wiederherstellung vor. Nutzen Sie sie, wenn Sie auf eine verdächtige oder fehlgeschlagene Simulation stoßen und eine strukturierte Erstmaßnahme benötigen.

Schnellinstallation

Claude Code

Empfohlen
Primär
npx skills add HeshamFS/materials-simulation-skills -a claude-code
Plugin-BefehlAlternativ
/plugin add https://github.com/HeshamFS/materials-simulation-skills
Git CloneAlternativ
git clone https://github.com/HeshamFS/materials-simulation-skills.git ~/.claude/skills/simulation-failure-triage

Kopieren Sie diesen Befehl und fügen Sie ihn in Claude Code ein, um diese Fähigkeit zu installieren

Dokumentation

Simulation Failure Triage

Goal

Classify common simulation failure signatures and return immediate actions, retry ladders, and stop conditions.

Requirements

  • Python 3.10+
  • No external dependencies
  • Works on Linux, macOS, and Windows

Inputs to Gather

InputDescriptionExample
CodeSimulation codeLAMMPS, VASP, MOOSE, QE
StageSetup, runtime, postprocessruntime
SymptomsFailure signsnan,pressure-blowup
Log text or fileError evidenceLost atoms, ZBRENT
Recent changeLast modified settinglarger timestep

Decision Guidance

  • First preserve evidence: logs, inputs, executable version, and scheduler output.
  • Separate setup errors from numerical instability and physical model issues.
  • Retry with a single controlled change.
  • Stop retrying when the result becomes scientifically meaningless or a required model input is missing.

Script Outputs

scripts/failure_triage.py emits:

  • likely_causes
  • immediate_actions
  • retry_ladder
  • stop_conditions
  • evidence

Workflow

python3 skills/robustness/simulation-failure-triage/scripts/failure_triage.py \
  --code LAMMPS \
  --stage runtime \
  --symptoms nan,pressure-blowup \
  --recent-change "increased timestep" \
  --json

Error Handling

Invalid stages or oversized log files stop with exit code 2. Unknown symptoms are retained as custom evidence.

Limitations

This skill gives first-response triage. It does not guarantee that a failed simulation can be repaired.

Security

  • Log files are read with a 10 MB size cap.
  • Log text is truncated and never executed.
  • The script does not run external solvers.
  • The skill uses Bash only to run its bundled script.

References

  • See references/failure_patterns.md for common failure signatures and retry ladders.

Version History

  • 1.0.0: Initial cross-code simulation failure triage skill.

GitHub Repository

HeshamFS/materials-simulation-skills
Pfad: skills/robustness/simulation-failure-triage
0
agent-skillsagentscli-toolscomputational-sciencellmmaterials-science

Verwandte Skills

qmd

Entwicklung

qmd ist ein lokales Such- und Indexierungs-CLI-Tool, das Entwicklern ermöglicht, lokale Dateien mittels Hybridsuche zu indexieren und zu durchsuchen, die BM25, Vektoreinbettungen und Neuordnung kombiniert. Es unterstützt sowohl die Kommandozeilennutzung als auch den MCP-Modus (Model Context Protocol) zur Integration mit Claude. Das Tool verwendet Ollama für Einbettungen und speichert Indizes lokal, was es ideal für die direkte Suche in Dokumentationen oder Codebasen vom Terminal aus macht.

Skill ansehen

subagent-driven-development

Entwicklung

Diese Fähigkeit führt Implementierungspläne aus, indem für jede unabhängige Aufgabe ein neuer Subagent bereitgestellt wird, mit Code-Review zwischen den Aufgaben. Sie ermöglicht schnelle Iterationen, während Qualitätssicherungsschritte durch diesen Review-Prozess gewahrt bleiben. Nutzen Sie sie, wenn Sie überwiegend unabhängige Aufgaben innerhalb derselben Sitzung bearbeiten, um kontinuierlichen Fortschritt mit integrierten Qualitätsprüfungen zu gewährleisten.

Skill ansehen

mcporter

Entwicklung

Die mcporter-Skill ermöglicht es Entwicklern, Model Context Protocol (MCP)-Server direkt aus Claude heraus zu verwalten und aufzurufen. Sie bietet Befehle, um verfügbare Server aufzulisten, deren Tools mit Argumenten aufzurufen sowie Authentifizierung und Daemon-Lebenszyklus zu handhaben. Nutzen Sie diese Skill, um MCP-Server-Funktionalität in Ihren Entwicklungs-Workflow zu integrieren und zu testen.

Skill ansehen

adk-deployment-specialist

Entwicklung

Diese Fähigkeit stellt Vertex AI ADK-Agenten über das A2A-Protokoll bereit und orchestriert sie, verwaltet die AgentCard-Erkennung, Aufgabenübermittlung und unterstützende Tools wie die Code Execution Sandbox und Memory Bank. Sie ermöglicht den Aufbau von Multi-Agenten-Systemen mit sequenziellen, parallelen oder Schleifen-Orchestrierungsmustern in Python, Java oder Go. Verwenden Sie sie, wenn Sie aufgefordert werden, ADK-Agenten bereitzustellen oder Agenten-Workflows auf Google Cloud zu orchestrieren.

Skill ansehen