Back to Skills

simulate-stochastic-process

pjt222
Updated Yesterday
5 views
17
2
17
View on GitHub
Designdesign

About

This skill simulates stochastic processes like Markov Chains, Random Walks, and SDEs, including MCMC sampling with convergence diagnostics and visualization. Use it to generate sample paths for estimation or prediction when analytical solutions are intractable, or for Monte Carlo estimation with convergence guarantees. It's also designed for validating analytical results and sampling from complex posteriors.

Quick Install

Claude Code

Recommended
Primary
npx skills add pjt222/agent-almanac -a claude-code
Plugin CommandAlternative
/plugin add https://github.com/pjt222/agent-almanac
Git CloneAlternative
git clone https://github.com/pjt222/agent-almanac.git ~/.claude/skills/simulate-stochastic-process

Copy and paste this command in Claude Code to install this skill

Documentation

Stochastischen Prozess simulieren

Stichprobenpfade aus stochastischen Prozessen simulieren -- einschliesslich diskreter Markov-Ketten, zeitkontinuierlicher Prozesse, stochastischer Differentialgleichungen und MCMC-Sampler -- mit Konvergenzdiagnostik, Varianzreduktionstechniken und Trajektorienvisualisierung.

Wann verwenden

  • Erzeugung von Stichprobenpfaden aus einem stochastischen Prozess fuer Schaetzung, Vorhersage oder Visualisierung erforderlich
  • Analytische Loesungen sind nicht handhabbar und Simulation ist der einzige praktikable Ansatz
  • Monte-Carlo-Schaetzung mit Konvergenzgarantien und Unsicherheitsquantifizierung wird durchgefuehrt
  • Validierung analytischer Ergebnisse (stationaere Verteilungen, Treffzeiten) gegen empirische Simulation gewuenscht
  • Stichprobenziehung aus einer komplexen Posterior-Verteilung mittels MCMC erforderlich
  • Prototyping eines stochastischen Modells vor Uebergang zur vollstaendigen analytischen Behandlung

Eingaben

Erforderlich

EingabeTypBeschreibung
process_typestringArt des Prozesses: "dtmc", "ctmc", "random_walk", "brownian_motion", "sde", "mcmc"
parametersdictProzessspezifische Parameter (Uebergangsmatrix, Drift-/Diffusionskoeffizienten, Zieldichte, etc.)
n_pathsintegerAnzahl unabhaengiger zu simulierender Stichprobenpfade
n_stepsintegerAnzahl der Zeitschritte pro Pfad (oder Gesamt-MCMC-Iterationen)

Optional

EingabeTypStandardBeschreibung
initial_statescalar/vectorprozessspezifischStartzustand oder -verteilung fuer jeden Pfad
dtfloat0.01Zeitschrittgroesse fuer zeitkontinuierliche Diskretisierung
seedintegerzufaelligZufallsseed fuer Reproduzierbarkeit
burn_inintegern_steps / 10Anzahl anfaenglich zu verwerfender Schritte (MCMC)
thinninginteger1Jeden k-ten Sample behalten zur Autokorrelationsreduktion
variance_reductionstring"none"Methode: "none", "antithetic", "stratified", "control_variate"
target_functioncallablekeineFunktion zur Auswertung entlang der Pfade fuer Monte-Carlo-Schaetzung

Vorgehensweise

Schritt 1: Prozessmodell und Parameter definieren

1.1. Prozesstyp identifizieren und alle erforderlichen Parameter zusammenstellen:

  • DTMC: Uebergangsmatrix P und Zustandsraum. Validieren dass P zeilenstochastisch ist.
  • CTMC: Ratenmatrix Q. Validieren dass Zeilen sich zu 0 summieren und Nebendiagonaleintraege nicht-negativ sind.
  • Random Walk: Schrittverteilung (z.B. {-1, +1} mit gleicher Wahrscheinlichkeit), gegebenenfalls Grenzen.
  • Brownsche Bewegung: Drift mu, Volatilitaet sigma, Dimension d.
  • SDE (Ito): Driftfunktion a(x,t), Diffusionsfunktion b(x,t).
  • MCMC: Ziel-Log-Dichte, Vorschlagsmechanismus (Random-Walk-Metropolis, Hamilton, Gibbs-Komponenten).

1.2. Parameterkonsistenz validieren:

  • Matrixdimensionen stimmen mit Zustandsraumgroesse ueberein.
  • SDE-Koeffizienten erfuellen Wachstums- und Lipschitz-Bedingungen (zumindest informell) fuer den gewaehlten Loeser.
  • MCMC-Vorschlag ist wohldefiniert fuer den Traeger der Zielverteilung.

1.3. Zufallsseed fuer Reproduzierbarkeit setzen.

Erwartet: Ein vollstaendig spezifiziertes stochastisches Modell mit validierten Parametern und einem reproduzierbaren Zufallszustand.

Bei Fehler: Wenn Parameter inkonsistent sind (z.B. nicht-stochastische Matrix), vor dem Fortfahren korrigieren. Wenn SDE-Koeffizienten pathologisch sind, ein anderes Diskretisierungsschema in Betracht ziehen.

Schritt 2: Simulationsmethode auswaehlen

2.1. Den geeigneten Algorithmus basierend auf dem Prozesstyp waehlen:

ProzessMethodeSchluesseleigenschaft
DTMCDirekte Stichprobenziehung aus UebergangszeileExakt
CTMCGillespie-Algorithmus (SSA)Exakt, ereignisgesteuert
CTMC (approx.)Tau-LeapingApproximativ, schneller bei hohen Raten
Random WalkDirekte Stichprobenziehung der InkrementeExakt
Brownsche Bew.Kumulative Summe Gauss'scher InkrementeExakt fuer festes dt
SDE (allgemein)Euler-MaruyamaOrdnung 0.5 stark, Ordnung 1.0 schwach
SDE (hoehere Ord.)MilsteinOrdnung 1.0 stark (skalares Rauschen)
SDE (steif)Implizites Euler-MaruyamaStabil fuer steife Drift
MCMC (allgemein)Metropolis-HastingsAsymptotisch exakt
MCMC (Gradient)Hamiltonsches Monte Carlo (HMC)Besseres Mixing in hohen Dimensionen
MCMC (bedingt)Gibbs-SamplerExakte Bedingungsverteilungen wenn verfuegbar

2.2. Fuer SDE-Methoden dt klein genug fuer numerische Stabilitaet waehlen. Nuetzliche Heuristik: mit dt = 0.01 beginnen und halbieren bis Ergebnisse stabil sind.

2.3. Fuer MCMC die Vorschlagsskala anpassen um eine Akzeptanzrate von ungefaehr zu erreichen:

  • 23.4% fuer hochdimensionalen Random-Walk-Metropolis
  • 57.4% fuer eindimensionale Ziele
  • 65-90% fuer HMC (abhaengig von Trajektorienlaenge)

2.4. Wenn Varianzreduktion angefordert, diese konfigurieren:

  • Antithetische Variablen: Fuer jeden Pfad mit Zufallsinkrementen Z auch mit -Z simulieren.
  • Stratifizierte Stichprobe: Den Wahrscheinlichkeitsraum partitionieren und innerhalb jeder Schicht ziehen.
  • Kontrollvariablen: Eine korrelierte Groesse mit bekanntem Erwartungswert zur Varianzreduktion identifizieren.

Erwartet: Ein ausgewaehlter Simulationsalgorithmus passend zum Prozesstyp mit geeigneten Abstimmungsparametern.

Bei Fehler: Wenn die gewaehlte Methode instabil ist (z.B. Euler-Maruyama divergiert), zu einer impliziten Methode wechseln oder dt reduzieren.

Schritt 3: Simulation implementieren und ausfuehren

3.1. Speicher fuer n_paths Trajektorien zuweisen, jeweils der Laenge n_steps (oder dynamisch fuer ereignisgesteuerte Methoden wie Gillespie).

3.2. Fuer jeden Pfad i = 1, ..., n_paths:

DTMC / Random Walk:

  • x[0] = initial_state setzen
  • Fuer t = 1, ..., n_steps: x[t] aus der Uebergangsverteilung gegeben x[t-1] ziehen

CTMC (Gillespie):

  • x[0] = initial_state setzen, time = 0
  • Solange time < T_max:
    • Gesamtrate lambda = -Q[x, x] berechnen
    • Haltezeit tau ~ Exp(lambda) ziehen
    • Naechsten Zustand aus Uebergangswahrscheinlichkeiten Q[x, j] / lambda fuer j != x ziehen
    • time += tau aktualisieren, Uebergang aufzeichnen

SDE (Euler-Maruyama):

  • x[0] = initial_state setzen
  • Fuer t = 1, ..., n_steps:
    • dW = sqrt(dt) * N(0, I) (Wiener-Inkrement)
    • x[t] = x[t-1] + a(x[t-1], t*dt) * dt + b(x[t-1], t*dt) * dW

MCMC (Metropolis-Hastings):

  • x[0] = initial_state setzen
  • Fuer t = 1, ..., n_steps:
    • x' ~ q(x' | x[t-1]) vorschlagen
    • Akzeptanzverhaeltnis alpha = min(1, p(x') * q(x[t-1]|x') / (p(x[t-1]) * q(x'|x[t-1]))) berechnen
    • Mit Wahrscheinlichkeit alpha akzeptieren: x[t] = x' falls akzeptiert, sonst x[t] = x[t-1]
    • Akzeptanzentscheidung aufzeichnen

3.3. Wenn target_function angegeben, diese an jedem Zustand entlang jedes Pfades auswerten und Werte speichern.

3.4. Thinning anwenden: jeden thinning-ten Sample behalten.

3.5. burn_in Samples vom Beginn jedes Pfades verwerfen (hauptsaechlich fuer MCMC).

Erwartet: n_paths vollstaendige Trajektorien im Speicher, mit optionalen Funktionsauswertungen. MCMC-Akzeptanzrate liegt im Zielbereich.

Bei Fehler: Wenn die Simulation NaN- oder Inf-Werte erzeugt, dt fuer SDE-Methoden reduzieren oder Parametergueltigkeit pruefen. Wenn die MCMC-Akzeptanzrate nahe 0% oder 100% liegt, Vorschlagsskala anpassen.

Schritt 4: Konvergenzdiagnostik anwenden

4.1. Trace-Plots: Den Wert jeder Komponente ueber die Zeit fuer eine Teilmenge der Pfade darstellen. Visuelle Inspektion auf Stationaritaet (keine Trends, stabile Varianz).

4.2. Gelman-Rubin-Diagnostik (R-hat): Fuer MCMC mit mehreren Ketten:

  • Innerhalb-Ketten-Varianz W und Zwischen-Ketten-Varianz B berechnen.
  • R_hat = sqrt((n-1)/n + B/(n*W))
  • Konvergenz angezeigt durch R_hat < 1.01 (streng) oder R_hat < 1.1 (nachsichtig).

4.3. Effektive Stichprobengroesse (ESS):

  • Autokorrelation bei steigenden Lags schaetzen.
  • ESS = n_samples / (1 + 2 * sum(autocorrelations))
  • Faustregel: ESS > 400 fuer zuverlaessige Posterior-Zusammenfassungen.

4.4. Geweke-Diagnostik: Mittelwert der ersten 10% und der letzten 50% jeder Kette vergleichen. Der z-Score sollte innerhalb [-2, 2] fuer Konvergenz liegen.

4.5. Fuer Nicht-MCMC-Prozesse: Sicherstellen dass zeitgemittelte Statistiken (Mittelwert, Varianz) mit zunehmender Pfadlaenge stabilisieren. Laufende Durchschnitte darstellen.

4.6. Eine Zusammenfassungstabelle erstellen:

DiagnostikWertSchwellenwertStatus
R-hat (max)...< 1.01...
ESS (min)...> 400...
Geweke z (max abs)...< 2.0...
Akzeptanzrate...0.15-0.50...

Erwartet: Alle Konvergenzdiagnostiken bestehen ihre Schwellenwerte. Trace-Plots zeigen stabile, gut mischende Ketten.

Bei Fehler: Wenn R-hat > 1.1, laengere Ketten laufen lassen oder den Vorschlag verbessern. Wenn ESS sehr niedrig ist, Thinning erhoehen oder zu einem besseren Sampler wechseln (z.B. HMC). Wenn Geweke fehlschlaegt, Burn-in verlaengern.

Schritt 5: Zusammenfassungsstatistiken mit Konfidenzintervallen berechnen

5.1. Fuer jede Groesse von Interesse (Zustandsbelegung, Funktionserwartungswert, Treffzeiten):

  • Punktschaetzung als Stichprobenmittel ueber Pfade berechnen (nach Burn-in und Thinning).
  • Standardfehler mittels effektiver Stichprobengroesse berechnen: SE = SD / sqrt(ESS).

5.2. Konfidenzintervalle konstruieren:

  • Normalapproximation: Schaetzung +/- z_{alpha/2} * SE
  • Fuer schiefe Verteilungen Percentil-Bootstrap oder Batch-Mittel verwenden.

5.3. Wenn Varianzreduktion angewandt wurde, den Varianzreduktionsfaktor berechnen:

  • VRF = Var(naiver Schaetzer) / Var(reduzierter Schaetzer)
  • Die effektive Beschleunigung berichten.

5.4. Fuer Monte-Carlo-Integrationsschaetzungen:

  • Schaetzung, Standardfehler, 95%-KI, ESS und Anzahl der Funktionsauswertungen berichten.

5.5. Fuer Verteilungsschaetzungen:

  • Empirische Quantile berechnen (Median, 2.5te, 97.5te Perzentile).
  • Kerndichteschaetzungen fuer stetige Groessen.

5.6. Alle Zusammenfassungsstatistiken mit ihren Unsicherheiten tabellieren.

Erwartet: Punktschaetzungen mit zugehoerigen Standardfehlern und Konfidenzintervallen. Varianzreduktion (falls angewandt) ergibt VRF > 1.

Bei Fehler: Wenn Konfidenzintervalle zu breit sind, n_paths oder n_steps erhoehen. Wenn Varianzreduktion Schaetzungen verschlechtert (VRF < 1), deaktivieren -- die Kontrollvariable oder das antithetische Schema passt moeglicherweise nicht zum Problem.

Schritt 6: Trajektorien und Verteilungen visualisieren

6.1. Trajektorienplots: Eine repraesentative Teilmenge von Stichprobenpfaden (5-20 Pfade) ueber die Zeit darstellen. Transparenz fuer ueberlappende Pfade verwenden.

6.2. Ensemble-Statistiken: Die mittlere Trajektorie und punktweise 95%-Konfidenzbaender ueber alle Pfade ueberlagern.

6.3. Randverteilungen: An ausgewaehlten Zeitpunkten Histogramme oder Dichteschaetzungen der Zustandsverteilung ueber Pfade darstellen.

6.4. Vergleich mit stationaerer Verteilung: Wenn eine analytische stationaere Verteilung verfuegbar ist, diese dem empirischen Histogramm der letzten Zeitscheibe ueberlagern.

6.5. Autokorrelationsplots: Fuer MCMC die Autokorrelationsfunktion (ACF) fuer jede Komponente bis zu einem vernuenftigen Lag darstellen.

6.6. Diagnostik-Dashboard: Trace-Plots, ACF-Plots, laufende Mittelwert-Plots und Randdichten zu einer einzigen Mehrfach-Paneel-Abbildung fuer umfassende Bewertung kombinieren.

6.7. Alle Abbildungen sowohl in Vektor- (PDF/SVG) als auch in Rasterformaten (PNG) fuer die Dokumentation speichern.

Erwartet: Publikationsreife Abbildungen die Trajektorienverhalten, Verteilungskonvergenz und diagnostische Zusammenfassungen zeigen. Analytische Loesungen (wo verfuegbar) stimmen mit empirischen Ergebnissen ueberein.

Bei Fehler: Wenn Visualisierungen Nichtstationaritaet oder nicht erwartete Multimodalitaet aus dem Modell zeigen, Schritte 1-2 auf Parameter- oder Methodenfehler ueberpruefen. Wenn Plots ueberladen sind, Anzahl dargestellter Pfade reduzieren oder Abbildungsgroesse erhoehen.

Validierung

  • Alle simulierten Trajektorien bleiben im gueltigen Zustandsraum (keine Out-of-Bounds-Werte, kein NaN/Inf)
  • Fuer DTMC/CTMC: empirische stationaere Verteilung konvergiert zur analytischen (innerhalb erwarteten Monte-Carlo-Fehlers)
  • Fuer SDE: Halbierung von dt aendert Ergebnisse nicht qualitativ (Konvergenzordnungspruefung)
  • Fuer MCMC: R-hat < 1.01, ESS > 400, Geweke-z-Scores innerhalb [-2, 2]
  • Konfidenzintervallbreiten nehmen proportional zu 1/sqrt(n_paths) ab (Zentraler Grenzwertsatz)
  • Varianzreduktionstechniken ergeben VRF > 1 (Schaetzungen verbessern sich, verschlechtern sich nicht)
  • Reproduzierbarkeit: erneutes Ausfuehren mit demselben Seed erzeugt identische Ergebnisse

Haeufige Stolperfallen

  • Unzureichendes Burn-in fuer MCMC: Start von einem schlechten Anfangszustand erfordert ein langes Burn-in bevor Samples die Zielverteilung repraesentieren. Immer Trace-Plots inspizieren und Konvergenzdiagnostik verwenden statt die Burn-in-Laenge zu raten.
  • Euler-Maruyama-Instabilitaet fuer steife SDEs: Wenn der Driftterm grosse Gradienten hat, kann explizites Euler-Maruyama divergieren. Zu impliziten Methoden wechseln oder adaptive Schrittgroesse verwenden.
  • Verwechslung starker und schwacher Konvergenz fuer SDEs: Starke Konvergenz misst pfadweisen Fehler (wichtig fuer einzelne Trajektorien); schwache Konvergenz misst Verteilungsfehler (ausreichend fuer Erwartungswerte). Euler-Maruyama hat schwache Ordnung 1.0 aber starke Ordnung 0.5.
  • Qualitaet des Pseudozufallszahlengenerators: Fuer sehr lange Simulationen koennen minderwertige RNGs korrelierte Samples erzeugen. Einen gut getesteten Generator verwenden (Mersenne Twister, PCG oder Xoshiro) und Unabhaengigkeit verifizieren.
  • Autokorrelation in MCMC ignorieren: Autokorrelierte MCMC-Samples als unabhaengig behandeln unterschaetzt Unsicherheit. Immer effektive Stichprobengroesse verwenden, nicht rohe Sampleanzahl, fuer Standardfehler.
  • Antithetische Variablen fuer nicht-monotone Funktionen: Antithetische Stichprobenziehung reduziert Varianz nur wenn der Schaetzgegenstand eine monotone Funktion der zugrundeliegenden Uniformen ist. Fuer nicht-monotone Funktionen kann sie Varianz erhoehen.
  • Speicher fuer grosse Simulationen: Speicherung aller Zeitschritte vieler langer Pfade kann den Speicher erschoepfen. Online-Statistiken verwenden (laufender Mittelwert, Varianz) wenn vollstaendige Trajektorien nicht fuer die Visualisierung benoetigt werden.

Verwandte Skills

GitHub Repository

pjt222/agent-almanac
Path: i18n/de/skills/simulate-stochastic-process
0
agentsagentskillsai-assisted-developmentclaude-codeskillsteams

Related Skills

executing-plans

Design

Use the executing-plans skill when you have a complete implementation plan to execute in controlled batches with review checkpoints. It loads and critically reviews the plan, then executes tasks in small batches (default 3 tasks) while reporting progress between each batch for architect review. This ensures systematic implementation with built-in quality control checkpoints.

View skill

requesting-code-review

Design

This skill dispatches a code-reviewer subagent to analyze code changes against requirements before proceeding. It should be used after completing tasks, implementing major features, or before merging to main. The review helps catch issues early by comparing the current implementation with the original plan.

View skill

connect-mcp-server

Design

This skill provides a comprehensive guide for developers to connect MCP servers to Claude Code using HTTP, stdio, or SSE transports. It covers installation, configuration, authentication, and security for integrating external services like GitHub, Notion, and custom APIs. Use it when setting up MCP integrations, configuring external tools, or working with Claude's Model Context Protocol.

View skill

web-cli-teleport

Design

This skill helps developers choose between Claude Code Web and CLI interfaces based on task analysis, then enables seamless session teleportation between these environments. It optimizes workflow by managing session state and context when switching between web, CLI, or mobile. Use it for complex projects requiring different tools at various stages.

View skill