スキル一覧に戻る

model-markov-chain

pjt222
更新日 6 days ago
13 閲覧
17
2
17
GitHubで表示
メタaidesign

について

このスキルは、メモリレスシステムをモデル化するための離散または連続マルコフ連鎖を構築・分析します。遷移行列の構築、状態の分類、定常分布の計算、平均初到達時間の算出が可能です。定常状態確率や期待到達時間の決定、あるいは隠れマルコフモデル(HMM)や強化学習のマルコフ決定過程(MDP)の基礎としてご利用ください。

クイックインストール

Claude Code

推奨
メイン
npx skills add pjt222/agent-almanac -a claude-code
プラグインコマンド代替
/plugin add https://github.com/pjt222/agent-almanac
Git クローン代替
git clone https://github.com/pjt222/agent-almanac.git ~/.claude/skills/model-markov-chain

このコマンドをClaude Codeにコピー&ペーストしてスキルをインストールします

ドキュメント

模馬可夫鏈

由原數或域陳築、分、析離散或連續時馬可夫鏈,生穩分布、均首至時、模擬驗。涵 DTMC 與 CTMC 全流。

  • 模未來態唯依今態之系(無記性)
  • 有限態間觀轉計或率
  • 求過程之長運穩態率
  • 定期至或吸率
  • 分態為瞬、復、吸以析構
  • 比同系之異馬模
  • 為高模築基(HMM、RL MDP)

InputTypeDescription
state_spacelist/vectorExhaustive enumeration of all states in the chain
transition_datamatrix, data frame, or edge listRaw transition counts, a probability matrix, or a rate matrix (for CTMC)
chain_typestringEither "discrete" (DTMC) or "continuous" (CTMC)

InputTypeDefaultDescription
initial_distributionvectoruniformStarting state probabilities
time_horizoninteger/float100Number of steps (DTMC) or time units (CTMC) for simulation
tolerancefloat1e-10Convergence tolerance for iterative computations
absorbing_stateslistauto-detectStates explicitly marked as absorbing
labelsliststate indicesHuman-readable names for each state
methodstring"eigen"Solver method: "eigen", "power", or "linear_system"

一:定態空與轉

1.1. 列諸異態。確盡且互斥。

1.2. 由原察→列轉計入 n x n 計陣 CC[i,j] 為由 i 至 j 之觀數。

1.3. 連時鏈→收各態持時與轉去處。

1.4. 驗無漏:諸觀源去皆於態空。

1.5. 記源、察期、過濾。此源錄為復析與釋異所必。

得:定態空大 n 含計陣或 (源、去、率/數) 元組覆諸觀轉。態空宜小於矩運(密法常 n < 10000)。

敗:缺態→重審源擴列。空太大不宜陣→合稀態為「他」或轉模擬析。計陣極稀→驗察期足長以捕典轉。

二:築轉陣或生

2.1. DTMC:歸計陣各列得轉率陣 P

  • P[i,j] = C[i,j] / sum(C[i,])
  • 驗各列和 1(內公差)。

2.2. CTMC:築率(生)陣 Q

  • 對外:Q[i,j] = i 至 j 之轉率
  • 對:Q[i,i] = -sum(Q[i,j] for j != i)
  • 驗各列和 0(內公差)。

2.3. 零計列(從未為源之態)→定平滑:拉普拉斯、吸約定、或標審。

2.4. 存陣以宜後算之式(小鏈密、大鏈稀)。

得:有效隨機陣 P(列和 1)或生陣 Q(列和 0),P 對外無負,Q 對無正。

敗:列和逾差→察數壞或浮點誤。重歸或重審源。

三:分態

3.1. 算通類:尋轉陣引向圖之強連通分(唯正率邊)。

3.2. 各通類定:

  • :類無向他類之去邊
  • :有去邊
  • :類唯一態且 P[i,i] = 1

3.3. 各復類察期:算類中任態可達諸環長之 GCD。

  • 期 1 即非期。

3.4. 定鏈為不可約(一通類)或可約(多類)。

3.5. 摘:列各類、其型(瞬/復)、其期、有吸態否。

得:諸態皆賦通類含標(瞬、正復、零復、吸)與期。

敗:圖析不一→驗轉陣無負且列和正。極大鏈用迭圖法非全陣冪。

四:算穩分

4.1. 不可約非期鏈:解 pi * P = pisum(pi) = 1 約。

  • 重式為 pi * (P - I) = 0 含歸約。
  • 用特值分:piP 對特值 1 之左特向量,歸至和 1。

4.2. 不可約期鏈:穩分仍存,鏈不由任始態收於之。算同 4.1。

4.3. 可約鏈:各復類獨算穩分。總穩分為凸組依瞬態之吸率。

4.4. CTMC:解 pi * Q = 0sum(pi) = 1

4.5. 驗:算 pi * P(或 Q)確等 pi 內差。

4.6. 可約鏈→算各瞬態至各復類之吸率。此率與類穩分合得依始態之長運。

4.7. 記譜隙(最大與次大特值幅之差)。此量決收於穩之率,於六定模擬步數有用。

得:率向量 pin、皆非負、和 1、合衡式內差。非期不可約鏈譜隙宜正。

敗:特解器不收→試迭冪法(pi_k+1 = pi_k * P 至收)。多特值等 1→鏈可約——按 4.3 治。譜隙極小→鏈混慢,需極長模擬以驗。

五:算均首至時

5.1. 定均首至時 m[i,j] 為由 i 始達 j 之期步數。

5.2. 不可約鏈→解線方系:

  • m[i,j] = 1 + sum(P[i,k] * m[k,j] for k != j)i != j
  • m[j,j] = 1 / pi[j](均復時)

5.3. 吸鏈→算吸率與期吸時:

  • P 為瞬(Q_t)與吸塊。
  • 基陣:N = (I - Q_t)^{-1}
  • 期吸步:N * 1(一列向量)
  • 吸率:N * RR 為瞬至吸塊。

5.4. CTMC→以生陣換步計為期持時。

5.5. 出為陣或表,含關態對之首至時。

得:均首至時陣,對等均復時(1/pi[j]),對外於通態對為有限。

敗:線系奇異→鏈有瞬態不能達標。報不達對為無限。驗三之鏈構。

六:以模擬驗

6.1. 模 K 獨樣路各 T 步,由始分發。

6.2. 經驗估穩分:棄燒入後計諸路之態占率。

6.3. 比模率與析穩分。算總變距或卡方計。

6.4. 經驗估均首至時:記諸復下各標態之首至時。

6.5. 報合度:

  • 析與模穩率之最大絕差
  • 模首至時對析值之 95% 信區

6.6. 差逾差→重審轉陣築與分步。

得:模穩分於析解內 0.01 總變距(足長運)。模均首至時於析值內 10%。

敗:增模長 T 或重數 K。差持→析解或有數誤——重以高精算。

  • 轉陣 P 諸入非負、各列和 1(或 CTMC 之 Q 列和 0)
  • 穩分 pi 為合率向量合 pi * P = pi
  • 均復時等 1/pi[j] 於各復態 j
  • 模態率收於析穩分
  • 態分一:無復態有出其通類之邊
  • P 諸特值幅至多 1,各復類精一特值等 1
  • 吸鏈:各瞬態之吸率於諸吸類和 1
  • 基陣 N = (I - Q_t)^{-1} 諸入正(期訪計正)
  • 細衡若鏈可逆:pi[i] * P[i,j] = pi[j] * P[j,i]i,j

  • 態空不盡:缺態生次隨機陣(列和 < 1)。析前必驗列和
  • 混 DTMC 與 CTMC:率陣對非正且列和 0。施 DTMC 式於率陣生謬
  • 忽期:期鏈有有效穩分而不於常義收。混時析必計期
  • 大鏈數不穩:大密陣特分貴失精。逾數百態用稀解器或迭法
  • 零率轉:轉陣構零致鏈可約。算單穩分前驗不可約
  • 模擬不足:短模混差生偏估。算有效樣本量察跡
  • 假可逆未驗:諸析捷(如細衡)唯施可逆鏈。用可逆果前驗 pi[i] * P[i,j] = pi[j] * P[j,i]
  • 冪法浮點積pi * P 多迭積入誤。冪迭中時重歸 pi 和 1

GitHub リポジトリ

pjt222/agent-almanac
パス: i18n/wenyan-ultra/skills/model-markov-chain
0
agentsagentskillsai-assisted-developmentclaude-codeskillsteams

関連スキル

content-collections

メタ

このスキルは、Content Collections(Markdown/MDXファイルを型安全なデータコレクションに変換するTypeScriptファーストのツール)の本番環境でテストされた設定を提供します。Zodバリデーションによる型安全性を実現し、ブログ、ドキュメントサイト、コンテンツ重視のVite + Reactアプリケーション構築時にご利用ください。Viteプラグインの設定、MDXコンパイルから、デプロイ最適化、スキーマバリデーションまで、すべてを網羅しています。

スキルを見る

polymarket

メタ

このスキルは、開発者がPolymarket予測市場プラットフォームを活用したアプリケーション構築を可能にします。API統合による取引や市場データの取得に加え、WebSocketを介したリアルタイムデータストリーミングにより、ライブ取引や市場活動を監視できます。取引戦略の実装や、ライブ市場更新を処理するツールの作成にご利用ください。

スキルを見る

creating-opencode-plugins

メタ

このスキルは、開発者がコマンド、ファイル、LSP操作など25種類以上のイベントタイプにフックするOpenCodeプラグインを作成することを支援します。JavaScript/TypeScriptモジュール向けに、プラグイン構造、イベントAPI仕様、および実装パターンを提供します。カスタムイベント駆動ロジックでOpenCode AIアシスタントのライフサイクルをインターセプト、監視、または拡張する必要がある場合にご利用ください。

スキルを見る

sglang

メタ

SGLangは、高性能なLLMサービングフレームワークであり、RadixAttentionプレフィックスキャッシュを活用したJSON、正規表現、エージェントワークフロー向けの高速で構造化された生成を特長とします。特にプレフィックスが繰り返されるタスクにおいて、大幅に高速な推論を実現し、複雑な構造化出力やマルチターン対話に最適です。制約付きデコードが必要な場合や、広範なプレフィックス共有を伴うアプリケーションを構築する場合は、vLLMなどの代替案ではなくSGLangを選択してください。

スキルを見る