MCP HubMCP Hub
Вернуться к навыкам

model-markov-chain

pjt222
Обновлено 2 days ago
9 просмотров
17
2
17
Посмотреть на GitHub
Другоеai

О программе

Этот навык строит и анализирует дискретные или непрерывные цепи Маркова на основе данных о переходах, позволяя разработчикам моделировать системы без памяти. Он вычисляет ключевые свойства, такие как стационарные распределения, средние времена первого прохода, и классифицирует состояния как переходные или возвратные. Используйте его для моделирования стохастических процессов, анализа долгосрочного поведения или в качестве основы для скрытых марковских моделей (HMM) и марковских процессов принятия решений (MDP) в обучении с подкреплением.

Быстрая установка

Claude Code

Рекомендуется
Основной
npx skills add pjt222/agent-almanac -a claude-code
Команда плагинаАльтернативный
/plugin add https://github.com/pjt222/agent-almanac
Git клонированиеАльтернативный
git clone https://github.com/pjt222/agent-almanac.git ~/.claude/skills/model-markov-chain

Скопируйте и вставьте эту команду в Claude Code для установки этого навыка

Документация

马尔可夫链建模

从原始转移数据或领域规格构建、分类和分析离散时间或连续时间马尔可夫链,生成平稳分布、平均首达时间和基于模拟的验证。涵盖 DTMC 和 CTMC 端到端工作流。

适用场景

  • 需要对未来状态仅取决于当前状态(无记忆性质)的系统建模
  • 拥有有限状态集之间的观测转移计数或速率
  • 想要计算过程的长期稳态概率
  • 需要确定期望命中时间或吸收概率
  • 为结构分析将状态分类为瞬态、常返态或吸收态
  • 想要比较同一系统的替代马尔可夫模型
  • 为更高级的模型(隐马尔可夫模型、强化学习 MDP)建立基础

输入

必需

输入类型描述
state_spacelist/vector链中所有状态的穷举枚举
transition_datamatrix, data frame, or edge list原始转移计数、概率矩阵或速率矩阵(CTMC)
chain_typestring"discrete"(DTMC)或 "continuous"(CTMC)

可选

输入类型默认值描述
initial_distributionvectoruniform起始状态概率
time_horizoninteger/float100步数(DTMC)或时间单位(CTMC)用于模拟
tolerancefloat1e-10迭代计算的收敛容差
absorbing_stateslistauto-detect明确标记为吸收的状态
labelsliststate indices每个状态的可读名称
methodstring"eigen"求解方法:"eigen""power""linear_system"

步骤

第 1 步:定义状态空间和转移

1.1. 枚举所有不同的状态。确认列表是穷举的且互斥的。

1.2. 如果从原始观测数据工作,将转移计数制表为 n x n 计数矩阵 C,其中 C[i,j] 是从状态 i 到状态 j 的观测转移次数。

1.3. 对于连续时间链,收集每个状态的停留时间以及转移目的地。

1.4. 通过检查每个观测到的起点和终点是否出现在状态空间中,验证没有遗漏状态。

1.5. 记录数据来源、观测期间和应用的任何过滤。此来源记录对于重现分析和解释异常至关重要。

预期结果: 大小为 n 的定义良好的状态空间,以及覆盖所有观测转移的计数矩阵或(起点、终点、速率/计数)元组列表。状态空间应足够小以进行矩阵运算(稠密方法通常 n < 10000)。

失败处理: 如果状态缺失,重新检查源数据并扩展枚举。如果状态空间对矩阵方法太大,考虑将稀有状态合并为聚合"其他"状态或转向基于模拟的分析。如果计数矩阵极其稀疏,验证观测期间是否足够长以捕获典型转移。

第 2 步:构建转移矩阵或生成元

2.1. 离散时间(DTMC): 对计数矩阵的每一行进行归一化以获得转移概率矩阵 P

  • P[i,j] = C[i,j] / sum(C[i,])
  • 验证每一行的和为 1(在容差范围内)。

2.2. 连续时间(CTMC): 构建速率(生成元)矩阵 Q

  • 非对角线:Q[i,j] = rate of transition from i to j
  • 对角线:Q[i,i] = -sum(Q[i,j] for j != i)
  • 验证每一行的和为 0(在容差范围内)。

2.3. 处理零计数行(从未作为起点观测到的状态),决定平滑策略:拉普拉斯平滑、吸收约定或标记待审查。

2.4. 以适合下游计算的格式存储矩阵(小链用稠密格式,大链用稀疏格式)。

预期结果: 有效的随机矩阵 P(行和为 1)或生成元矩阵 Q(行和为 0),P 中无负的非对角线元素,Q 中无正的对角线元素。

失败处理: 如果行和偏离超出容差,检查数据损坏或浮点问题。重新归一化或重新检查源数据。

第 3 步:状态分类

3.1. 通过找到由转移矩阵诱导的有向图(仅正概率边)的强连通分量来计算通信类。

3.2. 对每个通信类,确定:

  • 常返的:如果该类没有通往其他类的出边。
  • 瞬态的:如果有通往其他类的出边。
  • 吸收的:如果该类由单个状态组成且 P[i,i] = 1

3.3. 通过计算从该类中任何状态可达的所有循环长度的最大公约数来检查每个常返类的周期性。

  • 周期 = 1 表示非周期。

3.4. 确定链是不可约的(单一通信类)还是可约的(多个类)。

3.5. 总结:列出每个类、其类型(瞬态/常返)、其周期,以及是否存在吸收态。

预期结果: 完整的分类:每个状态被分配到一个通信类,带有标签(瞬态、正常返、零常返、吸收)和周期性。

失败处理: 如果图分析不一致,验证转移矩阵没有负元素且行和正确。对于非常大的链,使用迭代图算法而非完整矩阵幂。

第 4 步:计算平稳分布

4.1. 不可约非周期链: 求解 pi * P = pi,约束 sum(pi) = 1

  • 改写为 pi * (P - I) = 0 加归一化约束。
  • 使用特征值分解:piP 对应特征值 1 的左特征向量,归一化使其和为 1。

4.2. 不可约周期链: 平稳分布仍然存在,但链不会从任意初始状态收敛到它。使用与 4.1 相同的方法计算。

4.3. 可约链: 独立计算每个常返类的平稳分布。总体平稳分布是依赖于瞬态状态吸收概率的凸组合。

4.4. CTMC: 求解 pi * Q = 0,约束 sum(pi) = 1

4.5. 验证:将计算的 pi 乘以 P(或 Q),确认结果在容差范围内等于 pi

4.6. 对于可约链,计算从每个瞬态状态到每个常返类的吸收概率。这些概率与每类平稳分布相结合,给出取决于初始状态的长期行为。

4.7. 记录谱间隙(最大和第二大特征值幅度之差)。此量控制收敛到平稳性的速率,有助于确定第 6 步中需要多少模拟步骤。

预期结果: 长度为 n 的概率向量 pi,所有元素非负,和为 1,在容差范围内满足平衡方程。对于非周期不可约链,谱间隙应为正。

失败处理: 如果特征值求解器未能收敛,尝试迭代幂方法(pi_k+1 = pi_k * P 直到收敛)。如果多个特征值等于 1,则链是可约的——按第 4.3 步处理。如果谱间隙极小,链混合缓慢,验证需要非常长的模拟。

第 5 步:计算平均首达时间

5.1. 定义平均首达时间 m[i,j] 为从状态 i 出发到达状态 j 的期望步数。

5.2. 对于不可约链,求解线性方程组:

  • m[i,j] = 1 + sum(P[i,k] * m[k,j] for k != j) 对所有 i != j
  • m[j,j] = 1 / pi[j](平均回返时间)

5.3. 对于吸收链,计算吸收概率和期望吸收时间:

  • P 划分为瞬态(Q_t)和吸收块。
  • 基本矩阵:N = (I - Q_t)^{-1}
  • 期望吸收步数:N * 1(全 1 列向量)
  • 吸收概率:N * R,其中 R 是瞬态到吸收块。

5.4. 对于 CTMC,使用生成元矩阵将步数替换为期望停留时间。

5.5. 以矩阵或关键状态对的配对首达时间表呈现结果。

预期结果: 平均首达时间矩阵,其中对角线元素等于平均回返时间(1/pi[j]),通信状态对的非对角线元素有限。

失败处理: 如果线性系统奇异,链中有瞬态状态无法到达目标。报告不可达的对为无穷大。验证第 3 步的链结构。

第 6 步:模拟验证

6.1. 从初始分布出发,模拟 K 条独立的链样本路径,每条 T 步。

6.2. 通过计算丢弃预热期后所有路径的状态占用频率,经验估计平稳分布。

6.3. 比较模拟频率与解析平稳分布。计算总变差距离或卡方统计量。

6.4. 通过记录跨重复的每个目标状态的首次命中时间,经验估计平均首达时间。

6.5. 报告一致性指标:

  • 解析和模拟平稳概率之间的最大绝对偏差。
  • 模拟首达时间与解析值的 95% 置信区间。

6.6. 如果差异超出容差,重新检查转移矩阵构建和分类步骤。

预期结果: 模拟平稳分布与解析解的总变差距离在 0.01 以内(对于足够长的运行)。模拟平均首达时间在解析值的 10% 以内。

失败处理: 增加模拟长度 T 或重复次数 K。如果差异持续存在,解析解可能有数值误差——用更高精度重新计算。

验证清单

  • 转移矩阵 P 所有元素非负且每行和为 1(CTMC 的 Q 行和为 0)
  • 平稳分布 pi 是满足 pi * P = pi 的有效概率向量
  • 每个常返状态 j 的平均回返时间等于 1/pi[j]
  • 模拟状态频率收敛到解析平稳分布
  • 状态分类一致:没有常返状态有离开其通信类的边
  • P 的所有特征值幅度至多为 1,每个常返类恰好有一个特征值等于 1
  • 对于吸收链:每个瞬态状态的吸收概率在所有吸收类上的和为 1
  • 基本矩阵 N = (I - Q_t)^{-1} 所有元素为正(期望访问次数为正)
  • 细致平衡成立当且仅当链是可逆的:pi[i] * P[i,j] = pi[j] * P[j,i] 对所有 i,j

常见问题

  • 非穷举状态空间:缺失状态产生次随机矩阵(行和小于 1)。在分析前始终验证行和
  • 混淆 DTMC 和 CTMC:速率矩阵必须有非正对角线且行和为 0。对速率矩阵应用 DTMC 公式会产生无意义的结果
  • 忽视周期性:周期链有有效的平稳分布,但不会在通常意义上收敛到它。混合时间分析必须考虑周期
  • 大链的数值不稳定性:大型稠密矩阵的特征值分解开销大且可能丢失精度。对于超过几百个状态的链,使用稀疏求解器或迭代方法
  • 零概率转移:转移矩阵中的结构零可能使链可约。在计算单一平稳分布之前验证不可约性
  • 模拟长度不足:混合差的短模拟产生有偏估计。始终计算有效样本量并检查轨迹图
  • 未经检验假设可逆性:许多分析捷径(如细致平衡)仅适用于可逆链。使用依赖可逆性的结果前,验证 pi[i] * P[i,j] = pi[j] * P[j,i]
  • 幂方法中浮点误差积累:多次迭代 pi * P 会积累舍入误差。在幂迭代过程中定期将 pi 重新归一化使其和为 1

相关技能

  • fit-hidden-markov-model — 将马尔可夫链扩展为具有观测发射的潜在状态模型
  • simulate-stochastic-process — 适用于马尔可夫链样本路径和蒙特卡洛验证的通用模拟框架

GitHub репозиторий

pjt222/agent-almanac
Путь: i18n/zh-CN/skills/model-markov-chain
0
agentsagentskillsai-assisted-developmentclaude-codeskillsteams

Похожие навыки

llamaguard

Другое

LlamaGuard — это модель от Meta с 7–8 миллиардами параметров для модерации входных и выходных данных больших языковых моделей по шести категориям безопасности, таким как насилие и разжигание ненависти. Она обеспечивает точность 94–95% и может быть развернута с помощью vLLM, Hugging Face или Amazon SageMaker. Используйте этот навык, чтобы легко интегрировать фильтрацию контента и защитные механизмы в ваши ИИ-приложения.

Просмотреть навык

cost-optimization

Другое

Этот навык Claude помогает разработчикам оптимизировать облачные расходы за счет правильного подбора ресурсов, стратегий тегирования и анализа затрат. Он предоставляет framework для сокращения облачных расходов и внедрения управления затратами в AWS, Azure и GCP. Используйте его, когда вам нужно проанализировать расходы на инфраструктуру, оптимизировать ресурсы или уложиться в бюджетные ограничения.

Просмотреть навык

quantizing-models-bitsandbytes

Другое

Этот навык выполняет квантизацию LLM до 8-битной или 4-битной точности с использованием библиотеки bitsandbytes, обеспечивая сокращение использования памяти на 50-75% при минимальной потере точности. Он идеально подходит для запуска больших моделей при ограниченной памяти GPU или для ускорения вывода, поддерживая форматы INT8, NF4 и FP4. Навык интегрируется с HuggingFace Transformers и позволяет использовать обучение QLoRA и 8-битные оптимизаторы.

Просмотреть навык

dispatching-parallel-agents

Другое

Этот навык Claude распределяет нескольких агентов для исследования и устранения трёх и более независимых проблем параллельно. Он предназначен для сценариев с несвязанными сбоями, которые можно устранить без общего состояния или зависимостей. Ключевая возможность — параллельное решение проблем, где за каждую независимую предметную область назначается отдельный агент для максимальной эффективности.

Просмотреть навык