计算机科学的数学基础计算机概率随机过程本页总览随机过程马尔可夫随机过程 马尔科夫链是一个随机过程,它具有马尔科夫性质。马尔科夫性质是指给定当前状态,未来状态的条件概率分布只依赖于当前状态,而与过去状态无关。 转移矩阵 PS→S′P_{S\to S^{'}}PS→S′ Pij=P[Si→Sj]P_{ij} = P[S_i \to S_j]Pij=P[Si→Sj] ∑j=1nPij=1\sum_{j=1}^{n} P_{ij} = 1∑j=1nPij=1 (每一行的和为 1) 第 nnn 天的状态:Pn=PnP_n = P^{n}Pn=Pn 平稳分布:如果 limn→∞Pn=P\lim_{n\to\infty} P_n = Plimn→∞Pn=P,则 PPP 是平稳分布。 马尔可夫决策过程