# 马尔可夫链的定义
# 基本概念
-
马尔可夫过程(马尔可夫链):一个随机过程 ,若其未来的状态只依赖于当前状态,而与过去的状态无关,则称其为马尔可夫过程。数学上,对于任意 ,该过程满足:
对于离散时间过程 ,该性质等价于:
-
状态:马尔可夫链在某个时刻所处的值,记为 ,其中 为状态空间。
-
状态驻留概率:马尔可夫链 在时刻 处于状态 的概率。
向量 称为状态分布,其中 是初始状态分布。
-
状态转移概率:马尔可夫链从状态 转移到状态 的概率。
- 一步转移概率:从时刻 转移到时刻 的概率,记为 。
- 步转移概率:从时刻 转移到时刻 的概率,记为 。
# 齐次马尔可夫链
-
齐次马尔可夫链:如果一步转移概率 与时刻 无关,即 ,则称该马尔可夫链是齐次的。此时, 步转移概率也与 无关,记为 。
-
转移概率矩阵:对于齐次马尔可夫链,一步转移概率矩阵 是一个以 为行、以 为列的矩阵,其每一行元素之和为 1。 步转移概率矩阵为 ,每一行元素之和也为 1,且 。
-
状态分布与转移矩阵的关系:状态分布 可由初始分布 和 步转移概率矩阵 得到:
-
查普曼-科尔莫戈洛夫(C-K)方程:该方程描述了多步转移概率之间的关系,其数学形式为:
该方程的矩阵形式为 ,由此可得 。其中规定 ,即 。
- C-K 不等式:。
-
状态转移图:一种直观表示马尔可夫链状态转移的图。
# 马尔可夫链状态的分类
# 可达性与互通性
-
可达性:对于状态 ,若存在 使得 ,则称状态 可达于状态 ,记为 。
- 性质:可达性具有传递性。若 ,则对于任意 ,有 。
-
互通性:若 且 ,则称状态 与状态 互通,记为 。
- 性质:互通性是一种等价关系,具有自反性、对称性和传递性。
- 等价类:互通关系将状态空间 划分为若干个互不相交的等价类。包含状态 的等价类记为 。
# 闭集与不可约集
-
闭集:若状态空间的子集 满足马尔可夫链不能从 中的任何状态转移到 中的任何状态,则称 为闭集。
- 性质:
- 闭集可以单独构成一个马尔可夫链的状态空间。
- 吸收态是只有一个状态的闭集,满足 ,是最小的闭集。
- 整个状态空间 是最大的闭集。
- 闭集与等价类之间没有互相蕴含的关系。
- 性质:
-
不可约集:一个闭的等价类。如果马尔可夫链的状态空间 本身是一个不可约集,则称该链为不可约链。
# 马尔可夫链状态的常返性
# 常返与非常返
-
首达概率:从状态 出发,经过 步首次到达状态 的概率记为 。
- 从状态 出发,至少一次到达状态 的概率为可达概率 。
- 当 时, 称为返回概率。
-
常返与非常返:
- 常返态:若状态 的返回概率 ,则称状态 为常返态。
- 非常返态(暂态):若状态 的返回概率 ,则称状态 为非常返态。
-
常返性判别:
- 状态 是常返的,当且仅当 。
- 状态 是非常返的,当且仅当 。
-
常返性性质:
- 有限状态空间的马尔可夫链至少有一个常返态。
- 常返性是类性质,即若 ,则 与 具有相同的常返性。
- 若 为常返态且 ,则必有 ,且 。
- 吸收态是常返态。
- 若 是非常返态,则对于任意 ,有 。
# 正常返与零常返
-
首达时间:对于状态 ,从 出发,首次返回到 的时间 。若 是常返态,则 是 的分布列。
-
平均返回时间:常返态 的平均返回时间为 。
-
正常返与零常返:
- 正常返态:若常返态 的平均返回时间 。
- 零常返态:若常返态 的平均返回时间 。
-
性质:
- 若 是常返态,则 为零常返当且仅当 。
- 正常返和零常返也是类性质。
-
弱遍历性定理:对于齐次马尔可夫链,从状态 出发,长期来看访问状态 的平均频率的极限为:
特别是当 时,该极限为 ,表示从 出发,链访问状态 的频率的期望的极限,等于首次返回状态 的平均时间的倒数。
-
有限状态的马尔可夫链:至少有一个正常返态。
# 马尔可夫链的极限行为
# 周期性
- 状态的周期:对于状态 ,其周期 定义为集合 的最大公约数,。若状态 永远无法返回自身,则定义 。
- 非周期态:若 ,则称状态 为非周期态。
- 性质:周期性也是类性质,即若 ,则 。
# 转移概率的极限
-
非常返态:对非常返态 ,对于任意 ,都有 。
-
常返、非周期态:对常返、非周期态 ,对于任意 ,有:
-
常返、周期态:对周期为 的常返态 ,对于任意 ,转移概率的极限在周期子序列上存在。设 ,则:
# 状态空间的分解
-
状态空间的分解:任何马尔可夫链的状态空间 都可以分解为若干常返等价类(闭集)和一个非常返状态集合 的并集:
其中 为常返等价类, 为非常返状态集合。
-
转移矩阵的块矩阵形式:根据状态空间的分解,转移矩阵 可以写成块矩阵形式:
当 时,非常返状态的转移概率极限为零,因此转移矩阵的极限为:
其中 是对应正常返等价类的极限, 是零矩阵。
# 平稳分布
# 定义与性质
-
平稳分布:对于齐次马尔可夫链,若存在一个概率分布 满足 ,则称 为该链的平稳分布。
- 性质:
- 若 是平稳分布,则 。
- 如果马尔可夫链的初始分布就是平稳分布,则该链是严平稳的。
- 平稳分布的存在性与极限分布的存在性是两个不同的概念。
- 性质:
-
遍历态:一个正常返且非周期的状态。若一个等价类中有一个遍历态,则所有状态都是遍历态,该等价类称为遍历等价类。
-
不可约遍历链的平稳分布:对于不可约的遍历链,其转移概率的极限与出发状态无关,即 。这个极限分布 构成了该链唯一的平稳分布。
-
平稳分布的存在性:
- 一个马尔可夫链存在且唯一的平稳分布,当且仅当它只包含一个正常返等价类。
- 一个不可约马尔可夫链是正常返的充要条件是存在平稳分布。
# 细致平衡方程与可逆链
-
反向马尔可夫链:若齐次马尔可夫链 存在平稳分布 ,且初始分布为 ,则其反向马尔可夫链也是齐次的,其一步转移概率为 。
-
细致平衡方程(细致平稳方程):若定义在马尔可夫状态空间 上的分布 满足:
则称 满足细致平衡方程,该马尔可夫链称为可逆马尔可夫链。
- 细致平衡方程是平稳分布的一个充分条件。
# 应用:马尔可夫链蒙特卡洛(MCMC)
- MCMC:通过构造一个具有目标平稳分布的马尔可夫链,来生成服从该分布的随机样本的方法。
- MH 算法:一种构造马尔可夫链以达到指定平稳分布的常用 MCMC 算法。
# 辅助定理
- 哈代-利特尔伍德定理:用于分析幂级数的极限性质。
- 对于幂级数 (在 收敛),有:
- 对于幂级数 (在 收敛),有:
- 控制收敛定理:用于判断函数项级数的一致收敛性。
- 若存在收敛的数项级数 满足 ,则函数项级数 在指定区间上一致收敛。
- 非常返判据:对于一个不可约的齐次马尔可夫链,它非常返的充要条件是方程 具有非零的有界解,其中 是去掉某个状态(如0状态)对应行和列的转移矩阵。