# 定义与性质
多元正态分布是单变量正态分布向多维空间的推广。一个 p 维随机向量 X 服从均值为 μ、协方差矩阵为 Σ 的多元正态分布,记作 X∼Np(μ,Σ),其概率密度函数为:
f(x)=(2π)p/2∣Σ∣1/21e−21(x−μ)TΣ−1(x−μ)
- 线性组合性质:
- 任何线性组合仍服从正态分布。若 X∼Np(μ,Σ),则 aTX∼N1(aTμ,aTΣa)。
- 类似地,对于矩阵 A,有 AX∼Nk(Aμ,AΣAT)。
- 线性变换与标准化:
- 任何多元正态分布都可以由标准正态分布通过线性变换得到。若 Z∼Np(0,I),则 μ+Σ1/2Z∼Np(μ,Σ)。
- 二次型 (x−μ)TΣ−1(x−μ) 服从自由度为 p 的卡方分布,即 (X−μ)TΣ−1(X−μ)∼χp2。
# 几何特性
多元正态分布的等高线是由其二次型决定的,是一个以 μ 为中心的超椭球。
- 等高线方程:(x−μ)TΣ−1(x−μ)=c2。
- 几何中心:μ 是分布的中心。
- 主轴:超椭球的主轴方向由协方差矩阵 Σ 的特征向量 ei 决定,其半轴长度为 cλi,其中 λi 是对应的特征值。最长轴对应于最大的特征值。
# 分块矩阵的性质
当多元正态随机向量 X 被分块为 X=[X1X2] 时,其均值和协方差矩阵也相应分块:
[X1X2]∼Np1+p2([μ1μ2],[Σ11Σ21Σ12Σ22])
- 分块均值与协方差:
- Σ12=Σ21T=Cov(X1,X2)。
- 边缘分布 X1 仍服从正态分布,即 X1∼Np1(μ1,Σ11)。
- 独立性:
- X1 和 X2 相互独立当且仅当它们的协方差矩阵 Σ12=0。
- 若 X1 和 X2 相互独立,则它们的联合分布仍是多元正态分布,且 Σ12=0。
- 若 X1 和 X2 相互独立,它们的线性组合仍然是正态分布,其均值和方差遵循与一元情况类似的性质。
- 条件分布:
- X1∣X2=x2 的条件分布仍然是多元正态分布,其均值和协方差矩阵分别为:
- E(X1∣X2=x2)=μ1+Σ12Σ22−1(x2−μ2)
- Cov(X1∣X2=x2)=Σ11−Σ12Σ22−1Σ21
- 两个不相关的线性组合 Y1=c1TX 和 Y2=c2TX 相互独立,当且仅当它们的协方差为零,即 Cov(Y1,Y2)=c1TΣc2=0。对于标准正态分布,当 c1 和 c2 正交时 (c1Tc2=0),它们是独立的。
# 统计推断
- 充分统计量:对于一个服从多元正态分布的样本,样本均值 Xˉ 和样本协方差矩阵 S 是其参数的联合充分统计量。
- 参数估计:
- 最大似然估计 (MLE):
- 均值向量 μ 的最大似然估计为样本均值 μ^MLE=Xˉ。
- 协方差矩阵 Σ 的最大似然估计为 Σ^MLE=Sn=n1∑i=1n(Xi−Xˉ)(Xi−Xˉ)T。
- 无偏估计:
- Xˉ 是 μ 的无偏估计。
- 样本协方差矩阵 S=n−11∑i=1n(Xi−Xˉ)(Xi−Xˉ)T 是 Σ 的无偏估计。
- 广义样本方差:
- 最大似然估计 Σ^ 的行列式 ∣Σ^∣ 通常被称为广义样本方差,它衡量了样本数据的总体变异性。