# 概述
高斯过程是一个在统计学和机器学习中非常重要的概念,它是一种随机过程。一个随机过程 {X(t),t∈T} 被称为高斯过程,如果对于任意一个有限的时间点集合 t1,t2,⋯,tn∈T,对应的随机向量 (X(t1),X(t2),⋯,X(tn))T 都服从 n 元高斯分布(或称多元正态分布)。
多元高斯分布 X∼N(μ,Σ) 的概率密度函数定义如下:
fX(x)=(2π)n/2∣Σ∣1/21exp(−21(x−μ)TΣ−1(x−μ))
其中,μ 是均值向量,Σ 是协方差矩阵。
# 多元高斯分布的特征函数与性质
# 特征函数
特征函数是概率密度函数的傅里叶反变换,它们之间是相互唯一确定的。一个多元随机向量 X 的特征函数定义为:
ϕX(t)=E(ejtTX)
多元高斯分布的特征函数具有简洁的形式:
ϕX(t)=exp(jtTμ−21tTΣt)
基于此,多元高斯随机变量也可以通过特征函数来定义:如果一个随机变量 X 的特征函数满足上述形式,其中 Σ 是一个非负定矩阵(即使不满秩),则称 X 是一个多元高斯随机变量。
此外,特征函数还有以下性质:
- 混合矩的计算: 如果混合矩 E[X1k1X2k2⋯Xnkn] 存在,则可通过特征函数求得:
E[X1k1X2k2⋯Xnkn]=(−j)k1+k2+⋯+kn∂t1k1∂t2k2⋯∂tnkn∂ϕ(t1,t2,⋯,tn)t1=t2=⋯=tn=0
- 线性变换: 随机向量 X 经过线性变换 AX+b 后的特征函数为:
ϕAX+b(t)=ϕX(ATt)ejtTb
- 独立性: 随机变量 X1,X2,⋯,Xn 相互独立当且仅当其联合特征函数等于各自边缘特征函数的乘积:
ϕX(t)=i=1∏nϕXi(ti)
- 极限性质: 如果一个高斯随机变量序列依分布收敛到一个随机变量 X,那么 X 也是一个高斯随机变量。
# 主要性质
多元高斯分布具有许多重要的性质:
- 线性变换: 如果 X∼N(μ,Σ),那么其线性变换 AX+b 仍然服从高斯分布,即 AX+b∼N(Aμ+b,AΣAT)。
- 边缘分布: 多元高斯分布的任意子集仍然服从高斯分布。例如,如果随机向量 X=(XA,XB)T 服从高斯分布,那么其子向量 XA 和 XB 也都服从高斯分布。
- 独立性: 如果 X=(XA,XB)T 服从高斯分布,那么 XA 与 XB 相互独立的充要条件是它们的协方差矩阵为分块对角矩阵,即 ΣAB=0。
- 条件分布: 多元高斯分布的条件分布也是高斯分布。例如,如果 X=(XA,XB)T 服从高斯分布,那么给定 XB 后 XA 的条件分布为:
fXA∣XB(xA∣xB)=N(μA∣B,ΣA∣B)
其中,均值和协方差矩阵分别为:μA∣B=μA+ΣABΣB−1(xB−μB)ΣA∣B=ΣA−ΣABΣB−1ΣBA
- 高阶矩: 多元高斯分布的所有高阶矩都可以完全由其一阶(均值)和二阶(协方差)矩来确定。一个典型的例子是四阶矩的计算,如:
E[X1X2X3X4]=E[X1X2]E[X3X4]+E[X1X3]E[X2X4]+E[X1X4]E[X2X3]
# 高斯过程的性质与应用
# 实高斯过程的性质
一个实高斯过程 {X(t)} 完全由其均值函数 μX(t)=E[X(t)] 和协方差函数 CX(t,t′)=Cov(X(t),X(t′)) 确定,通常记为 {X(t)}∼GP(μX(t),CX(t,t′))。
- 平稳性: 对于实高斯过程,严平稳等价于宽平稳。
- 可导性: 如果高斯过程 {X(t)} 是可导的,那么其导数过程 {X′(t)} 也是一个高斯过程。
- 线性系统: 如果一个高斯过程 {X(t),t∈[a,b]} 通过一个一般线性系统 h(t,τ),即 Y(t)=∫abX(τ)h(t,τ)dτ,那么输出过程 {Y(t)} 也是高斯过程。此外,联合过程 {[X(t)Y(t)]} 也是高斯过程。
# 带通高斯过程
带通高斯过程是高斯过程在信号处理中的一个应用,其包络和相位服从特殊的分布。
- 莱斯分布和瑞利分布: 设 X,Y 是相互独立、联合高斯分布的随机变量,均值分别为 μ1=ρcosϕ,μ2=ρsinϕ,方差同为 σ2。它们的包络 V=X2+Y2 和相位 Θ=arctan(Y/X) 的联合概率密度函数为:
fV,Θ(v,θ)=2πσ2vexp(−2σ21(v2+ρ2−2ρvcos(θ−ϕ)))
其中,包络 V 的边缘概率密度函数为:fV(v)=σ2vexp(−2σ2v2+ρ2)I0(σ2ρv)
这被称为参数为 ρ 和 σ 的 莱斯分布,其中 I0(⋅) 是零阶修正贝塞尔函数。
当参数 ρ=0 时,莱斯分布退化为 瑞利分布:fV(v)=σ2vexp(−2σ2v2)
- 零均值带通高斯过程(略)。
- 随机相位正弦波信号叠加零均值带通高斯过程(略)。
# 基于高斯过程的回归分析
高斯过程在机器学习中常被用于 高斯过程回归,这是一种非参数化的贝叶斯方法,用于解决回归问题。它不同于传统的回归方法:
- 最小二乘法线性回归(略)。
- 贝叶斯线性回归(略)。
- 非线性回归(略)。
- 高斯过程回归(略)。