# 常见概率分布

# 正态分布

  • 一元正态分布

    p(yμ,σ2)=12πσe12σ2(yμ)2p(y|\mu,\sigma^{2})=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{1}{2\sigma^{2}}(y-\mu)^{2}}

  • 多元正态分布

    p(yμ,Σ)Σ1/2exp(12(yμ)TΣ1(yμ))p(y|\mu,\Sigma)\propto|\Sigma|^{-1/2}\exp\left(-\frac{1}{2}(y-\mu)^{T}\Sigma^{-1}(y-\mu)\right)

# 多项式分布

  • 概率质量函数

    p(yθ)j=1kθjyj其中 j=1kθj=1 且 j=1kyj=np(y|\theta)\propto\prod_{j=1}^{k}\theta_{j}^{y_{j}} \quad \text{其中 } \sum_{j=1}^{k}\theta_{j}=1 \text{ 且 } \sum_{j=1}^{k}y_{j}=n


# 多参数模型的贝叶斯分析

本节展示了两个常见多参数模型(多项式分布与正态分布)的贝叶斯分析,包括先验、后验及其参数推导。

# 多项式分布

  • 似然函数: 遵循多项式分布 Multinomial(θ1,,θk)Multinomial(\theta_1, \cdots, \theta_k)

  • 共轭先验: 狄利克雷分布 Dirichlet(α1,,αk)Dirichlet(\alpha_1, \cdots, \alpha_k) 是多项式分布的共轭先验。

    • Jeffery 先验 对应于 αj=1/2\alpha_j=1/2
    • θj\theta_j 均匀的先验对应于 αj=1\alpha_j=1
    • logit(θj)logit(\theta_j) 均匀的先验对应于 αj=0\alpha_j=0
  • 后验分布: 同样遵循狄利克雷分布,其参数为先验参数与观测数据的和。

    Dirichlet(α1+y1,,αk+yk)Dirichlet(\alpha_1+y_1, \cdots, \alpha_k+y_k)

# 正态分布

# 无信息先验

当缺乏关于均值 μ\mu 和方差 σ2\sigma^2 的先验信息时,可以采用如下的无信息先验。

  • 先验:

    p(μ,σ2)(σ2)1p(\mu,\sigma^{2})\propto(\sigma^{2})^{-1}

  • 条件后验:

    • 在给定 σ2\sigma^2 和数据 yy 的条件下,μ\mu 的后验服从正态分布:

      μσ2,yN(y,σ2/n)\mu|\sigma^{2},y\sim\mathrm{N}(\overline{y},\sigma^{2}/n)

    • 在给定 μ\mu 和数据 yy 的条件下,σ2\sigma^2 的后验服从逆卡方分布:

      σ2μ,yInvχ2(n,v)\sigma^{2}|\mu,y\sim\mathrm{Inv}-\chi^{2}(n,v)

  • 边缘后验:

    • μ\mu 的边缘后验服从 t分布

      μytn1(yˉ,s2/n)\mu\mid y\sim t_{n-1}(\bar{y},s^2/n)

    • σ2\sigma^2 的边缘后验服从 逆卡方分布

      σ2y<!swig0>χ2(n1,s2)\sigma^{2}\mid y\sim\mathrm\chi^{2}(n-1,s^{2})

    • 上述分布可以表示为:

      μys/nytn1(n1)s2σ2yχn12\frac{\mu-\overline{y}}{s/\sqrt{n}}\mid y \sim t_{n-1} \quad \text{和} \quad \frac{(n-1)s^{2}}{\sigma^{2}}\mid y\sim \chi_{n-1}^{2}

# 共轭先验

当有先验信息时,可以采用正态分布的共轭先验。

  • 先验: 均值 μ\mu 和方差 σ2\sigma^2 联合先验服从正态-逆卡方分布。

    μ,σ2NInvχ2(μ0,σ02/κ0;ν0,σ02)\mu, \sigma^2\sim \mathrm{N-Inv-}\chi^{2}\big(\mu_0,\,\sigma_{0}^{2}\big/\kappa_0;\nu_0,\sigma_{0}^{2}\big)

    这相当于 μ\mu 的条件先验和 σ2\sigma^2 的边缘先验分别为:

    μσ2    N(μ0,σ2/κ0)σ2  Invχ2(ν0,σ02)\mu|\sigma^{2}\;\sim\;\mathrm{N}(\mu_{0},\sigma^{2}/\kappa_{0}) \quad \text{和} \quad \sigma^{2}\ \sim\ \mathrm{Inv-}\chi^{2}(\nu_{0},\sigma_{0}^{2})

  • 联合后验: 后验分布仍然是正态-逆卡方分布,参数经过更新。

    μ,σ2yNInvχ2(μn,σn2/κn;νn,σn2)\mu, \sigma^2|y\sim \mathrm{N-Inv-}\chi^{2}\big(\mu_n,\,\sigma_{n}^{2}\big/\kappa_n;\nu_n,\sigma_{n}^{2}\big)

    其中后验参数由以下公式计算:

    μn=κ0κ0+nμ0+nκ0+nyκn=κ0+nνn=ν0+nνnσn2=ν0σ02+(n1)s2+κ0nκ0+n(yμ0)2\begin{aligned} \mu_{n} &= \frac{\kappa_{0}}{\kappa_{0}+n}\mu_{0}+\frac{n}{\kappa_{0}+n}\overline{y}\\ \kappa_{n} &= \kappa_{0}+n\\ \nu_{n} &= \nu_{0}+n\\ \nu_{n}\sigma_{n}^{2} &= \nu_{0}\sigma_{0}^{2}+(n-1)s^{2}+\frac{\kappa_{0}n}{\kappa_{0}+ n}(\overline{y}-\mu_{0})^{2} \end{aligned}

  • 条件与边缘后验:

    • 条件后验:

      μσ2,yN(μn,σ2/κn)\mu|\sigma^2,y\sim N(\mu_n, \sigma^2/\kappa_n)

    • 边缘后验:

      σ2y Invχ2(νn,σn2)μytνn(μμn,σn2/κn)\sigma^{2}|y \sim\ \mathrm{Inv-}\chi^{2}(\nu_{n},\sigma_{n}^{2}) \quad \text{和} \quad \mu|y\sim t_{\nu_{n}}(\mu|\mu_{n},\sigma_{n}^{2}/\kappa_{n})

  • 后验预测分布: 对新观测 y~\tilde{y} 的预测分布服从 t分布。

    y~ytνn(μn,κn+1κnσn2)\tilde{y} |y \sim {t}_{\nu_n}\left(\mu_{n},\frac{\kappa_{n}+1}{\kappa_{n}}\sigma_{n}^{2}\right)