# 层次模型概述
层次模型,或称分层模型,是一种贝叶斯统计模型,常用于处理具有分层结构的数据。它通过引入超参数来描述参数的先验分布,从而在不同组之间共享信息。
分析步骤:
-
定义模型结构:
- 似然: 确定数据 y 的分布 p(y∣θ,ϕ)。通常,数据 y 属于不同的组,每组数据 yj 依赖于各自的参数 θj。
- 参数分布: 定义各组参数 θj 的先验分布 p(θ∣ϕ),该分布依赖于超参数 ϕ。这使得参数 θ 之间通过 ϕ 相互关联,实现了信息共享。
- 超参数先验: 为超参数 ϕ 赋予一个先验分布 p(ϕ)。
-
写出联合后验分布:
联合后验分布是模型中所有参数和超参数的联合概率,它与先验分布和似然的乘积成正比:
p(θ,ϕ∣y)∝p(ϕ)p(θϕ)p(y∣θ,ϕ)=p(ϕ)p(θϕ)p(y∣θ)=p(ϕ)p(θϕ)i∏p(yi∣θi)
-
推断后验分布:
- 超参数的边缘后验:
超参数 ϕ 的边缘后验分布可以通过对联合后验分布中的参数 θ 进行积分得到:p(ϕ∣y)=∫p(θ,ϕ∣y)dθ
此外,也可以利用条件概率公式来推导:p(ϕ∣y)=p(θ∣ϕ,y)p(θ,ϕ∣y)
但在使用此方法时,需要计算 p(θ∣ϕ,y) 的归一化常数,这通常需要利用已知的分布特性。
- 参数的条件后验:
在给定超参数 ϕ 和数据 y 的情况下,参数 θ 的条件后验分布为:p(θ∣ϕ,y)∝p(θ,ϕ∣y)
# 超参数先验的选取
选择合适的超参数先验是层次模型建模的关键。
- 保证边缘后验的合理性: 所选取的先验应确保超参数的边缘后验分布 p(ϕ∣y) 是有意义的,即其积分有限。在检查先验分布时,需要特别关注其在无穷大处以及其他特定点(例如边界点)的行为,以避免积分发散。
- 参数变换: 对于具有范围限制的超参数,可以通过变换将其映射到 (−∞,+∞) 的实数范围,从而更容易地赋予先验分布。
- 对于范围在 (0,+∞) 的超参数,可以使用对数变换:log(ϕ)。
- 对于范围在 (0,1) 的超参数,可以使用 Logit 变换:logit(ϕ)=log1−ϕϕ。
- 赋予可解释的先验: 可以对超参数进行进一步分解,并为每个部分赋予独立的先验,以增强模型的可解释性。例如,可以分别对先验均值和先验样本量赋予独立的先验分布。
# 可交换性
定义:
可交换性(Exchangeability)是指在多组参数或数据中,它们的联合分布在任意两个参数或数据进行交换后保持不变。
p(⋯,θi,⋯,θj,⋯)=p(⋯,θj,⋯,θi,⋯), ∀i,j
可交换性与独立性:
对层次建模的影响:
- 对称性: 在层次建模中,如果除了数据 y 之外,没有其他信息可以用来区分、排序或分组各个参数 θj,那么在先验分布中必须假设这些参数是对称的,即它们是可交换的。
- 非对称性: 如果存在可区分的信息,则不应假设参数可交换,并应在先验分布中反映这种非对称性。
# 后验预测分布
后验预测分布用于对新数据或新组进行预测。其计算过程是边缘化(积分)模型中的所有参数和超参数。
对已有组的参数和预测进行推断:
- 已有组中某组的参数后验边缘分布:
p(θj∣y)=∫p(θj,ϕ∣y)dϕ=∫p(θj∣ϕ,yj)p(ϕ∣y)dϕ=Eϕ∣yp(θj∣ϕ,yj)
- 已有组中某组的预测后验分布:
对已有组中的新数据 y~j 进行预测:p(y~j∣y)=∫p(y~j,θ,ϕ∣y)dθdϕ=∫p(y~j∣θj)p(θj∣ϕ,yj)p(ϕ∣y)dθjdϕ=Eϕ∣yEθj∣ϕ,yjp(y~j∣θj)
注意: p(y~j∣θj,yj) 与 yj 无关,因为 y~j 是在给定参数 θj 后的新样本,与同组已有的 yj 相互独立。然而,p(θj∣ϕ,yj) 依赖于 yj,因为 yj 提供了关于 θj 的信息。
对新组的参数和预测进行推断:
- 新组的参数后验边缘分布:
对于一个新的、没有数据的组,其参数 θnew 的后验分布:p(θnew∣y)=∫p(θnew,ϕ∣y)dϕ=∫p(θnew∣ϕ)p(ϕ∣y)dϕ=Eϕ∣yp(θnew∣ϕ)
注意: p(θnew∣ϕ,y) 与 y 无关,因为 θnew 代表了与现有数据 y 同簇但不同组的参数,在给定超参数 ϕ 后,与 y 相互独立。
- 新组的预测后验分布:
对新组的新数据 y~new 进行预测:p(y~new∣y)=∫p(y~new,θ,ϕ∣y)dθdϕ=∫p(y~new∣θnew)p(θnew∣ϕ)p(ϕ∣y)dθnewdϕ=Eϕ∣yEθnew∣ϕp(y~new∣θnew)