5.4k5 分钟

# 概述:为什么贝叶斯推断需要采样 在贝叶斯推断中,我们面临的主要挑战是计算的复杂性。无论是参数的后验分布 p(θ∣y)p(\theta \mid y)p(θ∣y) 还是后验预测分布 p(y~∣y)p(\tilde{y} \mid y)p(y~​∣y),它们通常都没有封闭形式的解析解,这使得直接进行精确计算变得极其困难。此外,后验分布 p(θ∣y)∝p(θ)p(y∣θ)p(\theta \mid y) \propto p(\theta)p(y \mid \theta)p(θ∣y)∝p(θ)p(y∣θ) 往往是非归一化的,进一步加大了计算难度。 蒙特卡洛方法为解决这些问题提供了有效的途径。它的核
6.9k6 分钟

# 预测准确度 # 单点预测 当只预测一个单一值时,可以使用以下指标衡量模型的预测准确度: 均方误差(MSE, Mean Squared Error) mse=1n∑i=1n(yi−E⁡(yi∣θ))2mse = \frac{1}{n}\sum_{i=1}^{n}(y_{i}-\operatorname{E}(y_{i}|\theta))^{2} mse=n1​i=1∑n​(yi​−E(yi​∣θ))2 MSE 衡量预测值与真实值之间的平方差的均值,目标是最小化 MSE。 加权均方误差(WMSE, Weighted Mean
3k3 分钟

# 基本概念与方法 # 贝叶斯模型检查的核心问题 在贝叶斯分析中,模型检查旨在回答两个基本问题: 所使用的模型是否准确地描述了数据? 后验推断对模型假设的敏感度如何? 贝叶斯分析的一般流程包括:构建概率模型、计算参数的后验分布、评估模型对数据和先验知识的拟合程度,并据此改进模型。模型检查是这一流程中至关重要的一个环节。 # 敏感性分析 在实际科学问题中,可能存在多个合理的模型,它们都对数据有良好的拟合。这些模型可能在先验设定、抽样分布或包含的信息上存在显著差异。敏感性分析的核心在于评估,当使用不同的合理概率模型时,后验推断会发生多大变化。 一个理想化的模型检查方法是构建一个包含所有可能“真
4.1k4 分钟

# 层次模型概述 层次模型,或称分层模型,是一种贝叶斯统计模型,常用于处理具有分层结构的数据。它通过引入超参数来描述参数的先验分布,从而在不同组之间共享信息。 分析步骤: 定义模型结构: 似然: 确定数据 yyy 的分布 p(y∣θ,ϕ)p(y|\theta, \phi)p(y∣θ,ϕ)。通常,数据 yyy 属于不同的组,每组数据 yjy_jyj​ 依赖于各自的参数 θj\theta_jθj​。 参数分布: 定义各组参数 θj\theta_jθj​ 的先验分布 p(θ∣ϕ)p(\theta|\phi)p(θ∣ϕ),该分布依赖于超参数 ϕ\phiϕ。这使得参数 θ\thetaθ 之间通过
3.6k3 分钟

# 联合分布采样 有多种方法可以从联合分布中进行采样,主要包括: ECDF (经验累积分布函数): F^(x,y)=1m∑i=1mI(xi≤x,yi≤y)→F(x,y){\hat{F}}(x,y)={\frac{1}{m}}\sum_{i=1}^{m}I(x_{i}\leq x,y_{i}\leq y)\to F(x,y) F^(x,y)=m1​i=1∑m​I(xi​≤x,yi​≤y)→F(x,y) 当样本量 mmm 趋近于无穷时,经验累积分布函数 F^(x,y)\hat{F}(x,y)F^(x,y) 会收敛到真实的累积分布函数
3k3 分钟

# 常见概率分布 # 正态分布 一元正态分布 p(y∣μ,σ2)=12πσe−12σ2(y−μ)2p(y|\mu,\sigma^{2})=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{1}{2\sigma^{2}}(y-\mu)^{2}} p(y∣μ,σ2)=2π​σ1​e−2σ21​(y−μ)2 多元正态分布 p(y∣μ,Σ)∝∣Σ∣−1/2exp⁡(−12(y−μ)TΣ−1(y−μ))p(y|\mu,\Sigma)\propto|\Sigma|^{-1/2}\exp\left(-\frac{1}{2}(y
5.1k5 分钟

# 常见分布 二项分布 p(y∣θ)=Bin(y∣n,θ)=(ny)θy(1−θ)n−yp(y|\theta)=\mathrm{Bin}(y|n,\theta)={\binom{n}{y}}\theta^{y}(1-\theta)^{n-y} p(y∣θ)=Bin(y∣n,θ)=(yn​)θy(1−θ)n−y 正态分布(固定方差) p(y⃗∣θ)∝exp⁡(−12σ2∑i=1n(yi−θ)2)p(\vec{y}|\theta)\propto\exp\left({-\frac{1}{2\sigma^{2}}\sum_{
1.4k1 分钟

# 假设条件检查 进行因子 ANOVA 之前,需要对以下几个关键假设进行诊断: 独立性:这是最重要的假设,如果违反将严重影响结果。 方差齐性:即各组的方差相等。当进行成对比较(pairwise comparison)时,该假设的违反会产生较大影响。但如果数据是平衡的(各组样本量相等),则 ANOVA 对方差不齐的鲁棒性会增加。 正态性:即残差服从正态分布。该假设最不重要,因为许多 ANOVA 方法对非正态性是鲁棒的。值得注意的是,非正态性通常由异方差(heteroscedasticity)引起。 # 诊断方法 # 独立性诊断 时间序列独立性:通过分析时间序列数据来检查独立性。 正自相关
4.5k4 分钟

# 符号表示与模型假设 # 符号表示 YijkY_{ijk}Yijk​:在因子 A 的第 iii 个水平和因子 B 的第 jjj 个水平组成的单元格(cell)中,第 kkk 个观测值。 nijn_{ij}nij​:单元格 (i,j)(i, j)(i,j) 的样本量。 # 模型假设 双因子方差分析(ANOVA)模型通常基于以下假设: 独立同分布:所有观测值是独立的。 正态性:每个单元格内的观测值服从正态分布。 同方差性:所有单元格的总体方差是相等的,即 σ2\sigma^2σ2。 平衡设计:每个单元格的样本量相等,即 nij=nn_{ij} = nnij​=
4.9k4 分钟

# 概述 单因子方差分析(One-way ANOVA)是一种统计方法,用于比较两个或多个组(或称因子水平)的平均值是否存在显著差异。 变量类型: 响应变量 (Y):连续变量。 因子 (X):离散变量,其每个可能取值被称为一个水平 (level)。 分析目标: 关注不同因子水平下响应变量的平均值是否存在差异。 核心步骤: 检验不同因子水平的平均响应是否相同。 如果不同,进一步分析差异的大小及其统计与实际意义。 # 模型假设 为了使单因子方差分析有效,数据需要满足以下核心假设: 独立性: 每个因子水平下的响应变量是从其相应的概率分布中独立随机抽取的,且不同因子水平的响应之间也相互