# 模型设定与假设
简单线性回归模型(SLR)用于描述一个因变量 与一个自变量 之间的线性关系。
-
模型参数:
其中 是截距, 是斜率。
-
模型假设 (LINE):
- Linear: 线性关系,即模型形式正确。
- Independent: 误差项独立,即 与 相互独立。
- Normal: 误差项服从正态分布,即 。
- Equal variance: 误差项方差相等,即所有 的方差均为 。
- 综合上述假设,误差项 独立同分布于 。
# 参数估计
-
最小二乘法 (OLS):
最小二乘法的目标是找到使残差平方和最小的参数估计值 和 。通过对上式求导并令其为零,可以得到参数的估计值:
-
最大似然法 (MLE):
在误差项服从正态分布的假设下,最大似然法的目标是找到使似然函数最大的参数估计值。最大似然估计值与最小二乘估计值相同:
方差的估计值为:
# 模型性质与方差分析
-
残差性质:
- 残差之和为零:
- 残差与自变量 独立:
- 残差与拟合值 独立:
- 回归线过均值点:
-
方差性质:
- 残差平方和 (SSE) 的无偏估计:
其中 是自由度。
- 是 的无偏估计,即 。
- 自变量均值 与斜率估计值 的协方差为零:。
# 参数检验
# 斜率 的检验
-
斜率估计值 的分布:
其中 。
在模型假设下, 服从正态分布: -
假设检验:
检验假设为 。构造 统计量:其中 的估计值 的方差为 。
注意: ,因此 。为了使斜率估计值的方差最小,需要尽可能增大 。 -
置信区间:
可以利用 分布构造 的置信区间:
# 截距 的检验
-
截距估计值 的分布:
的估计值 的方差为 。
-
假设检验:
检验假设为 。构造 统计量:注意: 除非 有实际意义,否则 的检验通常不重要。
# 相关系数 的检验
当 服从二元正态分布时,可以用相关系数 检验 。
-
与 的关系:
其中 是样本相关系数, 和 分别是 和 的样本标准差。
-
假设检验:
检验假设为 。构造 统计量:
# 联合检验与功效检验
-
与 的联合检验:
可以通过多元统计分析中的 Bonferroni 修正进行,即将显著性水平 分配给两个检验,如 。 -
的功效 (Power) 检验:
功效检验用于确定在备择假设成立时,拒绝原假设的概率。该统计量服从非中心 分布:
其中非中心参数为 。
# 其他概念
-
BLUE (Best Linear Unbiased Estimator):
在模型假设下,最小二乘估计量 和 是最佳线性无偏估计量。这意味着在所有无偏的线性估计量中,它们的方差最小。该结论的证明可参考多元回归的情况。 -
R 语言中的应用:
lm()
: 用于拟合线性模型。lines()
,abline()
: 用于在图中添加回归线。qqnorm()
,qqline()
: 用于绘制正态 Q-Q 图,检验残差的正态性。