# 传统分析方法
# 季节性时间序列的构成与分解
季节性时间序列 yt 通常可以分解为三个部分:趋势项 Pt、季节项 St 和随机误差项 et。
yt=Pt+St+et
其中,Pt 代表序列的长期趋势, St 代表序列在固定周期内的重复模式,而 et 则代表无法被趋势和季节性解释的随机波动。
# 回归方法
回归分析是分解季节性时间序列的一种常用方法。它将序列 yt 建模为趋势项和季节项的函数。
yt=(α0+i=1∑mαiUit)+(j=1∑kβjVjt)+et
其中,趋势项 Pt 和季节项 St 可以采用不同的形式进行建模:
- 多项式趋势项: Pt 可以用 m 阶多项式表示,用来拟合数据的长期变化趋势。
Pt=α0+i=1∑mαiti
- 指示变量季节项: St 可以用指示变量(也称虚拟变量)的线性组合表示,用来捕捉不同季节效应。
St=j=1∑s−1βjDjt, Djt=It∈Sea(j)
其中,It∈Sea(j) 是一个指示函数,当时间 t 处于第 j 个季节时为1,否则为0。
- 周期函数季节项: St 也可以用周期函数(例如正弦和余弦函数)表示,适用于季节性模式呈现平滑周期变化的情况。
St=j=1∑[s/2]βjsin(2πjt/s)+γjcos(2πjt/s)
# 移动平均方法
移动平均方法的核心思想是,通过对时间序列进行平滑处理,可以消除或显著减弱其季节性成分。这种方法假设在一年内对季节性时间序列求和后,季节性信息会相互抵消。
# SARIMA 模型
# Box-Jenkins 乘积季节性 ARIMA 模型
季节性自回归积分移动平均模型(SARIMA)是传统 ARIMA 模型的扩展,专门用于处理具有季节性的时间序列数据。它通常表示为 ARIMA(p,d,q)×(P,D,Q)s。
ΦP(Bs)ϕp(B)(1−B)d(1−Bs)Dy˙t=θq(B)ΘQ(Bs)εt
其中:
- B 是后移算子(backshift operator),Bkyt=yt−k。
- y˙t=yt−μ(若 d=D=0),否则为 yt。
- (p,d,q) 是非季节性部分的参数:
- ϕp(B)=1−ϕ1B−⋯−ϕpBp 为非季节性 AR 因子。
- (1−B)d 为非季节性 差分 算子。
- θq(B)=1−θ1B−⋯−θqBq 为非季节性 MA 因子。
- (P,D,Q)s 是季节性部分的参数,其中 s 代表季节性周期:
- ΦP(Bs)=1−Φ1Bs−⋯−ΦPBPs 为季节性 AR 因子。
- (1−Bs)D 为季节性 差分 算子。
- ΘQ(Bs)=1−Θ1Bs−⋯−ΘQBQs 为季节性 MA 因子。
# 航空模型(ARIMA(0,1,1)×(0,1,1)12 模型)
航空模型是一种著名的 SARIMA 模型,常用于月度航空乘客数据。它是一个 ARIMA(0,1,1)×(0,1,1)12 模型,其表达式为:
(1−B)(1−B12)yt=(1−θB)(1−ΘB12)εt
这个模型包含了非季节性一阶差分 (1−B) 和季节性周期为12的一阶差分 (1−B12),同时还有非季节性一阶移动平均项 (1−θB) 和季节性一阶移动平均项 (1−ΘB12)。
# ACF 与 PACF
自相关函数(ACF)和偏自相关函数(PACF)是分析时间序列数据的重要工具。通过计算和观察季节性时间序列的 ACF 和 PACF 图,可以帮助我们识别非季节性和季节性差分阶数 (d,D),以及模型的自回归和移动平均阶数 (p,q,P,Q)。