# 概览与背景
在时间序列分析中,序列的记忆性通常通过其自相关函数(ACF)的衰减速度来衡量。
- 短记忆序列:对于 I(0) 序列,ACF 以指数(几何)速率衰减。这意味着远离当前时间的序列值与当前值近似独立。
- 长记忆序列:对于 I(1) 序列,ACF 衰减速度非常慢,以线性速率衰减,导致远离当前时间的序列值与当前值并非独立。
- 分数阶积分序列:I(d) 分数阶积分序列介于短记忆和长记忆之间。其 ACF 以多项式速率衰减,表明远离当前时间的序列值与当前值存在微弱但非零的相关性,这就是长记忆性的来源。
# 分数阶积分过程
# ARFIMA(0,d,0) 模型
分数阶积分白噪声序列 yt 可由以下方程定义:
(1−B)dyt=εt, εt∼WN(0,σ2)
其中,(1−B)d 可通过伯努利展开得到:
(1−B)d=k=0∑∞Γ(−d)Γ(k+1)Γ(k−d)Bk
根据 d 的取值,该模型具有不同性质:
在 −0.5<d<0.5 的情况下:
- 自相关系数(ACF):
ρk=Γ(1+k−d)Γ(d)Γ(k+d)Γ(1−d)
特别地,ρ1=d/(1−d)。对于较大的 k 值,ρk 近似满足:ρk≈Γ(d)Γ(1−d)k2d−1∝k2d−1
这表明 ACF 趋近于 0 的速度取决于 d。
- 偏自相关系数(PACF):ϕkk=d/(k−d)。
# ARFIMA(p,d,q) 模型
自回归分数阶积分移动平均模型 ARFIMA(p,d,q) 可由 AR(p) 和 MA(q) 过程的结合来定义:
(1−B)dyt=ut, ut∼ARMA(p,q)
即:
ϕ(B)(1−B)dyt=θ(B)εt
该模型的谱密度为:
fy(λ)=2πσ2∣ϕ(e−iλ)∣2∣θ(e−iλ)∣2∣1−e−iλ∣−2d
# 慢变函数与正则变函数
# 慢变函数
函数 L(u) 在无穷远处是慢变函数,当且仅当:
- 存在一个常数 c,使得 L(u)>0 对所有 u∈[c,∞] 成立。
- 对于任意的 a>0,满足 limu→∞L(u)L(au)=1。
常见的例子包括 L(u)=const>0 或 L(u)=logu, u>0。
函数 L(u) 在 0 处是慢变函数,当且仅当 L(1/u) 在无穷远处是慢变函数。
# 正则变函数
函数 R(u) 在无穷远处是以指数 ρ∈R 正则变,当且仅当它可以表示为 R(u)=uρL(u),其中 L(u) 是在无穷远处的一个慢变函数。
函数 R(u) 在 0 处是正则变函数,当且仅当 R(1/u) 在无穷远处是正则变函数。
# 长程依赖
# 定义
长程依赖(Long-Range Dependence, LRD)通常要求序列是弱平稳的,且分数阶积分参数 d 满足 d∈(0,1/2)。长程依赖有多种等价定义:
-
定义 1(线性表示):存在线性表示 Xn=μ+∑k=0∞ψkZn−k,其中 Z∼WN(0,σZ2),ψk=L1(k)kd−1,且 L1 是无穷远处的慢变函数。
-
定义 2(自协方差函数 ACVF):序列的自协方差函数 γ(k) 满足 γ(k)=L2(k)k2d−1,其中 L2 是无穷远处的慢变函数。
-
定义 3(绝对可和性):自协方差函数不是绝对可和的,即 ∑k=−∞∞∣γ(k)∣=∞。
-
定义 4(谱密度):序列的谱密度 f(λ) 满足 f(λ)=L4(λ)λ−2d,其中 L4 是 0 处的慢变函数。
-
定义 5(方差):序列的部分和方差满足 var(X1+⋯+Xn)=L5(n)n2d+1,其中 L5 是无穷远处的慢变函数。或者,样本均值的方差满足 var(Xˉn)=L5(n)n2d−1。
# 定义间关系
这些定义之间存在密切联系:定义 1 蕴含定义 2;定义 2 与定义 4 等价;定义 4 蕴含定义 3;定义 3 与定义 5 等价。
# 自相似性
自相似性指时间序列在经过压缩或拉伸后,其“统计形状”保持不变。一个序列 X(t) 满足 X(ct)=cHX(t),则称其为 H-自相似的,其中 H 为自相似指数。例如,布朗运动的 H=0.5。
# Lamperti 变换
Lamperti 变换建立了自相似过程与严平稳过程之间的联系:
- 如果 X(t) 是自相似的,那么 Y(t)=e−tHX(et) 是严平稳的。
- 反之,如果 Y(t) 是严平稳的,那么 X(t)=tHY(logt), t≥0 是自相似的。