# 概览与背景

在时间序列分析中,序列的记忆性通常通过其自相关函数(ACF)的衰减速度来衡量。

  • 短记忆序列:对于 I(0)I(0) 序列,ACF 以指数(几何)速率衰减。这意味着远离当前时间的序列值与当前值近似独立。
  • 长记忆序列:对于 I(1)I(1) 序列,ACF 衰减速度非常慢,以线性速率衰减,导致远离当前时间的序列值与当前值并非独立。
  • 分数阶积分序列I(d)I(d) 分数阶积分序列介于短记忆和长记忆之间。其 ACF 以多项式速率衰减,表明远离当前时间的序列值与当前值存在微弱但非零的相关性,这就是长记忆性的来源。

# 分数阶积分过程

# ARFIMA(0,d,0)ARFIMA(0,d,0) 模型

分数阶积分白噪声序列 yty_t 可由以下方程定义:

(1B)dyt=εt, εtWN(0,σ2)(1-B)^dy_t=\varepsilon_t,~\varepsilon_t\sim WN(0,\sigma^2)

其中,(1B)d(1-B)^d 可通过伯努利展开得到:

(1B)d=k=0Γ(kd)Γ(d)Γ(k+1)Bk(1-B)^d=\sum_{k=0}^\infty\frac{\Gamma(k-d)}{\Gamma(-d)\Gamma(k+1)}B^k

根据 dd 的取值,该模型具有不同性质:

  • d=0d=0 时,该模型简化为白噪声过程。
  • d=1d=1 时,该模型为随机游走。
  • d<0.5d<0.5 时,该过程是弱平稳的,具有 MA()MA(\infty) 形式:

    yt=εt+i=1ψiεtiy_t=\varepsilon_t+\sum_{i=1}^\infty\psi_i\varepsilon_{t-i}

    其中,ψk=Γ(k+d)Γ(d)Γ(k+1)\psi_k=\frac{\Gamma(k+d)}{\Gamma(d)\Gamma(k+1)}
  • d>0.5d>-0.5 时,该过程是可逆的,具有 AR()AR(\infty) 形式:

    yt=i=1πiyti+εty_t=\sum_{i=1}^\infty\pi_iy_{t-i}+\varepsilon_t

    其中,πk=Γ(kd)Γ(d)Γ(k+1)\pi_k=\frac{\Gamma(k-d)}{\Gamma(-d)\Gamma(k+1)}

0.5<d<0.5-0.5<d<0.5 的情况下:

  • 自相关系数(ACF)

    ρk=Γ(k+d)Γ(1d)Γ(1+kd)Γ(d)\rho_k=\frac{\Gamma(k+d)\Gamma(1-d)}{\Gamma(1+k-d)\Gamma(d)}

    特别地,ρ1=d/(1d)\rho_1=d/(1-d)。对于较大的 kk 值,ρk\rho_k 近似满足:

    ρkΓ(1d)Γ(d)k2d1k2d1\rho_k\approx\frac{\Gamma(1-d)}{\Gamma(d)}k^{2d-1}\propto k^{2d-1}

    这表明 ACF 趋近于 0 的速度取决于 dd
  • 偏自相关系数(PACF)ϕkk=d/(kd)\phi_{kk}=d/(k-d)

# ARFIMA(p,d,q)ARFIMA(p,d,q) 模型

自回归分数阶积分移动平均模型 ARFIMA(p,d,q)ARFIMA(p,d,q) 可由 AR(p)AR(p)MA(q)MA(q) 过程的结合来定义:

(1B)dyt=ut, utARMA(p,q)(1-B)^dy_t=u_t,~u_t\sim ARMA(p,q)

即:

ϕ(B)(1B)dyt=θ(B)εt\phi(B)(1-B)^dy_t=\theta(B)\varepsilon_t

该模型的谱密度为:

fy(λ)=σ22πθ(eiλ)2ϕ(eiλ)21eiλ2df_y(\lambda)=\frac{\sigma^2}{2\pi}\frac{|\theta(e^{-i\lambda})|^2}{|\phi(e^{-i\lambda})|^2}|1-e^{-i\lambda}|^{-2d}


# 慢变函数与正则变函数

# 慢变函数

函数 L(u)L(u) 在无穷远处是慢变函数,当且仅当:

  1. 存在一个常数 cc,使得 L(u)>0L(u)>0 对所有 u[c,]u\in[c,\infty] 成立。
  2. 对于任意的 a>0a>0,满足 limuL(au)L(u)=1\lim_{u\to\infty}\frac{L(au)}{L(u)}=1
    常见的例子包括 L(u)=const>0L(u)=const>0L(u)=logu, u>0L(u)=\log u,~u>0
    函数 L(u)L(u) 在 0 处是慢变函数,当且仅当 L(1/u)L(1/u) 在无穷远处是慢变函数。

# 正则变函数

函数 R(u)R(u) 在无穷远处是以指数 ρR\rho\in R 正则变,当且仅当它可以表示为 R(u)=uρL(u)R(u)=u^\rho L(u),其中 L(u)L(u) 是在无穷远处的一个慢变函数。
函数 R(u)R(u) 在 0 处是正则变函数,当且仅当 R(1/u)R(1/u) 在无穷远处是正则变函数。


# 长程依赖

# 定义

长程依赖(Long-Range Dependence, LRD)通常要求序列是弱平稳的,且分数阶积分参数 dd 满足 d(0,1/2)d\in (0,1/2)。长程依赖有多种等价定义:

  • 定义 1(线性表示):存在线性表示 Xn=μ+k=0ψkZnkX_n=\mu+\sum_{k=0}^\infty\psi_kZ_{n-k},其中 ZWN(0,σZ2)Z\sim WN(0,\sigma_Z^2)ψk=L1(k)kd1\psi_k=L_1(k)k^{d-1},且 L1L_1 是无穷远处的慢变函数。

  • 定义 2(自协方差函数 ACVF):序列的自协方差函数 γ(k)\gamma(k) 满足 γ(k)=L2(k)k2d1\gamma(k)=L_2(k)k^{2d-1},其中 L2L_2 是无穷远处的慢变函数。

  • 定义 3(绝对可和性):自协方差函数不是绝对可和的,即 k=γ(k)=\sum_{k=-\infty}^\infty|\gamma(k)|=\infty

  • 定义 4(谱密度):序列的谱密度 f(λ)f(\lambda) 满足 f(λ)=L4(λ)λ2df(\lambda)=L_4(\lambda)\lambda^{-2d},其中 L4L_4 是 0 处的慢变函数。

  • 定义 5(方差):序列的部分和方差满足 var(X1++Xn)=L5(n)n2d+1var(X_1+\cdots+X_n)=L_5(n)n^{2d+1},其中 L5L_5 是无穷远处的慢变函数。或者,样本均值的方差满足 var(Xˉn)=L5(n)n2d1var(\bar{X}_n)=L_5(n)n^{2d-1}

# 定义间关系

这些定义之间存在密切联系:定义 1 蕴含定义 2;定义 2 与定义 4 等价;定义 4 蕴含定义 3;定义 3 与定义 5 等价。

# 自相似性

自相似性指时间序列在经过压缩或拉伸后,其“统计形状”保持不变。一个序列 X(t)X(t) 满足 X(ct)=cHX(t)X(ct)=c^HX(t),则称其为 HH-自相似的,其中 HH 为自相似指数。例如,布朗运动的 H=0.5H=0.5

# Lamperti 变换

Lamperti 变换建立了自相似过程与严平稳过程之间的联系:

  • 如果 X(t)X(t) 是自相似的,那么 Y(t)=etHX(et)Y(t)=e^{-tH}X(e^t) 是严平稳的。
  • 反之,如果 Y(t)Y(t) 是严平稳的,那么 X(t)=tHY(logt), t0X(t)=t^HY(\log t),~t\ge0 是自相似的。