第四章 非平稳时间序列模型 第三节 协整cointegration
一.概念
多数情况下, 2个I(1)过程的线性组合成为一个 I(1)过程。一般来说, 对不同阶数的单整过程进行线性组合, 将得到一个阶数等于该组合中的最高阶单整过程阶数的过程. i.e., 如果 Xi,t I(di) for i = 1,2,3,...,k
i1
则 zt I(max di)——不过这并不是绝对的,协整情况是个例外。
整理上个方程, 得
ztiXi,tk 其中
X1,tiXi,tz'ti2k
zii,z'tt,i2,...,k11
如果使用数据对其OLS回归,所有的Xi都是I(1)的话,误差
项: zt将是非平稳的,而且是序列相关的,可能出现伪回归.
要使回归有意义,必须保证误差项为 I(0). 在什么情况下误差项为 I(0)?
协整的定义 (Engle & Granger, 1987)
zt 为 k1 向量,称 zt 中的元素为 (d,b)阶协整—记作CI(d,b),如果, i) zt 中所有元素都为 I(d) ii) 至少存在一个参数向量 使得 zt I(d-b)
常用的是,d=b=1,即 zt 中的变量本来是 I(1) 的,存在 使得 zt 变成 I(0) 的。换言之,如果 I(1) 变量之间是协整的,那么它们的一个线性组合将会是平稳的.
协整关系可以看作是一种长期关系. 许多时间序列是非平稳的,但是他们具有相同的运动趋势.
例:教材中的19章图1
例:Log Real Stock Price and Dividad Senis, Annual US Data, 1872 to 1994
如果两个变量都是单整I(d)变量,只有当它们的单整阶数d相同时,才可能协整;如果它们的单整阶数不相同,就不可能协整。
不过,三个以上的变量,即使具有不同的单整阶数,也有可能协整。例如,如果存在:
Wt~I(1),Vt~I(2),Ut~I(2)
并且
PtaVtbUt~I(1)QtcWtePt~I(0)那么,
Vt,Ut~CI(2,1)Wt,Pt~CI(1,1)
二.协整和均衡
在金融中很多情况下可能存在协整关系,例如:
– 即期价格和期货价格 – 相对价格比率和汇率 – 股票的价格和分红
在金融市场上的无套利条件确保了上述均衡关系的存在. 不存在协整意味着序列会到处漫游,而不存在长期的共同的关系.
一般用协整来研究资产的价格 (不是资产的收益率)。当资产的价格是随机游走时,在一段时间之后该价格可以到达任何位置, 因为随机游走的无条件方差是无穷大。所以对单一资产的价格建模没有意义, 对将来价格的最好预测就是今天的价格.
但是,对2个或多个资产的价格建立协整模型却是有意义的,因为我们可以通过协整发现关于价格系统中长期均衡的信息。
协整与相关是有联系但又不相同的概念。高度相关并不意味着高度协整, 高度协整也不意味着高度相关。相关在本质上是对短期关系的一种度量,而协整是对长期关系的度量。例如,建立在协整分析之上的套期保值从长远来说比建立在传统的相关分析之上的更加有效.
第四节 误差修正模型( ECM )
一.误差修正模型
对于非平稳时间序列,可通过差分的方法将其化为平稳序列,然后才可建立回归分析模型。
如:建立人均消费水平(Y)与人均可支配收入(X)之间的OLS回归模型:
Yt01Xtt
如果二者都非平稳,差分
Yt1Xtvt,其中vt= t- t-1
这样保证OLS统计量的良好性质。然而,这种做法会引起两个问题:
(1) 如果X与Y间存在着长期稳定的关系,
Yt=0+1Xt+t
且误差项t不存在序列相关,则差分式
Yt=1Xt+t
中的t是一个一阶移动平均时间序列,因而是序列相关的;
(2) 如果采用差分形式进行估计,则关于变量水平值的重要信息将被忽略,这时模型只表达了X与Y间的短期变化量之间关系,而没有揭示它们间的长期关系。
因为从长期均衡的观点看,Y在第t期的变化不仅取决于X本身的变化,还取决于X与Y在t-1期末的状态,尤其是X与Y在t-1期的不平衡程度。
解决这个问题的一个方法是建立误差修正模型( ECM )。误差修正模型(Error Correction Model,简记为ECM)是由Davidson、 Hendry、Srba和Yeo于1978年提出的,称为DHSY模型。通过一个具体的模型来介绍它的结构。 假设两变量X与Y的长期均衡关系为:
Yt=0+1Xt+t
由于现实经济中X与Y很少处在均衡点上,却不会偏离均衡关系太远,因此假设具有如下分布滞后形式
Yt01Xt2Xt1Yt1t
该模型显示出第t期的Y值,不仅与X的变化有关,而且与t-1期X与Y的状态值有关。
由于变量可能是非平稳的,因此不能直接运用OLS法。对上述分布滞后模型适当变形得
Yt01Xt(12)Xt1(1)Yt1t0121Xt(1)YXt1t11t1
其中
1 00(1) 1(12)(1)
表明:Y的变化决定于X的变化以及前一时期的偏离均衡的幅度。同时,这也弥补了简单差分模型Yt=1Xt+t的不足,因为该式含有用X、Y水平值表示的前期非均衡程度。Y的值已对前期的非均衡程度作出了修正。
Yt1Xt(Yt101Xt1)t
称为误差修正模型(error correction model)。括号中的项称为误差修正项——ecm
(1)若(t-1)时刻Y大于其长期均衡解0+1X,ecm为正,则(-ecm)为负,使得Yt减少;
(2)若(t-1)时刻Y小于其长期均衡解0+1X ,ecm为负,则(-ecm)为正,使得Yt增大。
在实际分析中,变量常以对数的形式出现。于是: (1)长期均衡模型
Yt=0+1Xt+t
中的1可视为Y关于X的长期弹性(long-run elasticity) (2)短期非均衡模型
Yt=0+1Xt+2Xt-1+Yt-1+t
中的1可视为Y关于X的短期弹性(short-run elasticity)。 在误差修正模型中,短期弹性与长期弹性可一并估计获得。
二.Engle-Granger 协整检验
Granger表示定理(Granger's representation theorem)证明:任何一种协整关系都可以用误差修正模型来表示.
误差纠正模型可以扩展到多个变量的情形: yt = 1 + 2x2t + 3x3t + … + kxkt + ut 如果变量 yt, x2t, ... xkt 协整的话,ut 将是 I(0).
Engle 和 Granger (1987) 给出了相应的临界值,所以该检验也被称为 Engle Granger (E.G.) 检验. 该协整关系检验的假设为
H0 : 协整回归的残差存在单位根 H1 :协整回归的残差是平稳的
Engle Granger 2 步法 步骤t 1: 第1步实质是一个OLS回归估计
- 使用DF之类的检验方法,确保回归中每个变量都是 I(1).
- 运用OLS回归. 例如,对于两个变量的情形
yt = 1 + 2xt + ut
ˆt. 检验uˆt,确保其是I(0). - 保存回归中的残差u需要注意是,对残差估计值的平稳性检验,即,做如下回
归
tut1vt with vt iid. uˆt的检验,该检验的临界值与前面这是一个对模型残差估计值u的会有所不同(也可以使用 Durbin Watson 检验方法来检验的
非平稳性)。
直观上看,这里的DF或ADF检验是针对协整回归
yt = 1 + 2xt + ut
ˆt而非真正的误差项ut进行检验。OLS回归的误差项估计值uˆt是个平稳过程,也就是,拒绝零假设(单中,更倾向于得到u位根)的机会比实际情形大。于是,于是对
ˆtu平稳性检验的DF
与ADF临界值应该比正常的临界值还要偏左(小)。
MacKinnon(1991)通过模拟给出了残差协整检验的临界值,下表是双变量情形下的临界值(与样本容量有关)。
表9.3.1 双变量协整ADF检验临界值 样本容量 25 50 100 ∝ 0.01 -4.37 -4.12 -4.01 -3.90 显 著 性 水 平 0.05 -3.59 -3.46 -3.39 -3.33 0.10 -3.22 -3.13 -3.09 -3.05
步骤 2:
- 用步骤 1 的残差作为误差纠正模型(ECM)的变量 e.g.
ˆt1+ ut yt = 1xt + 2uˆt-1yt-1-ˆxt-1 Where uE-G方法的第2步得到的结果便是误差修正模型。
例子1:购买力平价的检验关系
对购买力平价的偏离部分写作(真实汇率):
对美国价格水平的单位根检验(ADF)
(最后一句翻译有误,应为“无协整关系的零假设被接受”) 实际汇率zt的脉冲反应函数
脉冲反应函数持续很久还不衰减到0,也说明数据的不平稳性。
例1:中国居民消费的误差修正模型 中国居民实际消费支出(C);国民收入(GDP) 时间段为1978~2000
(1)对数据lnC与lnGDP进行单整检验
容易验证lnC与lnGDP是I(1)的,它们适合的检验模型如下(小括号中是t值):
2 lnCt0.0560.744lnCt1 (2.76) (-3.23) LM(1)=0.929 LM(2)=1.121 2lnGDPt0.131.54lnGDPt10.812lnGDPt10.592lnGDPt20.582lnGDPt3
(-4.01)
(2)检验lnC与lnGDP的协整性,并建立长期均衡关系 建立lnC与lnGDP的回归模型
lnCt0.0470.923lnGDPt
(0.30)(57.48)
R2=0.994 DW=0.744
发现有残关项有较强的一阶自相关性。考虑加入适当的滞后项,得lnC与lnGDP的分布滞后模型
lnCt0.1520.698lnGDPt0.622lnCt10.361lnGDPt1 (1.63) (6.62) (4.92) (-2.17)
R2=0.994 DW=1.92 残差项的稳定性检验
ˆt0.9975eˆt1 e(-4.32)
R2=0.994 DW=2.01 t=-4.32<-3.=ADF0.05
说明lnC与lnGDP是协整的,即它们存在长期稳定的均衡关系:
lnCt0.1520.698lnGDPt0.622lnCt10.361lnGDPt1
(3)以上期的残差作为自变量,建立误差修正模型
ˆt1lnCt0.686lnGDPt0.784lnCt10.484lnGDPt11.163e (-3.15)
R2=0.994 DW=2.06
——结果并不理想,不过这例子论证了模型的建立过程 例2:现期和远期价格之间的长期关系(见ppt)
Engle-Granger 方法的缺点 该方法有以下问题: 1. 在有限样本下功效低
2. 处理多个变量之间的协整关系时,面临困惑 事实上,如果g 为变量的总数,则最多可能存在 r( r g-1)个协整关系.
3. 无法对协整关系进行假设检验. - 问题1会随着样本增大而消失.
- 问题 2和问题3可以用 Johansen 方法解决.
问题2的说明。如果只有2个变量, y 和 x, 则 r 是1或0. 但是在多个变量情况下,可能有多个协整关系存在. 如果有多个协整关系存在的话,应该怎么选择?
假设有4个I(1)变量Z、X、Y、W,它们有如下的长期均衡关系:
Zt01Wt2Xt3Ytt
其中误差项t
tZt01Wt2Xt3Yt
应是I(0)序列。 然而,如果Z与W,X与Y间分别存在长期均衡关系:
Zt01Wtv1t Xt01Ytv2t
则非均衡误差项v1t、v2t 是稳定序列I(0)。于是它们的任意线性组合也是稳定的。例如
vtv1tv2tZt001WtXt1Yt
于是,(1, -0,-1,-2,-3)和(1,-0-0,-1,1,-1)都是协整向量。
然而,无论选择哪个变量在方程的左侧被解释变量,都只能估计出一种协整向量。经验上,有人通过设置一个变量为被解释变量,其他变量为解释变量,进行OLS估计并检验残差序列是否平稳。如果不平稳,则需更换被解释变量,进行同样的OLS估计及相应的残差项检验。当所有的变量都被作为被解释变量检验之后,仍不能得到平稳的残差项序列,则认为这些变量间不存在协整。然而这种方法似乎并没有统计学理论依据。
三.Johansen 协整检验
VAR表达式 考虑 VAR形式
yt =1 yt-1 + 2 yt-2 +...+ k yt-k + ut g×1 g×g
将其改写为ECM形式,为
yt = yt-k + 1 yt-1 + 2 yt-2 + ... + k-1 yt-(k-1) + ut
其中jI, ijI
j1j1ki 是一个长期关系矩阵。 另一种ECM形式:
yt = yt-1 +ρ1 yt-1 +ρ2 yt-2 + ... +ρ其中jI, ij
j1ji1kkk-1 yt-(k-1) + ut
例如:
yt =1 yt-1 + 2 yt-2 + ut
可以写为:yt = (12I)yt-1 -2yt-1 +ut
关于矩阵的秩
令 为 gg 矩阵,c 为 g1 非零向量,为标量. 被称为特征根(特征值),如果满足以下条件 c = c gg g1 g1 即
( - Ig ) c = 0 其中 Ig 为单位矩阵.
因为c 0, 所以该系统有非零解。记是矩阵 的特征根
- Ig = 0
矩阵的秩等于该矩阵中线性的行或列的数目,也等于非零的特征根的数目,例如:
5124
的特征根为 = 6 和 = 3。的秩为2
一个对称矩阵A的特征值有以下的性质: 1. 特征值的和为迹(trace)
2. 特征值的乘积等于矩阵行列式的值 3. 非零特征值的数目等于矩阵的秩
Johansen检验 yt = yt-k + 1 yt-1 + 2 yt-2 + ... + k-1 yt-(k-1) + ut y 之间有多少种协整关系依赖于矩阵 的秩——协整关系的数目等于秩的数目,即非零特征值的数目。
称作长期关系矩阵。因为,均衡时所有y=0,如果残差项也设定在其期望值上,ut=0,则有 yt-k=0;或者说,方程中,如果其他变量都是平稳的,则 yt-k也应该是平稳的。
把特征值按大小排序 i (i 是非负的):
1 2 ... g
如果变量不是协整的, 的秩将不会显著异于0, 所以所有特征根 i = 0. 如果 i = 0,则 ln(1-i) = 0 如果 为根,则它小于1.
如果特征值 i 是非零的, 则 ln(1-i) < 0. 例如,如果 rank () = 1, 那么ln(1-1)将是负的且 ln(1-i) = 0 i > 1
Johansen 检验统计量 检验的特征根是否为0 1. 迹统计量
ˆ)trace(r)Tln(1iir1g
2. 最大特征根统计量
)max(r,r1)Tln(1r1
trace 检验的零假设是协整向量的数目小于或等于 r,备择假设
是协整向量的数目大于r.
max 检验的零假设是协整向量的数目为r,备择假设是协整向量的数目为r+1.
Johansen & Juselius (1990) 提供了这 2个统计量的临界值. 如果统计量大于临界值则拒绝零假设, 即拒绝存在r 个协整向量而倾向于存在多于 r个协整向量.
零假设检验的序列为 r = 0, 1, ..., g-1 所以对 trace 有 H0: r = 0 vs H1: 0 < r g H0: r = 1 vs H1: 1 < r g H0: r = 2 vs H1: 2 < r g ... ... ... H0: r = g-1 vs H1: r = g
直到不能拒绝零假设.
协整关系的数目为何与的秩相对应?
r 是 的秩——即中线性的行(列)的数目 如果 的秩为零,即=0,则不存在协整关系. 如果 是满秩的,则意味着 yt 是平稳的。想一想,为什么?(矩阵可逆当且仅当它是满秩矩阵!)
如果 1 < rank () < g , 则存在多个——rank ()=r个——协整向量。将分解写为:
= '
g.g g.r r.g性质:rank(AB)=min(rank(A), rank(B)). 若rank ()=r,则 '两矩阵的秩都是r。
是误差修正系数,例如4*4矩阵,'是协整向量。
秩为1,则可以写作:
12 = '= 311114yt = yt-1 + 1 yt-1 + 2 yt-2 + ... + k-1 yt-(k-1) + ut 的右侧第一项:
y1,tk1y2,tk2ytk = '=1 2 3 43y3,tk4y4,tk12+ 2y2,tk+ 3y3,tk+ 4y4,tk31y1,tk4
所以,
y1,t1(1y1,tk+ 2y2,tk+ 3y3,tk+ 4y4,tk)....y2,t2(1y1,tk+ 2y2,tk+ 3y3,tk+ 4y4,tk)....y3,t3(1y1,tk+ 2y2,tk+ 3y3,tk+ 4y4,tk)....y4,t4(1y1,tk+ 2y2,tk+ 3y3,tk+ 4y4,tk)....或者写为标准化形式,
y1,t11(y1,tk+ M
例:见ppt
2y2,tk+ 3y3,tk+ 4y4,tk)....111