你可以迅速上手的时间序列分析教程stata专版
目录
第一部分 经典论文分析
第二部分 ARIMA模型以及stata操作实例
(1)ARMA模型分析原理
(2)ADL模型分析原理
(3)stata实例操作
第三部分 VAR模型以及stata操作实例
时间序列是指以固定时间为间隔的、由所观察的值组成的序列。根据观测值的不同频率,可将时间序列分成小时、天、星期、月份、季度和年等时间形式的序列。有时候,你也可以将秒钟和分钟作为时间序列的间隔,如每分钟的点击次数和访客数等等。
为什么我们要对时间序列进行分析呢?因为当你想对一个序列进行预测时,首先要完成分析这个步骤。除此之外,时间序列的预测也具有极大商业价值,如企业的供求量、网站的访客量以及股票价格等,都是极其重要的时间序列数据。
早期的单变量时间序列模型有较少的参数却可以得到非常精确的预测,因此随着Box and Jenkins(1984)等奠基性的研究,时间序列方法得到迅速发展。从单变量时间序列到多元时间序列模型,从平稳过程到非平稳过程,时间序列分析方法被广泛应用于经济、气象和过程控制等领域。本章将介绍如下时间序列分析方法,ARIMA模型、ARCH族模型、VAR模型、VEC模型、单位根检验及协整检验等。
第一部分 经典论文分析
在全球人口增长和气候变化的背景下,监测农作物是维持农业的必要条件保护自然资源。许多研究已经证明了光学和合成孔径雷达的能力遥感数据估计作物参数,这些数据没有经过比较或组合预测作物物候期。尽管SAR极化数据对作物物候期高度敏感,但没有研究使用了高时间分辨率的数据。免费提供的SAR时间序列为每周以高空间分辨率监测作物物候提供了一个独特的机会基础。
第二部分 ARIMA模型以及stata操作实例
(1)ARMA模型分析原理
对于AR(p)模型,其ACF函数拖尾,而PACF函数截尾。如果出现这种情形,则可判断其为AR(p),不包含移动平均的部分。另一方面,对于MA(q)模型,其ACF函数截尾,而PACF函数拖尾。如果出现这种情形,则可判断其为MA(q),不包含自回归的部分。如果以上两种情形均不符合,即ACF函数与PACF函数都拖尾①,则要考虑一般的ARMA(p,q)模型,其中p,q均不为零时间序列分析的鼻祖,Box, Jenkins andReinsel(1994)认为,对大多数情况,p≤2与q≤2就足够了。当然,为了保险起见,可以让Pmax与qm更大些。具体如何确定p,q,可以依据信息准则或由大到小的序贯t规则。在估计完模型之后,仍然需要进行一些诊断性分析( diagnosticchecking),以确定ARMA(p,q)模型的假定是否成立。其中,最重要的假定是,扰动项{ }为白噪声。如果模型过小(inadequate),即p<p或q<q,则相当于遗漏解释变量。这些被遗漏的解释变量被纳入扰动项中,导致扰动项出现自相关,不再是白噪声。为此,可以使用Q检验来检验模型的残差是否存在自相关。如果残差存在自相关,则应考虑使模型更大些(增加自回归或移动平均的阶数),重新对模型进行估计,然后再检验新模型的残差是否为白噪声,如此反复,直至确认残差为白噪声。
(2)ADL模型分析原理
如果自回归分布滞后模型满足以下假定,则万事大吉,可以用OLS来估计它。E(y1-1yt-2, ,x1,t-1,1,-2,,x1-1,xk,t-2,…)=0。这个假定类似于严格外生性假设,它意味着扰动项ε,与所有解释变量的整个历史全部无关。这保证了对滞后期数(p,91,…,9K)的设定是正确的。如果滞后期数的设定不正确,比如,真实模型还应该包括:
(i) y-(p+1),但该项p+1y-(p+1)却被纳入扰动项ε,中,则扰动项ε,便与解释变量相关,导致OLS不一致。
(ii) {y1,x1,…,x}为渐近独立的平稳序列。
(iii) {y,,x1,…,x}有非零的有限四阶矩。
(iv) 解释变量无完全多重共线性。
对滞后期数的选择可以使用信息准则(最小化AIC或BIC),或使用t,F检验来检验最后一期系数的显著性。更一般地,可以在ARMA模型中引入其他变量,称为“ARMAX”模型。
(3)stata实例操作
**自相关与偏自相关
**计算第1至第#阶ACF与PACF,以及检验自相关的Q统计量
corrgram,lags(#)
**将ACF画成自相关图,并给出置信区间
ac y , lags(#)
**将PACF画成偏自相关图,并给出置信区间
pac y ,lags(#)
**ARMA模型
arima y , ar(1/#)ma(1/#)
**选择项“ar(1/#)”表示第1至第#阶自回归,而“ma(#)”表示第1至第#阶移动平均。
**ARMA的另一等价命令格式为
arima y, arima (#p,#d,q#)
** #p表示自回归的阶数,q#表示移动平均的阶数,而#d表示原序列{y}需要经过几次差分才是平稳过程。下面检验其残差项是否存在自相关:
**计算残差,并将其命名为e1
predict el,res
**检验残差是否存在第1至第#阶自相关的Q检验
corrgram el,lags(#)
**ADL与 ARMAX
**ARMAX的 Stata命令为
arima y x1 x2 x3,ar(#)ma(#)
下面以数据集 pe dta为例。该数据集的主要变量 logpe为18712002年美国标准普尔股指(S&P)的市盈率(price earning ratio)对数。由于 logpe为非平稳序列,故对其差分建立ARMA模型。首先,定义其一阶差分为“d_logpe”:
use pe.dta,cleartwoway (line logpe year)twoway (line logpe year) (qfitci logpe year)
**绘制logpe一阶差分折线图
twoway (line logpe year) (line d_logpe year)
**计算第1至第10阶ACF与PACFcorrgram d_logpe,lags(10)
第四阶的Q统计量较为显著,P为0.0556,进一步可以观察自相关和偏相关图
**将ACF画成自相关图,并给出置信区间
ac d_logpe ,lags(10)
**将PACF画成偏自相关图,并给出置信区间
pac d_logpe,lags(10)
从上面两个图可以看出,第4阶自相关与偏相关系数均在5%水平显著的部位0,因而可以认为4阶以上的自相关与偏相关系数为0,由于自相关与偏相关系数均截尾,分别考虑AR(4)和MA(4)。
**估计AR(4)arima d_logpe,ar (1/4) nolog**计算信息准则estat ic**检验残差是否存在自相关predict e1 ,rescorrgram e1 ,lags(10)**估计MA(4)arima d_logpe,ma (1/4) nolog**计算信息准则estat ic**检验残差是否存在自相关predict e2 ,rescorrgram e2,lags(10)
第三部分 VAR模型以及stata操作实例
use varexample.dta,clear
tsline inflation fedfunds unrate,xline(169)
summarize inflation fedfunds unrate
**根据信息准则确定VAR模型的阶数
varsoc inflation fedfunds unrate ,maxlag(13)
var inflation fedfunds unrate ,lags(1/5)**检验各阶系数的联合显著性varwle**检验残差是否自相关varlmar**检验VAR系统是否稳定varstable,graph
**检验VAR残差是否股从正态分布
varnorm
**VAR模型预测fcast compute f_,step(40)fcast graph f_inflation f_fedfunds f_unrate ,observed 1pattern('_')
**变量之间的格兰杰因果关系
vargranger
**进一步考察交叉相关图
xcorr inflation unrate if date <= tq (2002q1),name(iu)
xcorr inflation fedfunds if date <= tq (2002q1),name(if)
xcorr unrate fedfunds if date <= tq (2002q1),name(uf)
graph combine iu if uf
**交叉相关系数列表xcorr inflation unrate if date <= tq (2002q1),table**脉冲响应函数irf creat iuf ,set (macrovar) step (20)**绘制正交脉冲响应图irf graph oirf ,yline(0)**变量的预测误差方差irf table fevd ,r(inflation) noci**变量的预测误差方差分解图irf graph fevd ,r(inflation)**所有预测方差分解图irf graph fevd**根据方差分解结果图推荐的变量顺序,建立新的脉冲响应结果irf create ifu ,order (inflation fedfunds unrate) step(20)**比较以上两种变量顺序,inflation对fedfunds的脉冲响应irf graph oirf,i(fedfunds) r(inflation) yline(0) noci**比较两种变量排序,unrate对fedfunds的脉冲响应比重irf graph fevd,i(fedfunds) r(inflation)noci
经典论文题目:
Evaluation of Sentinel-1 & 2 timeseries for predicting wheat and rapeseed phenological stages
经典论文链接:
https://www.sciencedirect.com/science/article/pii/S0924271620300794