应 用 时 间 序 列 分 析 实 验 报 告 实验名称 第三章 平稳时间序列分析 一、上机练习 data example3_1; input x; bapitime=_n_; cards; ; proc gplot data=example3_1; plot xtime=1; symbol c=red i=join v=star; 椅子的英语单词run; 建立该数据集,绘制该序列时序图得: 根据所得图像,对序列进行平稳性检验;时序图就是一个平面二维坐标图,通常横轴表示时间,纵轴表示序列取值;时序图可以直观地帮助我们掌握时间序列的一些基本分布特征; 根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界的特点;如果观察序列的时序图,显示出该序列有明显的趋势性或周期性,那它通常不是平稳序列;从图上可以看出,数值围绕在0附近随机波动,没有明显或周期,其本可以视为平稳序列,时序图显示该序列波动平稳; proc arima data=example3_1; identify var=x nlag=8;charcoal filter run; 图一 图二 样本自相关图 图三 样本逆自相关图 图四 样本偏自相关图 图五 纯随机检验图 实验结果分析: 1由图一我们可以知道序列样本的序列均值为,标准差为,观察值个数为84个; 2根据图二序列样本的自相关图我们可以知道该图横轴表示自相关系数,综轴表示延迟时期数,用水平方向的垂线表示自相关系数的大小;我们发现样本自相关图延迟3阶之后,自相关系数都落入2倍标准差范围以内,而且自相关系数向衰减的速度非常快,延迟5阶之后自相关系数即在值附近波动;这是一个短期相关的样本自相关图;所以根据样本自相关图的相关性质,可以认为该序列平稳; 3根据图五的检验结果我们知道,在各阶延迟下LB检验统计量的P值都非常小<,所以我们可以以很大的把握置信水平>%断定该序列样本属于非白噪声序列; proc arima data=example3_1; identify var=x nlag=8 minic p= 0:5 q=0:5; run; IDENTIFY命令输出的最小信息量结果 某个观察值序列通过序列预处理,可以判定为平稳非白噪声序列,就可以利用ARMA模型对该序列建模;建模的基本步骤如下: A:求出该观察值序列的样本自相关系数ACF和样本偏自相关系数PACF的值; B:根据样本自相关系数和偏自相关系数的性质,选择适当地ARMAp,q模型进行拟合; C:估计模型中未知参数的值; D:检验模型有效性;如果拟合模型不通过检验,转向步骤B,重新选择模型再拟合; E:模型优化;如果拟合模型通过检验,仍然转向步骤B,充分考虑各种可能,建立多个拟合模型,从所有通过检验中选择最优模型; F:利用拟合模型,预测序列的将来走势; 为了尽量避免因个人经验不足导致的模型识别问题,SAS系统还提供了相对最优模型识别;最后一条信息显示,在自相关延迟阶数小于等于5,移动平均延迟阶数也小于等于5的所有ARMRp,q模型中,BIC信息量相对最小的是ARMR0,4模型,即MA4模型; 需要注意的是,MINIC只给出一定范围内SBC最小的模型定阶结果,但该模型的参数未必都能通过参数检验,即经常会出现MINIC给出的模型阶数依然偏高的情况; estimate q=4; run; 本例参数估计输出结果显示均值MU不显著t的检验统计量的P值为,其他参数均显著t检验统计量的P值均小于,所以选择NOINT选项,除去常数项,再次估计未知参数的结果,即可输入第二条ESTIMATE命令: estimate q=4 noint; run; 参数估计部分输出结果如图六所示: 图六 ESTIMATE命令消除常数项之后的输出结果 显然四个未知参数均显著; 拟合统计量的值 这部分输出五个统计量的值,由上到下分别是方差估计值、标准差估计值、AIC信息量、SBC信息量及残差个数,如图七所示: 图七 ESTIMATE命令输出的拟合统计量的值 系数相关阵 这部分输出各参数估计值的相关阵,如图八所示: 图八 ESTIMATE命令输出的系数相关阵 残差自相关检验结果 这部分的输出格式图九和序列自相关系数白噪声检验部分的输出结果一样;本例中由于延迟各阶的LB统计量的P值均显著大于aa=,所以该拟合模型显著成立; 图九 ESTIMATE命令输出的残差自相关检验结果 拟合模型的具体形式 ESTIMATE命令输出的拟合模型的形式 序列预测 forecast lead=5 id=time out=results; run; 其中,lead是指定预测期数;id是指定时间变量标识;out是指定预测后的结果存入某个数据集; 该命令运行后输出结果如下: FORECAST命令输出的预测结果 该输出结果从左到右分别为序列值的序号、预测值、预测值的标准差、95%的置信下限、95%的置信上限; 利用存储在临时数据集RESULTS里的数据,我们还可以绘制漂亮的拟合预测图,相关命令如下: proc gplot data=results; plot xtime=1 forecasttime=2 l95time=3 u95time=3/overlay; symbol1 c=black i=none v=start; symbol2 c=red i=join v=none; symbol3 c=green i=join v=none l=32; run; 输出图像如下: 拟合效果图 新淘金者注:图中,S号代表序列的观察值;连续曲线代表拟合序列曲线;虚线代表拟合序列的95%上下置信限; 所谓预测就是要利用序列以观察到的样本值对序列在未来某个时刻的取值进行估计;目前对平稳序列最常用的预测方法是线性最小方差预测;线性是指预测值为观察值序列的线性函数,最小方差是指预测方差达到最小;在预测图上可以看到,数据围绕一个范围内波动,即说明未来的数值变化时平稳的; 南京蛋糕培训学校二、课后习题 第十七题:根据某城市过去63年中每年降雪量数据单位:mm得:书本P94 程序: data example17_1; input x; time=_n_; cards; 25 79 58 83 97 110 ; proc初中一年级英语单词 gplot data=example17_1; plot xtime=1; symbol c=red i=join v=star; run; proc arima data=example17_1; identify var=x nlag=15 minic p= 0:5 q=0:5; run; estimate p=1; run; estimate p=1 noin; run; forecast lead=5 id=time out=results; run; proc gplot data=results; plot xtime=1 forecasttime=2 l95time=3 u95time=3/overlay; symbol1 c=black i=none v=start; symbol2 c=red i=join v=none; symbol3 c=green i=join v=none l=32; run; 1判断该序列的平稳性与纯随机性 该序列的时序图如下图a 图a 由时序图显示过去63年中每年降雪量数据围绕早70mm附近随机波动,没有明显趋势或周期,基本可以看成平稳序列,为了稳妥起见,做了如下自相关图图b 图b 时序图就是一个平面二维坐标图,通常横轴表示时间,纵轴表示序列取值;时序图可以直观地帮助我们掌握时间序列的一些基本分布特征;根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界的特点;如果观察序列的时序图,显示出该序列有明显的趋势性或周期性,那它通常不是平稳序列; 样本的自相关图我们可以知道该图横轴表示自相关系数,综轴表示延迟时期数,用水平方向的垂线表示自相关系数的大小;我们发现样本自相关图延迟2阶之后,自相关系数都落入2倍标准差范围以内, 自相关图显示该序列自相关系数一直都比较小,1阶开始控制在2倍的标准差范围以内,可以认为该序列自始自终都在零轴附近波动,这是随即性非常强的平稳时间序列; 纯随机性检验见下图:图c 图c 根据图c的检验结果我们知道,在6阶延迟下LB检验统计量的P值显著小于,所以我们可以以很大的把握置信水平>95%断定这个拟合模型的残差序列属于非白噪声序列; 2如果序列平稳且非白躁声,选择适当模型拟合该序列的发展; 模型识别如下图图d 图d 假如某个观察值序列通过序列预处理,可以判定为平稳非白噪声序列,就可以利用ARMA模型对该序列建模;建模的基本步骤如下: 1:求出该观察值序列的样本自相关系数ACF和样本偏自相关系数PACF的值; 2:根据样本自相关系数和偏自相关系数的性质,选择适当地ARMAp,q模型进行拟合; 3:估计模型中未知参数的值; 4:检验模型有效性;如果拟合模型不通过检验,转向步骤B,重新选择模型再拟合; 5:模型优化;如果拟合模型通过检验,仍然转向步骤B,充分考虑各种可能,建立多个拟合模型,从所有通过检验中选择最优模型; 6:利用拟合模型,预测序列的将来走势; 最后一条信息显示,在自相数迟阶数小于等于5,移动平均延迟阶数也小于等于5的所有ARMAp,q模型中,BIC信息量相对最小的是ARMA1,0模型,既AR1模型;它们的自相关系数都呈现出拖尾性和呈指数衰减到零值附近的性质;自相关系数是按负指数单调收敛到零; 利用拟合模型,预测该城市未来5年的降雪量. 由2可以知道该模型是AR1模型; 预测结果如下图图e 由图得未来564-68年的降雪量分别为、、、、; 18. 某地区连续74年的谷物产量单位:千吨 data example18_1; input x; time=_n_; cards; ; proc gplot data=example18_1; plot xtime=1; symbol c=red i=join v=star; run; proc arima data=example18_1; identify var=x nlag=18 minic p= 0:5 q=0:5; run; estimate q=1; run; forecast lead=5 id=time out=results; run; proc gplot data=results; plot xtime=1 forecasttime=2 l95time=3 u95time=3/overlay; symbol1 c=black i=none v=start; symbol2 c=red i=join v=none; symbol3 c=green i=join v=none l=32; run; 1判断该序列的平稳性与纯随机性 该序列的时序图如下图f 图f 时序图就是一个平面二维坐标图,通常横轴表示时间,纵轴表示序列取值;时序图可以直观地帮助我们掌握时间序列的一些基本分布特征;根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界的特点;如果观察序列的时序图,显示出该序列有明显的趋势性或周期性,那它通常不是平稳序列; 由时序图显示过去74年中每年谷物产量数据围绕早千吨附近随机波动,没有明显趋势或周期,基本可以看成平稳序列,为了稳妥起见,做了如下自相关图图g 图g 样本的自相关图我们可以知道该图横轴表示自相关系数,综轴表示延迟时期数,用水平方向的垂线表示自相关系数的大小;我们发现样本自相关图延迟2阶之后,自相关系数都落入2倍标准差范围以内,自相关图显示该序列自相关系数一直都比较小,1阶开始控制在2倍的标准差范围以内,可以认为该序列自始自终都在零轴附近波动,这是随即性非常强的平稳时间序列; 纯随机性检验见下图:图h 图h 根据图h的检验结果我们知道,在各阶延迟下LB检验统计量的P值显著小于,所以我们可以以很大的把握置信水平>95%断定这个拟合模型的残差序列属于非白噪声序列; 选择适当模型拟合该序列的发展; 如果序列平稳且非白躁声,选折适当模型拟合序列的发展 模型识别如下图图i 图i 假如某个观察值序列通过序列预处理,可以判定为平稳非白噪声序列,就可以利用ARMA模型对该序列建模;建模的基本步骤如下: A:求出该观察值序列的样本自相关系数ACF和样本偏自相关系数PACF的值; B:根据样本自相关系数和偏自相关系数的性质,选择适当地ARMAp,q模型进行拟合; C:估计模型中未知参数的值; D:检验模型有效性;如果拟合模型不通过检验,转向步骤B,重新选择模型再拟合; E:模型优化;如果拟合模型通过检验,仍然转向步骤B,充分考虑各种可能,建立多个拟合模型,从所有通过检验中选择最优模型; F:利用拟合模型,预测序列的将来走势; 最后一条信息显示,在自相数迟阶数小于等于5,移动平均延迟阶数也小于等于5的所有ARMAp,q模型中,BIC信息量相对最小的是ARMA1,0模型,既AR1模型;它们的自相关系数都呈现出拖尾性和呈指数衰减到零值附近的性质;自相关系数是按负指数单调收敛到零; 利用拟合模型,预测该地区未来5年的谷物产量,预测结果如下图图j 由2可知,该模型为AR1模型; 图j 未来5年的谷物产量一次为,,,; 19. 现有201个连续的生产记录 data example19_1; input x; time=_n_; cards; 长沙新东方英语官网 ; proc gplot data=example19_1; plot xtime=1; symbol c=red i=join v=star; run; proc arima data=example19_1; identify var=x nlag=24 minic pbitch的意思= 0:5 q=0:5; run; estimate q=1; run; forecast lead=5 id=time out=results; run; proc gplot data=results; plot xtime=1 forecasttime=2 l95time=3 u95time=3/overlay; symbol1 c=black i=none v=start; symbol2 c=red i=join v=none; symbol3 c=green i=join v=none l=32; run; 1判断该序列的平稳性与纯随机性 该序列的时序图如下图k 图k 由时序图显示过去201个连续的生产记录数据围绕早84附近随机波动,没有明显趋势或周期,基本可以看成平稳序列,为了稳妥起见,做了如下自相关图图l 图l 时序图就是一个平面二维坐标图,通常横轴表示时间,纵轴表示序列取值;时序图可以直观地帮助我们掌握时间序列的一些基本分布特征;根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界的特点;如果观察序列的时序图,显示出该序列有明显的趋势性或周期性,那它通常不是平稳序列; 样本的自相关图我们可以知道该图横轴表示自相关系数,综轴表示延迟时期数,用水平方向的垂线表示自相关系数的大小;我们发现样本自相关图延迟1阶之后,自相关系数都落入2倍标准差范围以内, 自相关图显示该序列自相关系数一直都比较小,1阶开始控制在2倍的标准差范围以内,可以认为该序列自始自终都在零轴附近波动,这是随即性非常强的平稳时间序列; 纯随机性检验见下图:图m 根据图m的检验结果我们知道,在各阶延迟下LB检验统计量的P值显著小于,所以我们可以以很大的把握置信水平>95%断定这个拟合模型的残差序列属于非白噪声序列; 2如果序列平稳且非白躁声,选折适当模型拟合序列的发展 模型识别如下图图n 某个观察值序列通过序列预处理,可以判定为平稳非白噪声序列,就可以利用ARMA模型对该序列建模;建模的基本步骤如下: 1、求出该观察值序列的样本自相关系数ACF和样本偏自相关系数PACF的值; 2、根据样本自相关系数和偏自相关系数的性质,选择适当地ARMAp,q模型进行拟合; 3、估计模型中未知参数的值; 4、检验模型有效性;如果拟合模型不通过检验,转向步骤B,重新选择模型再拟合; 5、模型优化;如果拟合模型通过检验,仍然转向步骤B,充分考虑各种可能,建立多个拟合模型,从所有通过检验中选择最优模型; 6、利用拟合模型,预测序列的将来走势; 最后一条信息显示,在自相数迟阶数小于等于5,移动平均延迟阶数也小于等于5的所有ARMAp,q模型中,BIC信息量相对最小的是ARMA0,1模型,即MA1模型; 利用拟合模型,预测该城市下一时刻95%的置信区间; 由2可得,该模型为MA1模型; 下一时刻95%的置信区间,;奎洛 实验小结:给定一个序列,我们首先应该判断平稳性,如果平稳,再检查是否是纯随机序列,如果序列平稳且非白躁声,选折适当模型拟合序列的发展,选择AR,MA,或ARMA模型,然后可以对该序列进行预测;zzip 三、实验体会 通过本次实验使我掌握了一些对时间序列的处理,运用不同的语句对一个样本序列的平稳性检验和随机性检验,这对我们处理数据有很大的帮助;在生活中我们往往会遇到这样的现象,当我们所得到的样本信息太少,并且没有其他的辅助信息时,通常这种数据结构式没法进行分析的,但是序列平稳性的概念的提出可以有效地解决这个问题;当然,在操作和分析的过程中我也遇到一些不懂的问题,例如在分析随机性时,为什么我们只检验了前6期、前12期和前18期延迟的Q统计量和LB统计量就能直接判断该序列是否是白噪声序列呢为什么我们不用全部都进行延迟检验呢后来,经过网上搜索,知道了如果一个平稳序列短期延迟的序列值之间不存在显著相关关系,通常长期延迟之间就更不会存在显著的相关关系了;在刚做相对最优定价时,我还不知道这个的作用,后来经过多次的练习,需要用到多次之后,我才发现这个是为了避免因个人经验不足导致的模型识别问题,只要我们在IDENTIFY命令中增加一个可选命令MINIC,就可以获得一定范围内的最优模型定阶;通过BIC的信息量,就可以知道选择AR,MA,或ARMA模型,然后可以对该序列进行预测;还有在参数估计的时候,是要确定模型的口径,并对拟合好的模型进行显著性诊断;Eg:SAS的程序语言是estimate q=4;run;如果参数估计输出的结果显示均值MU不显著,其他参数均显著,就需要选择NOINT选项,除去常数项,再次估计未知参数的结果;如果全部显著就不在需要选择NOINT选项;还有了解到一个例子的拟合模型的具体形式,还有进行序列预测,预测该序列未来的趋势走向,还可以通过图像显示出来,方便分析; 进一步了解到时间序列分析在生活中多方面的应用;在应用时间序列分析法进行市场预测时应注意市场现象未来发展变化规律和发展水平,不一定与其历史和现在的发展变化规律完全一致;随着市场现象的发展,它还会出现一些新的特点;因此,在时间序列分析预测中,决不能机械地按市场现象过去和现在的规律向外延伸;必须要研究分析市场现象变化的新特点,新表现,并且将这些新特点和新表现充分考虑在预测值内;这样才能对市场现象做出既延续其历史变化规律,又符合其现实表现的可靠的预测结果; 时间序列分析预测法突出了时间因素在预测中的作用,暂不考虑外界具体因素的影响;时间序列在时间序列分析预测法处于核心位置,没有时间序列,就没有这一方法的存在;虽然,预测对象的发展变化是受很多因素影响的;但是,运用时间序列分析进行量的预测,实际上将所有的影响因素归结到时间这一因素上,只承认所有影响因素的综合作用,并在未来对预测对象仍然起作用,并未去分析探讨预测对象和影响因素之间的因果关系;因此,为了求得能反映市场未来发展变化的精确预测值,在运用时间序列分析法进行预测时,必须将量的分析方法和质的分析方法结合起来,从质的方面充分研究各种因素与市场的关系,在充分分析研究影响市场变化的各种因素的基础上确定预测值; |
本文发布于:2023-06-14 10:34:24,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/fanwen/fan/90/144624.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |