******* **
学 号:耳朵神经痛 ********12
专业班级: 应用统计18
院 系: 信息工程学院数学系
时 间: 2017/5/22
题目:对苏格兰异性结婚数据的时序分析
摘要:
本文以苏格兰1855年至2015年异性结婚数据为研究对象,首先运用R软件对1855-2010年的结婚数据绘制时序图、自相关图和做差分进行相关分析,得出一阶差分后的数据是趋于平稳的,然后根据主观确定拟合模型为,并运用R软件里面的函数进行模型的自动选择,得出模型即模型最优,故我们所选择的拟合模型是最优的,最后运用模型预测并进行预测残差检验,得出了苏格兰2011-2015年异性结婚数据的预测值(29200.45,28905.94,28905.94,28905.94,28905.94)与实际值(29135,30534,27547,28702,28020)相比,相差不大,这说明模型拟合较好,能反映数据的真实水平,而且残差检验也表明预测残差是平均值为0且方差为常数的正态分布(服从零均值、方差不变的正态分布),这进一步说明模型是可以提供非常合适预测的模型。
关键词:苏格兰;函数;函数;R软件;预测
二、数据来源
不陵节而施之谓孙
本文的数据是1855-2015年苏格兰的结婚数据(Marriages, Scotland, 1855 to 2015 ),数据可以从网上(v.uk/statistics-and-data/statistics/statistics-by-theme/vital-events/marriages-and-civil-partnerships/marriages-time-ries-data)下载,数据见附件一。
谢谢妈妈
芋头汤三、模型的定阶与确定
3.1模型的定阶
3.1.1序列预处理[1]
首先,我们对苏格兰1855年至2010年的时间序列进行时序图和自相关分析,分析结果如图3.1.1.1和图3.1.1.2所示,程序见附录一。
图3.1.1.1 苏格兰1855年至2010年异性结婚数据的时序图
图3.1.1.2 苏格兰1855年至2010年异性结婚数据的自相关图
图3.1.1.1显示苏格兰的结婚数值的均值和方差变动很大,随着时间的增加,具有明显的上升趋势,是典型的非平稳序列。
图3.1.1.2显示该序列的自相关系数都超出了两倍标准误差,所以进一步证明了该序列是非平稳的。
综上所述,该序列是非平稳序列。
对于该非平稳时间序列,首先我们对数据进行1阶差分处理,以便消除其具有的强烈的趋势性,来观察数据是否大致趋于平稳。因此得到的1阶差分时间序列图如下:
图3.1.1.3 苏格兰1855年至2010年异性结婚数据1阶差分后的时序图
从图3.1.1.3中我们可以看出,经过1阶差分后,该序列的平均值和方差是大致平稳的,所以我们使用ARMIA(p,1,d)模型是很合适的。通过一阶差分,我们去除了结婚数据的趋势部分,剩下了不规则部分。接下来我们可以检验不规则部分中邻项数数值是否具有相关性;如果有的话,可以帮助我们建立一个预测模型来预测苏格兰异性结婚数据的数值趋势。
3.1.2平稳性检验
由图3.1.1.3可以认为该序列一阶差分后,序列基本平稳,为了进一步判断其平稳性,考察差分序列的自相关图和偏自相关图,如图五和图六所示。
品牌管理体系图3.1.2.1自相关图显示延迟2阶、3阶、4阶和5阶时的自相关值超出了2倍标准差范围,但是其他在延迟1-25阶的自相关系数都落入2倍标准差范围以内,从而判断该序列有很强的短期相关性,是2阶截尾,所以可以初步认为1qq炸弹阶差分后序列平稳。
图3.1.2.2偏自相关图显示,在延迟2阶和4阶时的偏自相关系数超出了2倍标准差范围,从lag4之后缩小至0,是4阶截尾,该序列趋于平稳。
综上所述,我们可以认为该序列的一阶差分序列自相关图2阶截尾和偏自相关图4阶截尾。
图3.1.2.1 该序列一阶差分后的自相关图
图3.1.2.2 该序列一阶差分后的偏自相关图
3.1.3纯随机性检验
为了判断序列是否有分析价值,必须对序列进行纯随机性检验,即白噪声检验。如表3.1.3.1所示,P值远远小于0.05的临界值,因此,拒绝原假设,即可以认定1阶差分后的序列是平稳非白噪声序列,需要建立模型来拟合该序列的变化趋势。
豆沙吐司表3.1.3.1 纯随机性检验
代码 | st(datariesdiff1,type="Ljung-Box",lag=30); |
Box-Ljung test |
Data: | Datariesdiff1 |
| X-squared=83.411 | Df=30 | P-value=6.313e-07 |
指定交易 | | | |
3.2模型确定
3.2.1根据阶数确定模型
由该序列一阶差分的自相关图和偏自相关图,知道自相关值在滞后2阶之后为0,且偏自相关值在滞后4阶之后缩小至0,那么意味着接下来的ARIMA模型对于一阶时间序列有如下性质:
1、模型:即偏自相关值在滞后4阶之后缩小至0且自相关值缩小至0,则是一个阶层p=4自回归模型。
2、模型:即自相关图在滞后2阶之后为0且偏自相关图缩小至0,则是一个阶数q=2的移动平均模型。