2⽓象统⽅法复习思考题
《⽓象统计⽅法》复习要点及思考题
1、 ⽓候变化上通常说的异常,可以⽤ 距平这个基本统计量来描述,它反映数据偏离平均值(⽓候态)
的状况,把资料处理成该统计量的形式,叫做资料的中⼼化。
2、 距平是指要素偏离平均值(⽓候态)的状况,把资料处理为距平的⽅法叫中⼼化。
3、 如果⼀⽉南京⽓温的标准差⽐北京⼩,说明⼀⽉南京⽓温变化幅度⽐北京⼩,预报较为容易。
4、 对资料进⾏标准化可以消除单位量纲不同造成的影响,其表达式为x
t zt s x x x -=
,标准化以后资
料的均⽅差为1,平均值是_0_。
5、 频率表是⽤来描述 状态资料的统计特征的。
6、 ⼀元线性回归分析中回归系数b 与相关系数r 之间的关系为b=lxy/lxx,r=lyy(1-r2)
7、 多元线性回归中常采⽤最⼩⼆乘法求回归系数。
8、 滑动平均是趋势拟合技术最基础的⽅法,它相当于低通滤波器。 9、 最后⼀个累积距平值为 0 。
10、 复相关系数是衡量⼀个变量和 多个变量之间的线性关系程度的量。 11、
变量场X 表⽰为 ,则第i 个特征向量对变量X
的⽅差贡献为 ,前P 个特征向量对变量场的累积⽅差贡献为 。
12、 对上题中的变量场X ,当 m>>n 时在实际计算中通常需进⾏时空转换。 13、 相关系数的绝对值越⼤,表⽰变量之间关系
越 密切(紧密)。
14、 在事件B 已经发⽣的条件下计算事件A 的概率,称为事件A 在事件B 已出现条件下的 条件概率。 15、 ⼆分类预报是指只
预报事件A 出现或者不出现,⼜称为正反预报。
16、 在对回归问题进⾏⽅差分析时,预报量的⽅差可以表⽰成_回归⽅差与误差或残差⽅差之和。 17、
⽓象中⼀些⽓象要素,如冰雹、晕、雾等天⽓现象,⽓象资料中仅记录为“有”或“⽆”可⽤“1”或“0”⼆值数字化表征,这类变量可
看成离散型随机变量。对于这种状态要素,可以⽤条件概率选择预报因⼦并且⽤⼆项分布检验预报因⼦的可靠程度。⽓温、⽓
压及降⽔量等⽓象要素,观测值在正、负⽆穷之间,这种类型要素可看成为连续型随机变量。对于这种定量数据要素,主要⽤
相关系数选择预报因⼦或因⼦集,并⽤t_检验⽅法检验其可靠性。
18、 如果序列的__⾃_相关系数为较⼤正值,表明序列具有_⾼持续性_;如果序列的滞后⾃相关系数接
近0或为负值,表明序列⽆持续性。如果两变量本⾝有强持续性或⾼⾃相关,t_检验的⾃由度不能⽤,需要计算有效⾃由度,
取更_严格的标准进⾏相关系数的检验,以免得到虚假的不可靠的相关。
19、 ⽓象变量场EOF 分析是把原变量场分解为空间函数和时间函数两部分,⽤为数较少的不相关的典
型模态,代替原始的⽓候变量场。
20、 利⽤⼀元线性回归⽅法进⾏线性趋势分析中,回归系数b 的符号说明了⽓候变量x 的趋势倾向。
当b>0说明随时间的增加,变量x 是呈(上升或下降)趋势; b 值的⼤⼩反映了上升或下降的速率,b 的绝对值越⼤,表明直
线越(倾斜或平缓)。
21、 检验两地⽓候是否有显qq黑名单 著差异,可针对这两个地区某⽓象资料的平均值和⽅差这两个基本统计量
进⾏显著性检验。
22、 对多要素资料的数据矩阵进⾏分析时,研究变量之间的相互关系,称为R 型分析,⽽研究样本之
1112121
2221
2
n n m m mn x x x x x x x x x
?
=
X
间关系的称为_Q型分析,相应的在系统聚类分析中,也可分为R型聚类和_Q型聚类。
⼆、判断题
1、相关系数是标准化变量的协⽅差。()
2、若相关系数通过显著性检验就说明总体⼀定存在线性相关。()
3、对于⼀元线性回归来说,回归⽅程的检验与相关系数的检验⼀致。()
4、预报量95%的置信区间表⽰真值有95%的概率落在该区间内。()
5、在多元线性回归⽅程中,若某个因⼦对预报量y的作⽤不显著,则它前⾯的系数近似为0。()
6、显著性⽔平 控制了犯“第⼆类错误”(以假为真)的概率。()
三、简答题
1、简述资料正态化的必要性和常⽤的资料正态化处理⽅法。
答:必要性是:各类统计预报模型和统计检验⽅法(Ftux2检验)要求资料桂圆红枣姜茶 是符合正态分布。
年⽉平均⽓温⽓压多⾬地区的⽉降⽔量符合.⽇降⽔和少⾬地区⽉降⽔通常偏态。旬候降⽔不⼀定。
处理⽅法:1、⽴⽅根或四次⽅根;2.双曲正切转换(纠正课本公式)--旬降⽔。3、化为有序数后的正态化转换(标准化和正态
化)
2、简述显著性检验的基本思想。金鹰直播
抽样会产⽣抽样误差,利⽤样本资料进⾏分析时,不能仅凭样本资料的结果就对总体特征做出判断,⽽要鉴别其结果是否为总
体的特征。
⾸先对总体的参数或分布形式做出⼀个假设,然后利⽤样本信息来判断这个假设是否合理。原理是利⽤“⼩概率事件在⼀次试
验中⼏乎是不发⽣的”来接受假设或者否定假设,是⼀种带有概率性质的“反证法”。
在原假设为真时拒绝元假设,称为第⼀类错误(以真为假),其出现的概率通常记作a,原假设为假时接受原假设,称为第⼆类
错误,其出现的概率通常记作B,这种限定犯第⼀类错误的最⼤概率a,不考虑犯第⼆类错误的概率B的检验就称为显著性检
验,概率a称为显著性⽔平。
3、简述利⽤多元线性回归⽅程进⾏预报的步骤。
答:1) 确定预报量并选择恰当的因⼦
2) 根据数据计算回归系数标准⽅程组所包含的有关统计量(因⼦的交叉积、矩阵协⽅差阵或
相关阵,以及因⼦与预报量交叉积向量)
3)解线性⽅程组定出回归系数
4)建⽴回归⽅程并进⾏统计显著性检验
5)利⽤已出现的因⼦值代⼊回归⽅程作出预报量的估计,求出预报值的置信历史上的周瑜 区间
4、逐步回归中逐步剔除法与逐步引⼊法的主要缺点分别是什么?
答:逐步剔除法的主要缺点是计算量很⼤
逐步引⼊法的主要缺点是计算量很⼩,但不⼀定保证最后的⽅程是最优的。
5、请写出多元回归⽅程中预报因⼦数⽬增多的优缺点。
答:优点:⼀般⽽⾔,回归⽅程中包含的因⼦个数越多,回归平⽅和就越⼤,残差平⽅和越⼩,残差⽅差的估计就越⼩,预报值
的置信区间就越⼩,⽅程⼀般也较容易通过检验。
缺点:1、因⼦增多,计算量增⼤,计算时间增多
2、⽅程中若含有对y不起作⽤或作⽤极⼩的因⼦,残差平⽅和不会由于这些变量的增多⽽减少多少,相反
由于Q⾃由度减⼩,残差⽅差估计值增⼤,使预报置信区间估计值增⼤。
3、由于存在对预报量y影响不显著地因⼦,随之带来许多其他与与预报量⽆关的随机因素,影响回归⽅程
的稳定性反⽽使预报效果下降。
1、试举例说明哪些⽅法(不少于三种)可以进⾏⽓候变化趋势分析?
1)线性倾向估计;2)滑动平均;3)⼆次平滑;4)累积距平
2、简述回归分析与相关分析的区别。
答:(1) 相关分析中,变量x 变量y 处于平等的地位;回归分析中,变量y 称为因变量,处在被解释的地位,x 称为⾃变量,⽤
于预测因变量的变化。
(2). 相关分析中所涉及的变量x 和y 都是随机变量;回归分析中,因变量y 是随机
变量,⾃变量x 可以是随机变量,也可以是⾮随机的确定变量。
(3). 相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭⽰变
量x 对变量y 的影响⼤⼩,还可以由回归⽅程进⾏预测和控制。
四、计算分析
1、已知预报量y:长江中下游夏季(6-8⽉)降⽔量,预报因⼦x1 :冬季(12⽉-翌
年2⽉)北太平洋涛动指数;x2:1⽉太平洋地区极涡⾯积指数;x3:5⽉西太平洋
副⾼脊线,样本容量n=44。现建⽴y关于x1、x2、x3的多元回归⽅程,分析结果
如表2所⽰。
1)试写出回归⽅程的表达式,并给出预报值95%的置信区间。
答:由表2,Y=287.435+2.496x1-0.195x2-2.901x3 ;
2)简要说明回归⽅程是否通过显著性检验。设显著性⽔平为0.05。
答:由⽅差分析表,在0.05显著性⽔平下,F值为4.191或P值0.011,通过显
著性检验。
3)试问各预报因⼦是否显著?
4)y与各x因⼦的复相关系数为多少?回归⽅程的判决系数为多少?并简要说明其
代表的意义。
四、计算题
1、试计算变量x、y的简单相关系数,并进⾏显著性检验。已知显著性⽔平 =0.05
下的临界相关系数0.05r = 0.709。
n 1 2 3 4 5 6 7 8 x 10 15 13 17 7 3 1 22 y
-8
3
1
9
4
6
-5
-2
解:x=(10+15+13+17+7+3+1+22)/8=11 y=(-8+3+1+9+4+6-5-2)/8=1 x=-1 y=-9 Sx= 4 2 2 0 6 8 -4 3 -8 5 -10 -6 -11 -3 五、 综合
分析题
第⼀模态⽅差贡献15.5%
1、 请判断图中EOF 分析的对象是原始场、距平场还是标准化距平场?答:是距平场
2、 请给两幅图加上图题。答:图⼀ 中国夏季降⽔异常EOF 分析第⼀模态空间型。图⼆中国
夏季降⽔异常EOF 分析第⼀模态时间系数。 3、 请试分析图中的特征。
答中国夏季降⽔异常EOF 分析第⼀模态空间型主要反映了长江流域与华南及华北地区的降⽔异常的反位相变化,⽽其他地⽅
的数值较⼩,说明这些地⽅夏季降⽔的⽅差较⼩。中国夏季降⽔异常EOF 分析第⼀模态时间系数则具有较明显的年际变化,
其值在0线上下振荡。说明,当时间系数为正时,长江流域降⽔偏多时,华南及华北地区降⽔偏少。这与我国夏季东部降⽔的
三⾬带变化相对应。
23、 ⽓候变化上通常说的异常,可以⽤距平这个基本统计量来描述,它反映数据偏离平均值的状况,
把资料处理成该统计小百合花 量的形式,叫做资料的_中⼼化化。
24、 对资料做标准化可以消除单位量纲不同造成的影响,其表达式为
x
t zt s x x x -=
,标准化以后资料的均
⽅差为1。
25、 在对回归问题进⾏⽅差阿哥你别走 分析时,预报量的⽅差可以表⽰成回归⽅差与误差(残差)⽅差之和。 26、 寻找合适的条件概率
作为天⽓预报指标需要满⾜两个经验性条件,⼀是P(A/B)>>P(A) 或
P(A/B)<
27、⽓象中⼀些⽓象要素,如冰雹、晕、雾等天⽓现象,⽓象资料中仅记录为“有”或“⽆”可⽤“1”
或“0”⼆值数字化表征,这类变量可看成离散型随机变量。对于这种状态要素,可以⽤_
条件概率____选择预报因⼦并且⽤⼆项分布检验预报因⼦的可靠程度。⽓温、⽓压及降⽔量等⽓
象要素,观测猪肺怎么做好吃又简单 值在正、负⽆穷之间,这种类型要素可看成为连续型随机变量。对于这种定量
数据要素,主要⽤相关系数_选择预报因⼦或因⼦集,并⽤tt___t__检验⽅法检验其可靠性。
28、如果序列的_⾃(滞后)相关系数为较⼤正值,表明序列具有⾼持续性;如果序列的滞后⾃相关系
数接近0或为负值,表明序列⽆持续性。如果两变量本⾝有强持续性或⾼⾃相关,t_检验的⾃由
度不能⽤,需要窗帘颜色风水 计算有效⾃由度,取更严格的标准进⾏相关系数的检验,以免得到虚假的不可靠
的相关。
29、⽓象变量场EOF分析是把原变量场分解为空间函数和时间函数两部分,⽤维数较少的不相关的
典型模态,代替原始的⽓候变量场。
30、利⽤⼀元线性回归⽅法进⾏线性趋势分析中,回归系数b的符号说明了⽓候变量x的趋势倾向。
当b>0说明随时间的增加,变量x是呈(上升或下降)趋势;b值的⼤⼩反映了上升或下降的速
率,b的绝对值越⼤,表明直线越(倾斜或平缓)。
31、检验两地⽓候是否有显著差异,可针对这两个地区某⽓象资料的平均值和⽅差这两个基本统计量
进⾏显著性检验。
32、对多要素资料的数据矩阵进⾏分析时,研究变量之间的相互关系,称为R型分析,⽽研究样本之
间关系的称为_Q_型分析,相应的在系统聚类分析中,也可分为R型聚类和Q_型聚类。
⼆、名词解释
1、累积频率:变量⼩于某上限值的次数与总次数之⽐。
2、均值突变:从⼀个⽓候基本状态向另外⼀个⽓候基本状态的急剧变化
三、问答题
3、什么是偏相关系数? 当存在三个以上变量相互影响时,如(x1,x2,y),当消除x1(或x2)的影响,
计算x2(或x1)与y的相关系数时,就称为偏相关系数。
4、试举例说明哪些⽅法(不少于三种)可以进⾏⽓候变化趋势分析?
答:1)线性倾向估计2)滑动平均3)三次样条函数
5、简述回归分析与相关分析的区别。
在相关分析中,解释变量X与被解释变量Y之间处于平等的位置。⽽回归分析中,解释变量与被解释变量必须是严格确定的。2
相关分析中,被解释变量Y与解释变量X全是随机变量。⽽回归,被解释变量Y是随机的,解释变量X可能是随机的,可能是⾮
随机的确定变量。3 相关的研究主要主要是为刻画两变量间线性相关的密切程度。⽽回归不仅可以揭⽰解释变量X和被解释变
量Y的具体影响形式,⽽且还可以由回归⽅程进⾏预测和控制。如果两变量间互为因果关系,解释变量与被解释变量互换位
置,相关分析结果⼀样,回归分析结果不同。
6、如何分析两个⽓候变量序列的相关关系,需要注意什么?
7、整理区域资料有哪些常⽤的⽅法? 答区域平均法、综合指数法、代表台站法
四、计算分析题
已知预报量y:长江中下游夏季(6-8⽉)降⽔量,预报因⼦x1 :冬季(12⽉-翌年2⽉)北太平洋涛动指数;x2:1⽉太平洋地
区极涡⾯积指数;x3:5⽉西太平洋副⾼脊线,样本容量n=44。现建⽴y关于x1、x2、x3的多元回归⽅程,分析结果如表1所
⽰。
5)试写出回归⽅程的表达式。
6)简要说明回归⽅程是否通过显著性检验。设显著性⽔平为0.05。
7)回归⽅程的判决系数为多少?并简要说明其代表的意义。
表1 多元回归分析结果表
本文发布于:2023-04-26 14:52:57,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/fanwen/fan/89/849261.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |