procmeans求计量资料的95%CI
有时候会经常遇到计量资料(定量资料)和计数资料(分类资料),不同的资料采⽤的统计⽅法也不相同,所以有必要先搞清楚什么是计量资料和计数资料。
计量资料指连续的数据,通常有具体的数值,如⾝⾼、体重、⾎压、⾎红蛋⽩、胆红素和⽩蛋⽩等。计量资料的特征通常包括中⼼位置与离散程度。
计数资料是指先将观察单位按其性质或类别分组,然后清点各组观察单位个数所得的资料。特点是对每组观察单位只研究其数量的多少,⽽不具体考虑某指标的质量特征,属⾮连续性资料。
说到这些我也头痛,⾃⼰理解吧,理解不了就靠猜~~
今天讲讲如何⽤proc means求计量资料的95%CI,⽐如说⾝⾼、体重、年龄等。我们以SASHELP.CLASS为原数据集,以x当作组别
(trt01an)
我们先⽤proc univariate输出⼀些东西看看,其实这也是可以求95%CI的,但是不是我们讨论的重点,我想让你们看看输出。
这个CIBASIC选项就代表你要求95%CI,你也可以指定(alpha=0.1)
在proc univariate中,我输出了均值、标准差、最⼤值最⼩值、四分位数,⽽且basicintervals=ci 还不能直接在output out输出,奇了怪了。
看到对每⼀个统计量,⽐如说Mean、Std Deviation、Variance都有lowerCL,UpperCL,我当时就蒙圈了,这么多,该取哪⼀个统计量的
呢?shell上也没说啊?后来我⼀看SAP,⾥⾯有讲到平均数的95%CI,所以也就是我圈起来的那个。这个estimate就代表SEX="F"的年龄均值是13.222。
⽅法⼀:
这是今天从⽹上了解的,想不到还可以这样求。这种⽅法感觉像是⼿算,先求出均值mean和n,然后加上tinv这个函数去计算可置信区间的上下限。tinv我不知道,没时间去了解。⾃⼰去官⽹看看。
看到跟proc univariate计算出来的值是⼀样的,我想如果把Mean换成STD,求出来的应该就是Std Deviation的95%CI了,感兴趣可以⾃⼰试试。
⽅法⼆:其实可以直接在proc means⾥⾯求出,⼀个lclm,⼀个uclm就搞定了。
输出结果是⼀样的
⽅法三:proc summary,其实跟proc means差不多。
综上,其实有4种⽅法,不同⽅法有点差异,看⾃⼰取舍吧。
******************************************
今天内⼼真的抗拒⼯作,昨天跑步过度了,快10点就睡了,结果睡了快9个⼩时还是被闹钟给叫醒的。⼯作也是⼼烦,⼈真的要忙忙碌碌⼀辈⼦?我现在正循环播放这《⼤悲咒》~~~~~有时候想想出家算了,但是感觉⾃⼰还是俗⼈⼀个,断不了爱恨贪嗔。