09硕博士多元统计雷鹏余勇夫dearfisher@
1
2×2析因设计资料的方差分析
用A药和B药治疗高胆固醇患者,并考虑是否患糖尿病对结果的影响,故把高胆固醇患者分成
糖尿病且高胆固醇组和单纯高胆固醇组,每一种病情组又随机分为两组:一组用A药,一组用B药,
经过一个疗程后,观察患者的总胆固醇下降的幅度,具体数据列表如下,对该资料做统计分析。
不同病情不同疗法治疗高胆固醇患者的总胆固醇下降值(mmol/L)
病情
疗法
A药B药
单纯高胆固醇组0.80.71.21.11.41.20.81.2
1.40.311.40.91.41.11.1
糖尿病且高胆固醇组0.70.80.60.300.40.50.6
0.71.110.80.40.20.10.4
本例中,以总胆固醇下降幅度为疗效指标,以高血脂患者为研究对象,主要的研究问题是评价
A药和B药降低总胆固醇的幅度,由于该研究考虑了研究对象是否患有糖尿病的因素,所以要回答
两个药的疗效差别如何。根据最终结果,研究者有时可以直接称A药疗效优于B药,或者B药疗效
优于A药,或者两个药疗效相同;但研究者往往不能这样简单地评价两个药的疗效,因为最终结果
往往有多种可能的答案,可以归纳为下列三大类的情况。
1)A药和B药的疗效相同或不同,但两个药的疗效差异与是否患糖尿病无关。
2)无糖尿病的患者而言,两个药的疗效相同,对于糖尿病患者而言,两种药物的疗效不同。
3)对于糖尿病患者而言,两种药物的疗效相同,无糖尿病的患者而言,两个药的疗效不同。
如果资料符合方差分析的条件,可以用两因素方差分析进行统计分析,方差分析中的交互作用
概念正是反映了上述第2种和第3种答案,即:交互作用是指某个因素对效应指标的作用与另一个
因素处于何种水平状态有关(本例中治疗方案因素对疗效的作用与患者是否患糖尿病有关)。因此
如果本例中治疗方案因素对疗效的作用与患者是否患糖尿病无关,则称治疗方案与是否患糖尿病对
效应指标(降低总胆固醇)没有交互作用。
先考虑无交互作用的方差分析模型如下:
糖尿病的高血脂患者用B药治疗一个疗程后,总胆固醇平均下降µ(mmol/L),
糖尿病的高血脂患者用A药治疗一个疗程后,总胆固醇平均下降µ+β1(mmol/L),即糖尿病的
高血脂患者用A药和用B药治疗一个疗程,两种药的疗效:总胆固醇下降幅度的平均差异为β1
(mmol/L);
无糖尿病的高血脂患者用B药治疗一个疗程后,总胆固醇平均下降µ+β2(mmol/L),即同样用
B药,有糖尿病的高血脂患者和无糖尿病的高血脂患者的总胆固醇下降幅度平均相差β2(mmol/L);
无糖尿病的高血脂患者用A药治疗一个疗程后,总胆固醇平均下降µ+β1+β2(mmol/L),即同
样用A药,有糖尿病的高血脂患者和无糖尿病的高血脂患者的总胆固醇下降幅度平均相差β2
(mmol/L)。
09硕博士多元统计雷鹏余勇夫dearfisher@
2
综合上述,没有考虑交互作用的情况下,方差分析的模型整理成表格如下
表无交互作用项的方差分析模型
病情
疗法
A药与B药的疗效差异
A药B药
单纯高胆固醇组µ+β1+β2µ+β2β1
糖尿病且高胆固醇组µ+β1µ
β1
有无糖尿病对疗效的差异β2β2
由此可见,无交互作用的方差分析模型所描述的A药与B药的疗效差异均为β1(因素疗法的主
效应),且两个药的疗效差异与病情无关,同理有无糖尿病对总胆固醇下降幅度的差异为β2(因素病
情的主效应),与用哪个药无关。
从临床医疗背景上考虑,药物的疗效往往与疾病严重程度有关,与伴发症有关,因此需要在模
型中引入交互作用项,相应的模型如下表。
含有交互作用项的方差分析模型
病情
疗法
A药与B药的疗效差异
A药B药
单纯高胆固醇组µ+β1+β2+β3µ+β2β1+β3
糖尿病且高胆固醇组µ+β1µ
β1
有无糖尿病对疗效的差异β2+β3β2
上表中,β3为交互作用项。两个药的疗效差异与患糖尿病是否有关的关键是交互作用项β3是否
为0,一般而言,有无交互作用是需要统计检验的,不能轻易忽略交互作用项。
用方差分析进行统计分析步骤如下:
用变量a=1表示用A药,用a=2表示用B药;用b=1表示无糖尿病,用b=2表示患糖尿病,
用x表示总胆固醇下降幅度。Stata软件统计分析操作如下。
数据格式
idxab
10.811
20.711
31.211
41.111
51.411
60.311
7111
81.411
91.421
101.221
110.821
121.221
130.921
141.421
09硕博士多元统计雷鹏余勇夫dearfisher@
3
151.121
161.121
170.712
180.812
190.612
200.312
210.712
221.112
23112
240.812
25022
260.422
270.522
280.622
290.422
300.222
310.122
320.422
由于方差分析要求资料的方差齐性,残差(residual)服从正态分布,故首先检验资料是否符
合方差分析的条件。
正态性检验
H0:资料服从正态分布
H1:资料呈非正态分布
α=0.05
anovaxaba*b先作方差分析
predicte,residual计算残差,用变量e表示
swilke检验残差的正态性
残差正态性检验的结果如下
Shapiro-WilkWtestfornormaldata
Variable|ObsWVzProb>z
-------------+-------------------------------------------------
e|320.968101.0640.1290.44878
正态性检验的P值为0.44875>>0.05,故没有充分证据可以否认资料呈正态分布。
采用Levene’s方差齐性检验的方法检验方差齐性,操作如下:
H0:各组资料的方差齐性
H1:各组资料的方差不齐
α=0.10
09硕博士多元统计雷鹏余勇夫dearfisher@
4
genee=abs(e)计算残差的绝对值,并存入变量ee
anovaeeaba*b用方差分析的方法比较各组残差绝对值的平均值
主要结果如下
Numberofobs=32R-squared=0.1193
RootMSE=.153848AdjR-squared=0.0249
Source|PartialSSdfMSFProb>F
-----------+----------------------------------------------------
Model|...260.3058
a|.036113281.036113281.530.2270
b|...010.3233
a*b|...260.2721
Residual|.66273432828.023669083
对应Model的F值为1.26,P值=0.3058>0.10,故不能认为方差不齐。
由于该研究考虑了是否患糖尿病因素对两个药的疗效比较的影响,因此统计分析时应首先检验
是否存在交互作用。
H10:两种药的疗效差异与是否患糖尿病无关(β3=0)
H11:两种药的疗效差异与是否患糖尿病有关(β3≠0)
α=0.05
anovaxaba*b方差分析
regress估计模型中的µ,β1,β2和β3
主要的相关结果如下
------------------------------------------------------------------------------
>|t|[95%al]
------------------------------------------------------------------------------
_cons.325.09502113.420.002.130358.519642
a
1.425.13438023.160.004.1497347.7002653
2(dropped)
b
1.8125.13438026.050.000.53723471.087765
2(dropped)
a*b
09硕博士多元统计雷鹏余勇夫dearfisher@
5
11-.575.1900423-3.030.005-.964284-.185716
12(dropped)
21(dropped)
22(dropped)
------------------------------------------------------------------------------
输出结果中的drop表示没有这项参数或认为这项系数为0。输出结果显示
ˆ
0.325µ=,
1
ˆ
0.425β=,
2
ˆ
0.8125β=,
3
ˆ
0.575β=−,由于β3的P值为0.005<0.05,即表明存在交互作用,可
以认为两个药的疗效差异与是否患糖尿病有关。因此需要按是否患糖尿病分别进行两个药的疗效比
较。
H0:两种药的疗效相同
H1:两种药的疗效不同
由于需要比较两次,根据bonferroni两两比较的方法,设置两两比较的校正α=0.05/2=0.025
对于糖尿病且高胆固醇患者(b=2)
用B药治疗后(a=2)的总胆固醇平均下降幅度为
ˆ
0.325µ=(mmol/L)
用A药治疗后(a=1)的总胆固醇平均下降幅度为
1
ˆ
ˆ
0.3250.4250.75µβ+
=
+
=
(mmol/L),比用B药
的平均下降幅度大0.425(mmol/L),β1的P值=0.004<0.025,因此可以认为:对于患糖尿病的高血
脂患者,用A药降低总胆固醇的疗效优于用B药,差异有统计学意义。
对于未患糖尿病的高胆固醇患者(b=1)
用B药治疗后(a=2)的总胆固醇平均下降幅度为
2
ˆ
ˆ
0.3250.81251.1375µβ+
=
+
=
(mmol/L)
用A药治疗后(a=1)的总胆固醇平均下降幅度为
1
ˆ
ˆµβ++
2
ˆ
β+
3
ˆ
β=0.325+0.425+0.8125-0.575
=0.9875(mmol/L),比用B药的平均下降幅度大
1
ˆ
β
3
ˆ
β+=0.425-0.575=0.15(mmol/L),因此需要
检验β1+β3是否为0,用Stata比较命令如下
test_b[a[1]]+_b[a[1]*b[1]]=0检验H0:β1+β3=0,H1:β1+β3≠0
结果如下
(1)a[1]+a[1]*b[1]=0
F(1,28)=3.09
Prob>F=0.0898
检验H0:β1+β3=0的P值=0.0898>0.025,即:对于未患糖尿病的高血脂患者,用A药与用B药降
低总胆固醇的疗效差异无统计学意义,认为没有充分证据可推断两个药的疗效有差异。
09硕博士多元统计雷鹏余勇夫dearfisher@
6
小结
1、析因设计的资料用方差分析要求残差服从正态分布,方差齐性。如果资料不满足方差分析
的条件,可以先进行秩变换或其它的正态性变换(如Box-cox变换,对数变换,反正弦变换等),
然后再做统计分析。
2、析因设计的主要优点是:①同时评价多个因素各个水平的效应,所以析因设计是一种比较
完备的设计,其结果比较容易解释。②能够分析各因素间的交互作用;③容许一个因素在其他各因
素的几个水平上来估计其效应,所得结论在实验条件的范围内是有效的。
3、析因设计的主要缺点是:在研究因素较多的情况下,需要非常大的样本量,所以析因设计
不能分析太多的研究因素。
4、析因设计的统计分析应首先评价是否存在交互作用。如果存在交互作用,则孤立地评价主
效应是没有意义的,应根据具体的研究问题,进行简单效应比较(如例题统计分析步骤)。
5、析因设计的资料有时候误被当作完全随机设计的资料进行处理,如课本上的例题,就经常
被看成单因素4水平设计,有一个“组别”因素,而这个因素分成第一组(用A药)、第二组(用B
药)、第三组(A、B两药均用)、第四组(A、B两药均不用)4个水平。若用完全随机设计的方差分
析进行统计分析,则无法评价交互作用,特别若无交互作用时,每个因素各个水平之间的比较存在
降低检验效能的问题。
6、析因设计一般要求各个因素的每种水平组合的重复数是相同的,并称为平衡设计模型,统
计检验效能比较高。在特殊情况下,各个因素的每种水平组合的重复数出现不相同,则称为非平衡
设计模型,在同样总样本量的情况下,统计检验效能相对较低。
本文发布于:2022-11-14 20:23:32,感谢您对本站的认可!
本文链接:http://www.wtabcd.cn/fanwen/fan/88/19798.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |