t检验与方差分析

更新时间:2023-04-22 16:54:55 阅读: 评论:0


2023年4月22日发(作者:印刷线路板)

t检验与方差分析

第六章数值变量资料的统计分析

数值变量资料又称计量资料,通常是指每个观察单位某项指标量

的大小,一般具有计量单位。这类资料按分析的内容一般可分为两种:

一种是比较几种处理之间的效应,沮丧近义词 简单地讲就是比较各处理组观察值

均数、方差的大小;另一种是寻找指标间的关系,即某个(或某些)

指标的取值是否受其它指标的影响。本章主要介绍不同设计类型的数

值变量资料的比较。

样本均数与总体均数比较的 t 检验

t检验亦称 student's t 检验,主要用于下列三种情况:(1)样本均

数与总体均数比较;(2)配对数值变量资料的比较;(3)两样本均数的比

较。

Stata用于样本均数与总体均数比较的 t 检验的命令是:

ttest 变量名= #val

这里,#val 表示总体均数。

命令中可以选用 if 语句和 in 语句对要分析的内容加一些条件限制。

对已知样本含量、均数和标准差的资料,欲将其与某总体均数进

行比较,Stata 还提供了更为简洁的命令是:

ttesti #obs #mean #sd #val

这里,#obs 表示样本含量,#mean 表示样本均数,#sd 表示样

本标准差,

#val 表示总体均数。

两样本均数比较的t检验

一、配对设计t检验

医学研究中常将受试对象配成对子,对每对中的两个受试对象分

别给予两种不同的处理,观察两种处理的结果是否一致,称为配对(

)研究。有时以同一个受试对象先后给予两种不同的处理,观察两种

处理的结果是否相同,这种配对称为自身配对。配对设计的优点是能

消除或部分消除个体间的差异,使比较的结果更能真实地反映处理的

效应。

配对t检验首先计算每对结果之差值,再将差值均数与0作比较。

如两种处理的效应相同,则差值与0没有显著性差异。

检验假设 H0为:两种处理的效应是相同,或总体差值均数为 0

stata用于配对样本t检验的命令是:

Ttest 变量1 = 变量2

这里,这里“变量 1”和“变量 2”是成对输入的配对样本。

ttest 命令容许使用[if 表达式][in范围]条件限制。

或者: gen d=0

ttest d=0

二、成组设计t检验

有时无法将受试对象逐个配成对,可将受试对象随机分为两组,

每组接受不同的处理,检验两组的均数景图片 ,以达到比较的目的。

t检验要求两样本来自方差相同的正态总体,即各组资料达到或接

近正态,两组的方差达到齐性。如两组资料偏态或方差不齐,则需要

对原始数据作变量变换,如变换后仍未达到正态,可用秩和检验;如

未达到方差齐性,则需用 t’检验,或用秩和检验。

Stata 提供了三种资料形式的两样本均数比较的t检验的命令,即:

ttest 变量 1=变量 2, unpaired [ unequal welch ]

ttest 变量, by(分组变量) [unequal welch]

ttesti #obs1 #mean1 #sd1 #obs2 #mean2 #sd2 [, unequal

welch ]

这里:第一个命令的数据格式是将两组数据用两个变量“变量 1”

和“变量 2”分别输入,如两组的样本含量不等,则先输入样本含量

大的变量,再输入样本含量少的变量,不足部分,Stata 将自动生成缺

省值(用小数点表示)。也可同时输入,缺失部分用小游戏原画设计 数点表示。

unpaired 是必选项,如不选,则 Stata 将作配对 t 检验。

第二个命令的数据格式是将两组数据用一个“变量”输入,再用

另一个分组变量,以区分两组资料,如用 1 表示第 1 组资料,用 2

示第 2 组资料。by(分组变量)是必选项。

第三个命令是针对已知两组资料的样本含量、均数和标准差的资

料进行比较的简洁命令。这里有 6 个数据,#obs 表示样本含量,

#mean 表示样本均数,#sd 表示样本标准差,l 表示第 1组,2 表示

2 组。

第一个命令和第二个命令允许加[权数][in 范围] [if 表达式]

件。

选择项 unequal表示假设两组方差不齐,如不选表示假设两组方

差达到齐性。

选择项 welch 表示用 Welch 方法对自由度进行校正,如不选此项,

则用 Satterthwaite 方法对自由度进行校正。welch 选择项只有在选

择了 unequal 才有效。

单因素方差分析及方差齐性检验

一、单因素方差分析

根据某一试验因素,将受试对象随机分为若干处理组(各组样本含

量可以相等亦可不等),即为单因素试验设计。比较此多个样本均数的

目的是推断各处理的效应有无差异。常用单因素方差分析。

单因素方差分析的假设检验。

H0:各处理效应相同(或各组总体均数相等)

并根据各组样本含量、均数、组内离均差平方和、组间离均差平

方和等构造检验统计量FF是反映各组差别大小的统计量,F 越大说

明各组均数差别就越大。同样F 与处理组数、样本含量的大小有关。

如单因素方差分析拒绝检验假设H0,只说明各组总体均数不等或

不全相等,到底是哪些组间有差别,需进一步作均数间的两两比较。

两两比较的方法很多,Stata 提供的两两比较方法有 Bonferroni法、

Scheffe法、Sidak 法。

Stata 用于单因素方差分析及两两比较的命令为:

oneway 响应变量分组变量,[选择项]

这里选择项有:

noanova /*不打印方差分析表

nolabel /*不打印分组变量的取值标签

missing /*将缺省值作为单独的一组

wrap /*两两比较的表格不分段

tabulate /*打印各组的基本统计量我心永恒歌词 表

[no]means /*[]打印均数

[no]standard其字组词 /*[]打印标准差

[no]freq /*[]

tabulate 才有效。

Stata 还提供了三种两两比较方法。

scheffe /*Scheffe

bonferroni /*Bonferroni

sidak /*Sidak

二、方差齐性检验

无论是进行 t 检验还是方差分析,资料都必需满足一定的条件,

即①正态性,②方差齐性,③独立性。而以方差齐性条件最为重要。

因此,在进行 t 检验和方差分析之前,必须进行方差齐性检验。即检

验各处理组数据的变异(方差)是否相同。一般情况下进行方差齐性检验

都不希望拒绝 H0,此时,为提高检验把握度,检验水准应定得高一些,

比如:=,等。

Stata 用于样本方差与总体方差的比较,以及两样本方差齐性检验

的命令为:

sdtest 变量名 = #val

sdtest 变量名 1 = 变量名 2

sdtest 变量名, by(分组变量)

sdtesti #obs {#mean | . } #sd #val

sdtesti #obs1 {#mean1 | . } #sd1 #obs2 {#mean2 | . } #sd2

里,第一个命令用于检验某变量的方差是否来自方差为#val的总体;

第二、三个命令是用于检验两样本对应的总体方差是否相同,但

两个命令要求的数据输入形式不同,第二个命令用于每组各一个变量,

第三个命令用于有分组变量的情形。

第三、第四、五个命令用于已知样本含量和样本标准差的情形,

其中,第四个命令用于样本方差与总体方差的比较,第五个命令用于

两样本方差齐性检验。样本均数可以输入,亦可缺失并用小数点表示。

1)两个方差的比较

两样本方差的齐性检验一般用 F 检验,F 值反映的是两样本方差之

比,如相应的总体方差相等,则 F 应接近1。

2)样本方差与总体方差的比较

样本方差与总体方差的比较一般用检验。

3)多个方差的齐性检验

多个方差的齐性检验是检验每个处理组相应的总体方差是否全部

相等。

检验假设为H0:当拒绝检验假设时,则可认为至少有两个方差不

等。用检验。该检验由oneway 命令给出,见例。

两因素的方差分析

两因素的方差分析一般是指配伍组方差分析,和不考虑交互作用

与考虑交互作用

ab 析因分析。Stata的命令为:

anova 因变量分组变量 1 分组变量 2

anova 因变量分组变量 1 分组变量 2 交互作用项oneway 命令只

适用于单因素方差分析,而要进行两因素、多因素的方差分析需

anova 命令。

anova 命令亦能用于单因素情形,但却不如 oneway 命令方便,

因为 anova 不能提供方差齐性检验和多重比较。因此在进行单因素方

差分析时,建议用 oneway 命令。

anova 命令只适合于平衡资料,对非平衡资料需要用 glm(广义

线性模型)命令。

Stata 中用 help glm可获得帮助。

命令:tabu a bsumm(x) nofreq

anova x a b a*b

多因素的方差分析

多因素的试验即是同时考虑多种因素影响的试验。相应的方差分

析称为多因素的方差分析,仍用 anova 命令,只是分组变量多于两个。

例如:

anova x a b c … … a*b b*c a*b*c … …

这里,a,b,c 表示分组变量,a*bb*ca*b*c 表示交互作用项见习体会 。

协方差分析

协方差分析是在扣除协变量的影响后再对(修正后的)主效应进

行方差分析,是把直线回归或多元线性回归与方差分析结合起来的一

种方法。协变量一般是连续性变量,并假设协变量与响应变量间存在

线性关系,且在各处理组这种线性关系一致。

anova

continuous(协变量名),或category(分组变量名)

anova y a b c a*b b*c a*b*c x1 x2 ,continuous(x1 x2 …)

其中,y 为响应变量,a ,b为分组变量,x1 x2 ……为协变量,加

选择项 continuous(x1 x2…… )的意思是指明 x1,x2……为连续性变量

(协变量),从而 Stata 自动以 x1,x2……为协变量进行协方差分析。在

不指定连续性变量时,Stata 视所有变量为分组变量(响应变量除外)

亦可指定分组变量,则其余变量将视为是连续的,相应的选择项应改

categroy( ),如

anova y a b c a*b b*c a*b*c x1 x2 , categroy(a b c )

与上述命令是等价的。当有一个协变量时,称为一元协方差分析,

当有两个或多个协变量时,称为多元协方差分析。

(配伍组的协方差分析) 以下资料是三组小白鼠的进食量(x)与所

增体重(y),由于体重增加受进食量的影响,故在分析体重的增加时,

必须扣除进食等差中项 量的影响。即以进食量为协变量,对三组的增加体重进

行分析。这里,协变量为一个。

正态性检验与变量变换

正态性是很多传统统计方法的应用条件之一,如 t 检验,方差分

析等均要求资料服从正态分布。如资料不服从正态分布,则需作适当

的变量变换,以使资料达到或接近正态。本节介绍几种正态性检验方

法和几种常见的正态化和对称化变换。

一、正态性检验

用于正态性检验的命令为:

sktest 变量

该命令要求资料的样本含量至少为 8

二、Box-Cox 正态性变换

所谓 Box-Cox 变换是指对变量 x 作变换:

Box-Cox 正态性变换就是寻找参数,使变换后的资料最接近正

态分布。

用于寻找 Box-Cox 正态性变换的命令为:

boxcox原变量,generat(新变量)

Stata 还提供了其它检验正态分布的检验方法:Shapiro-Wilk

Shapiro-Francia 法。

命令为:swilk sfrancia

三、对称性变换

所谓对称性变换,即寻找变换,使资料接近对称,或偏度系数接

0

Stata 提供了两种对称性变换,其一是 Box-Cox 对称性变换,即

寻找 Box-Cox 中的,使变换后资料的偏度系数接近 0;其二是对数

对称性变换,即寻找一 k 值,作变换:

y = ln(x-k

使变换后资料y的偏度系数接近0。相应的两个命令为:

lnskew0 新变量 = 原变量

bcskew0 新变量 = 原变量

x前面的正负号将根据其具体取值,由用户自己定义。


本文发布于:2023-04-22 16:54:55,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/89/843020.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图