第十三章 活着--Survival菜单详解(上)
(医学统计之星:董伟)
上次更新日期:
13.1 Life Tables过程
13.1.1 界面说明
13.1.2 结果解释
13.2 Kaplan-Meier过程
13.2.1 界面说明
13.2.2 结果解释
13.3 Cox Regression过程
13.3.1 界面说明
13.3.2 结果解释
13.4 Cox w/Time-Dep Cov过程
13.4.1 界面说明
13.4.2 结果解释
对于急性病的疗效考核,一般可以用治愈率、病死率等指标来评价,但对于肿瘤、结核及其他慢性疾病,其预后不是短期内所能明确判断的,这时可以对病人进行长期随访,统计一定期限后的生存和死亡情况以判断疗效,这就是生存分析。
生存分析是用于以处理生存时间(survival time)为反应变量、含有删失数据一类资料的统计方法。所谓生存时间,狭义地讲是从某个标准时点起至死亡止,即患者的存活时间。例如,患有某病的病人从发病到死亡或从确诊到死亡所经历的时间。广义地说,“死亡”可定义为某研究目的“结果”的发生,如宫内节育器的失落,疾病的痊愈,女孩月经初潮的到来等(生存分析中往往统指各“死亡”为失效)。此类资料的生存时间变量多不符从正态分布,且常含有删失值,故不适于用传统的数据分析方法如t检验或线性回归进行分析。根据
不同的研究目的和资料类型,可采用不同的分析方法,如寿命表、Kaplan-Meier法、Cox回归模型等分析方法进行分析。而这正是下面我将要给大家介绍的主要内容。
“喂,你在这里说的都是些什么呀?又是删失、又是Cox的,搞的我一头雾水。”那位给我提意见了。
列位看官切莫着急,且听在下慢漫道来。
所谓删失值,就是因各种原因对随访对象的随访可能失访或终检(censoring),如研究对象由于其他原因死亡、研究者与病人失去了联系及直到对资料作总结时随访对象还活着但尚未发生所规定的事件。这种数据就叫做删失值,也叫做截尾数据。能处理截尾数据是生存分析的一个优点。
Cox回归是一种多变量的生存分析方法。这是本世纪60~70年代发展起来的、应用于生存资料分析的比例分险模型(the proportional hazard model)。1972年,英国统计学家D.R.Cox的研究工作使得比例分险模型的理论和实用性更大地推进了一步。因此许多统计学者就把它称为Cox比例风险或Cox回归。
§13.1 Life Tables过程
Life Tables过程用于:
1、 制作寿命表。
2、 绘制各种曲线如生存函数、风险函数曲线等。
3、 对某一研究因素不同水平的生存时间分布进行比较,控制另一因素后对研究因素不同水平的生存时间分布进行比较,包括从总体上比较和不同水平之间进行两两比较。
例13.1 某临床试验对20名第Ⅲ或第Ⅳ期黑色素瘤患者进行随访研究,截至研究期结束,记录的生存资料见表1。试计算100周生存率。
12.8 15.6 24.0+ 26.4 29.2 30.8+ 39.2 42.0 58.4+ 72.0+ |
77.2 82.4 87.2+ 94.4+ 97.2+ 106.0+ 114.8+ 117.2+ 140.0+ 168.0+ |
|
注:数据后跟符号“+”表示该数据为删失数据。
13.1.1 界面说明
图1 寿命表主对话框
【Time】框
选入生存时间变量。
【Display Time Intervals】框
欲输出生存时间范围及组距。
在by前面的框内填入生存时间上限,本例填入200(此区间必须包括生存时间的最大值);在by后面的框内填入生存时间的组距,本例填入20,以保证结果列出“100-”的组段。
【Status】框
选入生存状态变量,并定义终结事件的标记值。
选入变量“Status”后,【Define Event】钮被激活变黑,击该按钮,弹出定义终结事件标记值的对话框(图1)。对二分类变量,一般以死亡、复发、恶化等表示终结事件。本例以死亡为终结事件,其标记值为1,故在Single value 框内填入1。击Continue钮。若生存状态
变量取值为一连续型变量,如反应变量为收缩压,则在下面的Range of values 框中输入140 through 400,此处上限输入400是我随便输入的一个上限,目的是为了定义高血压患者,实际上恐怕没有人的血压能达到400,这样才能保证包括所有的高血压病例,具体情况具体分析。
图2 定义终结事件标记值的对话框
【Factor】框
定义第1层因素,即分组因素。
【By Factor】框
定义第2层因素,即分层因素。
【Options】选项
击Options按钮,弹出选项对话框。(图3)
图3 寿命表选项对话框
Life Table(s):输出寿命表,系统默认。
Plot:统计图。
Survival:累积生存函数曲线。
Hazard:累积风险函数散点图。
One minus survival:生存函数被1减后的曲线。
Log survival:对数累积生存函数曲线。
Density:密度函数散点图。
Compare Levels of First Factor:对第1层因素不同水平的比较,即主对话框(图1)中的factor框中所选入的因素。
None:不做比较。系统默认。
Overall:整体比较。
Pairwi:两两比较。
本例因没有分组因素,故Compare Levels of First Factor选项均不可选。
13.1.2 结果解释
1、 寿命表
This subfile contains: 20 obrvations
Life Table
Survival Variable TIME survival time(week)
说明:20例观察单位,生存变量为“Time”,变量标签为“survival time(week)”
| Number | Number | Number | Number | | | Cumul | | |
Intrvl | Entrng | Wdrawn | Exposd | Of | Propn | Propn | Propn | Proba- | |
Start | this | During | to | Termnl | Termi- | Sur- | Surv | bility | Hazard |
Time | Intrvl | Intrvl | Risk | Events | nating | viving | at End | Densty | Rate |
------ | ------ | ------ | ------ | ------ | ------ | ------ | ------ | ------ | ------ |
.0 | 20.0 | .0 | 20.0 | 2.0 | .1000 | .9000 | .9000 | .0050 | .0053 |
20.0 | 18.0 | 2.0 | 17.0 | 3.0 | .1765 | .8235 | .7412 | .0079 | .0097 |
40.0 | 13.0 | 1.0 | 12.5 | 1.0 | .0800 | .9200 | .6819 | .0030 | .0042 |
60.0 | 11.0 | 1.0 | 10.5 | 1.0 | .0952 | .9048 | .6169 | .0032 | .0050 |
80.0 | 9.0 | 3.0 | 7.5 | 1.0 | .1333 | .8667 | .5347 | .0041 | .0071 |
100.0 | 5.0 | 3.0 | 3.5 | .0 | .0000 | 1.0000 | .5347 | .0000 | .0000 |
120.0 | 2.0 | .0 | 2.0 | .0 | .0000 | 1.0000 | .5347 | .0000 | .0000 |
140.0 | 2.0 | 1.0 | 1.5 | .0 | .0000 | 1.0000 | .5347 | .0000 | .0000 |
160.0 | 1.0 | 1.0 | .5 | .0 | .0000 | 1.0000 | .5347 | .0000 | .0000 |
| | | | | | | | | |
The median survival time for the data is 160.00+