再读FLAURA研究：从统计学视角解读OS更新结果

更新时间:2023-05-24 03:04:41 阅读：评论：0

再读FLAURA研究：从统计学视⾓解读OS更新结果

导读

EFGR-TKI靶向药改变了肺癌治疗史，从第⼀代TKI出现到第三代TKI问世，多项RCT都只观察到PFS获益。今年ESMO⼤会上，备受瞩⽬的FLAURA 研究公布了最终OS结果，打破了既往TKI单药⽆法延长OS的魔咒，奥希替尼因此成为迄今为⽌⾸个与第⼀代EGFR-TKI相⽐具有OS阳性结果的TKI单药，研究结果很快发表在NEJM上。broadcast

针对该研究，最近医统收到⼀些读者提问：

FLAURA研究与同样是⼀线治疗对⽐第⼀代TKI的ARCHER 1050、NEJ009研究检验策略有何异同？对OS结果性质是否影响？次要终点的亚组结果（不同种族和突变类型）能否作为定论？如何看待延长随访对OS结果的影响？Crossover对OS结果有何影响，如何控制？

带着这些问题，医统江湖莫淼统计师于2019-12-10从统计学视⾓对FLAURA研究进⾏了深⼊解读，特此分享。

（内容较长，熟悉本研究的读者可直接跳⾄“讨论与思考”部分）

莫淼

walnut

复旦⼤学附属肿瘤医院

肿瘤预防部副主任

临床统计中⼼统计师

FLAURA研究——奥希替尼对⽐标准TKI⽤于⼀线治疗EGFR突变阳性晚期NSCLC患者

研究背景

众所周知，在晚期NSCLC⼀线治疗领域，IPASS是⼀项具有⾥程碑意义的研究。在这项研究之前，⼏项研究均表明吉⾮替尼不能在⾮选择⼈群中改善晚期NSCLC患者的疗效，⽽IPASS研究通过事后亚组分析第⼀次发现，EGFR突变状态是吉⾮替尼疗效的⼀个重要预测指标，具有典型的异质性亚组效

应，EGFR突变阳性的肺腺癌患者才是TKI治疗的优势⼈群。

由此，IPASS研究开启了肺癌TKI靶向治疗时代。针对EGFR突变阳性患者，近10年来多项研究先后推出⼀⼆三代TKI药物，与传统化疗相⽐，⼀代TKI中位PFS提升到9-13m，⼆代TKI进⼀步提升到11-15m，FLAURA研究中三代TKI奥希替尼获得史上最长的单药PFS时长，达到18.9m。

研究设计

FLAURA研究是⼀项多中⼼、随机、双盲的三期试验，纳⼊患者允许基线伴有症状稳定的CNS转移患者。所有患者按照1:1随机接受奥希替尼治疗或标准的⼀代TKI吉⾮替尼或厄洛替尼治疗，每6周进⾏评估直⾄进展。预设2个分层因素，分别是种族（亚裔vs⾮亚裔）和突变类型（Ex19del vs L858R），主要研究终点是研究者评估的PFS，次要研究终点包括OS、ORR、DoR、DCR、the depth of respon以及安全性。⼀般认为，研究者评估的PFS与第三⽅独⽴评估的PFS相⽐可能更容易出现偏倚，不过在双盲的前提下可有效避免这类偏倚。

本研究统计检验采⽤序贯多重检验，相当于我们常说的Hierarchical Test，是为了控制研究总体I类错误在0.05以内。但不同的是，本研究预设检验是在主要研究终点与2个关键次要终点之间进⾏的。第1步进⾏PFS最终分析；若结果阳性，则进⼀步对关键次要终点OS进⾏检验，包括⼀次期中分析（PFS分析同时进⾏）和OS成熟度达60%时的最终分析，OS两次分析α基于O’Brien & Fleming消耗规则分别分配0.0015和0.0496；OS若为结果阳性，第3步再看关键亚组的PFS分析，最初设定是治疗前T790M突变亚组，研究过程中更改为更受临床关注的基线伴CNS转移的亚组（如下图所⽰）。序贯多重检验策略的优点是在同⼀个研究中解答多个临床问题均保证有⾜够的统计学效能（Power），且⽆需拆分α，不影响总样本量。值得注意的是，这类策略中的预设检验次序对于研究结论就显得极为重要和关键。

回顾本研究Protocol，经历了⼏次重要调整：1. 预设总样本量650例，在达到该数量后，为了满⾜将来CFDA评审的最低样本量要求，拟继续⼊组中国⼤陆患者⾄120例；2. 随着AURA系列研究结果发布，奥希替尼成为T790M突变患者的标准⼆线⽅案，禁⽌Crossover将有违伦理，因此研究允许对照组在满⾜以下三个条件时Crossover接受奥希替尼治疗：发⽣中⼼评估的PD、⾮停药后间期治疗、PD后确认存在T790M突变；3. 根据FDA的建议，删去原来针对PFS的interim analysis计划，相应的针对OS的分析减少为2次；4. 根据前期I期研究结果调整treatment effect，预估HR从0.74调⾄0.71，预期试验组疗效从13.6m提升到14.1m，相应的总样本量要求降⾄530例，所需事件数降⾄359例。

⼀般⽽⾔，样本量都是基于主要研究终点来估计的，FDA没有严格规定次要终点的power。本研究基于ITT⼈群PFS差异估计总样本量530例，考虑到OS作为疗效⾦标准，研究者希望将来有⾜够的power同时宣布OS阳性结果，故将次要终点OS与主要终点PFS⼀起采⽤固定次序检验来控制整体α，在既定样本量基础上推测当OS成熟度达60%时预期HR=0.75，此时基于α=0.05检验⽔准将有72%的power检验出OS统计学差异；相应的，假设伴CNS亚组占ITT⼈群20%，预期HR=0.55，那么对于伴CNS亚组的PFS也将有72%的power检验出统计学差异。chrisbrown

本研究统计分析计划⾸先是对于PFS的最终分析，将在基于ITT原则的FAS⼈群中进⾏，除了研究者评估的PFS，还预设了独⽴盲评委员会评估的PFS作为敏感性分析，以及10个关键亚组的探索性分析（事件数≥20予以分析）等。

结果解读

奥希替尼组和对照组分别⼊组了279和277例患者，基线特征分布均衡，其中62%为亚裔，63%属于Ex19del突变，21%的患者伴有CNS转移。⾄OS最终分析时（2019.6），奥替尼组和对照组分别有22%和5%的患者仍在⼀线治疗中。

截⽌2017年6⽉初次分析（DFS成熟度62%），结果显⽰奥希替尼显著降低了患者进展或死亡风险54%，中位PFS从10.2m延长⾄18.9m，且KM曲线从第6周第1次评估开始就明显分开。亚组分析结果显⽰所有亚组中奥希替尼均显著优于对照组。

按照预设检验策略，同时进⾏OS期中分析，此时事件成熟度仅25%。结果显⽰两组KM曲线存在分开趋势，但OS组间⽐较P=0.007，按照O’Brien & Fleming法则，尚未达到统计学显著性要求的P<0.0015。

今年ESMO⼤会公布了OS最终分析结果，两组中位随访时长分别为35.8m和27m，事件成熟度接近60%，组间差异P=0.0462，达到了统计学显著性要求的P<0.0496。基于该结果，奥希替尼成为迄今为⽌⾸个与第⼀代EGFR-TKI相⽐具有OS阳性结果的TKI单药。

caterpillar

按照预设检验次序，对于OS两次分析，⾄少有1次阳性结果才能看第3步检验PFS在CNS亚组的结果。实际上，该部分结果在2017年6⽉时就已报道，不论是否伴有CNS转移，奥希替尼都展⽰出了⾮常好的获益，都降低了进展或死亡风险达53%。⾄此，本研究基于序贯多重检验策略得到主要终点ITT⼈群PFS与关键次要终点ITT⼈群OS、CNS亚组⼈群PFS均达到阳性结果。

mesr

ITT⼈群OS达到阳性结果后，⼈们进⼀步关注其在不同亚组中的探索性结果，尤其是在预设的种族和突变类型不同亚组中的表现。从森林图来看，亚裔亚

组与L858R亚组似乎没能看到奥希替尼的显著获益。

从KM曲线图来看，亚裔患者⽣存曲线在研究组中位随访时长36m以前的阶段⾥，存在组间差异趋势，且同总体PFS⼀样从第6周第1次评估开始就明显分开；但在36m后由于交叉导致两条曲线整体差异不明显。⽽⾮亚裔患者⽣存曲线从9m以后明显分开，趋势⼀直保持。Ex19del突变⼈群中，KM曲线⾛势与

拥挤的英文单词ITT⼈群相当；⽽L858R突变⼈群中，在随访31m前的阶段⾥似乎存在组间差异趋势，之后曲线严重交叉导致两条曲线整体差异不明显。

值得注意的是，这些亚组结果均不属于确证性设计，事先并未根据亚组估计⾜够的样本量，因此在本研究中没有⾜够的power针对亚组作确证性结论，仅为探索性结果，仍有待进⼀步研究验证。

PFS差异转化为OS差异的过程中，差异程度会缩⼩（FLAURA研究HR_PFS=0.46，HR_OS=0.80），其中⼀个不可忽视的原因，在于⼆线允许对照组Crossover对⼀线治疗带来的OS获益造成稀释。本研究对照组31%的患者⼆线接受了奥希替尼治疗，因⽽最终达到了第⼀代TKI治疗历史上最好的中位OS（31.8m）。

本研究试验组⽐对照组≥3级不良反应更少，体现出奥希替尼具有⾮常好的安全性。

总结上述结果，FLAURA研究证实了奥希替尼对于EGFR突变阳性晚期NSCLC患者⼀线治疗可以显著改善OS，延长了6.8m，奥希替尼是与第⼀代TKI对⽐⾸个显⽰出存在OS获益的单药TKI治疗⽅式，且同时具有统计学意义和临床意义。奥希替尼组与标准治疗组在3年时分别有28%和9%的患者仍在⼀线治疗；奥希替尼具有⾮常好且与其他研究⼀致的安全性表现，即使暴露时间显著长于对照组，仍具有⽐对照组更好的安全性。综上，FLAURA研究OS最终分析结果进⼀步强化了奥希替尼作为EGFR突变阳性晚期NSCLC患者⼀线治疗中的重要地位。

讨论与思考

成人高考英语作文范文

从设计和结果来看，这是⼀项⾮常成功的研究，但同时也给读者带来了更多思考，因此产⽣了⽂章开头提到的⼏个疑问，下⾯⼀⼀进⾏探讨。保留意见

1. FLAURA研究与同样是⼀线治疗与第⼀代TKI对⽐的ARCHER 1050、NEJ009研究检验策略有何异同？对OS结果性质是否影响？

在RCT中涉及多个主要研究⽬的（或关键次要⽬的）都需要进⾏统计检验时，⼀般应采取策略保证总⼀类错误α控制在0.05以内，常见的策略包括固定次序检验、α拆分与回收以及Hochberg策略。FLAURA研究所采⽤的Sequential Multiple testing、ARCHER 1050研究采⽤的Gate-keeping strategy以及NEJ009研究采⽤的Hierarchical test策略，原理上是相似的，都属于固定次序检验。

固定次序检验是临床试验中常见的⼀种策略，通过事先将多个研究假设按照获得阳性结果的可能性进⾏排序，并逐⼀按统⼀的α标准（⼀般为0.05）进⾏统计检验，只有当前⼀次检验存在统计学差异时，才进⾏后⼀次假设检验的分析；当前⼀次检验⽆统计学差异时，则终⽌对后续检验的分析。该⽅法的优点是相⽐于α拆分，每⼀次检验的α标准不变，不影响总样本量。但值得注意的是，采⽤这种⽅法有赖于对可能阳性结果的假设检验排序有⾮常好的预判，否则可能⽆法很好的呈现更多结果。

ARCHER 1050研究⽐较第⼆代TKI达克替尼对⽐第⼀代TKI吉⾮替尼的疗效，研究⽅案统计分析计划中提到采⽤Gate-keeping strategy：检验次序为主要终点PFS、次要终点ORR（by IRC）、次要终点

OS。结果显⽰，试验组PFS获得显著改善，但ORR⽆明显差异。由于ORR未达到阳性结果，不应再对

英语四六级考试网OS进⾏统计检验；但KM曲线显⽰OS存在获益趋势。eva mendes

本文发布于:2023-05-24 03:04:41，感谢您对本站的认可！

本文链接：https://www.wtabcd.cn/fanwen/fan/78/753146.html

上一篇：表格拖拽SortableJS

下一篇：(完整版)高中重要短语take