【肿瘤临床研究】篮式研究,伞试研究……傻傻分不清楚?
之前,我们与⼤家分享了抗肿瘤药物临床研究的疗效终点统计分析原则“常⽤抗肿瘤药物的疗效终点,统计分析该注意什么?” 以及探索性试验的开展原则 “抗肿瘤药物的探索性试验该如何开展?” 。本期, “嘉议肿瘤”周⼀“肿瘤临床研究专栏”将继续与⼤家分享抗肿瘤药物临床确证性试验的设计类型及原则。
确证性试验
J- ONCOL
⼀般考虑
在设计确证性试验时,申办者应根据临床试验的⽬的明确要估计的治疗效应。申办者在⽅案中应阐明研究⼈群、终点指标、治疗⽅案,应考虑试验过程中可能发⽣的影响治疗效应估计的伴发事件,如死亡、转组等,群体层⾯的汇总统计量、统计模型以及相应的敏感性分析也均应事先定义。
秦玥飞
虽然减少研究⼈群的异质性可能会提⾼统计检验效能,但对⽬标⼈群的限制会使新药在实际应⽤中的效果难以评估。应基于证据选择最佳可⽤的治疗作为对照,因此,根据情况⼀般可以选择BSC、SOC或研究者选择性治疗作为对照。
盲法设计是确证性试验控制偏倚的重要⼿段之⼀。如果临床试验只能使⽤开放设计(如因不同药物间毒性特征差异明显⽽使⽤开放设计),必须采取所有可能的措施来控制潜在的偏倚,⽐如对申办者试验团队遮蔽关键数据。
⽆论采⽤开放设计还是双盲或单盲设计,对于重要且潜在的可能影响药物疗效的基线协变量,建议在随机化时予以考虑,对基线协变量的校正分析应在⽅案以及统计分析计划中事先规定。
当使⽤预测⽣物标志物进⾏分层时,必须预先规定⽣物标志物及其确定⽣物标志物状态(阳性或阴性)的阈值,且阈值的确定⽅法必须经过科学验证并得到公认。
确证性试验的整体I类错误率必须严格控制在⼀定⽔平。如果研究的主要⽬的中包括对多个⼈群(例如⽣物标志物阳性⼈群和所有患者⼈群)或多个终点(例如OS、PFS和ORR)进⾏假设检验时,或者计划实施因有效⽽提前终⽌试验的期中分析时,应选择合适的多重性控制策略,并在⽅案以及统计分析计划中事先进⾏详细规定。计划因有效⽽提前终⽌试验的同时需要考虑安全性评价数据的充分性。
J- ONCOL
试验设计
传统的研究设计⽤于抗肿瘤药物临床试验时,可参考如ICH E9等相关的指导原则。随着抗肿瘤药物研
发的快速发展,⼀些新颖的试验设计在确证性试验中得以合理应⽤,包括适应性⽆缝剂量选择的设计、两阶段适应性设计、富集设计和主⽅案设计等,⼤⼤提⾼了临床研发的效率。
1.成组序贯设计
成组序贯设计通常⽤于按时间顺序进⾏的数据监测或对累积的数据进⾏统计推断。在设计成组序贯试验时,申办者应仔细考虑计划进⾏的期中分析次数和时间点,以及合适的α消耗函数。对于因有效性⽽提前停⽌的试验,⿎励申办者继续随访试验直⾄数据成熟,以更好地了解试验药物的长期临床获益。
阳光下的守望当期中分析或最终分析的时间点是由事件驱动时,主要数据集的确定应基于达到⽬标事件数量时的截⽌⽇期。在揭盲分析之前应确保在盲态状态下完成数据的收集和清理。由于可能存在收集偏倚,揭盲之后收集的数据将受到严格审查,甚⾄从分析集中排除。
2.两阶段适应性设计
华为手机主题
传统药物研发遵循先进⾏II期试验,再进⾏III期试验的序贯⽅法。II期试验⽤于临床概念验证、剂量选择、⼈群选择甚⾄终点选择。在获得II期数据后会决定是否开始III期研究。III期试验需要时间来计划、启动和实施。
适应性⽆缝II/III期设计作为两阶段适应性设计中的⼀个特例,试图消除II期和III期试验之间的空⽩期。可以采⽤操作⽆缝设计,将II期试验受试者排除在主要分析之外,也可以采⽤推断⽆缝设计,在主要分析中纳⼊II期试验受试者。前者不需要对I类错误的控制进⾏多重性调整,但对于后者,则可能需要根据适应性的性质和假设检验策略做出相应的调整。
在决定采取⽆缝设计⽽不是序贯设计之前,应考虑两个重要因素:
•
⾸先,从II期试验⽆缝过渡到III期试验时有⾜够的信息来⽀持合理决策。这通常取决于参与II期数据分析的受试者⼈数以及II期试验采⽤的终点指标是否对决策有帮助。
•
第⼆,操作层⾯上可以顺利实施。⽆缝设计要求能够迅速地对数据进⾏清理和分析,快速增加III期⼊组⼈数,并能够加快药物上市的进程。
决定采⽤操作⽆缝设计或者推断⽆缝设计的关键考虑因素在于II期试验中适应性决策的复杂性。⼀般来说,和操作⽆缝设计不同,II期和III期试验结果之间的⼀致性对推断⽆缝设计来说更为重要。
公元前350年3.富集设计
为了优化试验药物的获益-风险特征,确定适当的⽬标⼈群⾄关重要。合适的⽣物标志物可以通过各种不同的诊断⽅法(如转录物的表达谱分析、差异抗原表达、遗传诊断,包括下⼀代测序等)来识别和测量。由于多种可能性的存在,判断哪些⽣物标志物可以预测药物活性,以及如何在早期开发过程中确定⽣物标志物的阈值仍是⼀个挑战。
会计的本质
为减少选择偏倚,应事先将研究受试者分成两组,并指定⽤于发现和确认⽣物标志物的训练集和验证集。每次调查新的⽣物标志物时,都需要重复这个产⽣和检验假设的过程。基于单臂试验发现的预测型⽣物标志物,不论其研究实施得如何严格,实际仍存在只是⼀种预后型⽣物标志物(可采⽤前瞻性流⾏病学研究以评估其预后效果)或者是仅能预测短期肿瘤反应的⽣物志记物(需要进⾏更长时间的随访)的可能。
在随后的确证性试验设计中,必须考虑到上述不确定性。例如,当涉及到两个亚组⼈群之间的α分配时,若采取向下(step-down)法,则需要确定检验的层级性,⽽前期数据对此⽆法提供充分⽀持,此时最好能选取更恰当的⽅法进⾏α分配。此外,对于I类错误率控制的考虑,在涉及⼈群选择和试验扩展的统计设计中会更加复杂。在正式开展试验前,应衡量各种设计⽅案的利弊,并妥善解决监管部门所关注的问题。
4.主⽅案设计恋爱犀牛
在单⼀⽅案下同时检测多种试验药物和/或多个肿瘤适应证,且⽆需为每次试验制定新⽅案的试验设计,称为主⽅案设计,它包括篮式设计、伞式设计和平台设计。
在有或⽆⽣物标志物富集的患者⼈群中同时研究⼀种试验药物在多个肿瘤适应证中的试验,被称为篮式试验。确证性篮式试验的主要研究⼈群通常包括具有独特分⼦标记的患者。
考虑到⽆效的肿瘤队列可能会稀释整体治疗效果,因此肿瘤适应证的初步选择必须基于重要的科学和临床证据,以便为数据合并奠定坚实的基础,降低试验失败的风险。
基于期中分析数据将疗效较差的肿瘤队列从最终的合并分析中去除可以进⼀步将风险降⾄最低,但可能会导致整体I类错误控制⽅⾯的问题,需要进⾏适当的多重性调整。去掉⽆效队列后,剩余肿瘤队列的样本量也将进⾏重新调整,以维持最终合并分析的统计效能。合并分析前还要考虑队列间的异质性。在这种情况下,样本量重新调整策略必须事先制定并与监管部门达成⼀致。如果I类错误能够得到适当控制,确证性篮式试验也可以考虑其它如贝叶斯等设计⽅法。
⽆论采⽤哪种设计⽅法进⾏篮式试验,在合并分析中拒绝全局原假设并不意味着试验药物在所有参与合并分析的肿瘤适应证中同样有效,也不意味所有适应证均应获得批准。就基线特征对治疗效果的影响⽽⾔,与传统的III期试验相似,监管部门基于确证性篮式试验做出是否批准药物上市或同意说明书范围的决定将取决于额外分析的结果(例如合并分析中的治疗效果是否主要由某特定肿瘤适应证⼦集自由式轮滑
所决定,试验药物的获益-风险特征在单个肿瘤队列中是否有利)。另外也可能需要通过上市后研究进⼀步证实临床获益。
作为篮式试验的补充,伞式试验可以在同⼀肿瘤适应证中同时研究多种试验药物。伞式试验中试验药物可以持续的加⼊或移出。当有多个试验组(或药物队列)开放⼊组时,应该采⽤随机化设计。随机化⽐率可以根据试验中新出现的数据
或移出。当有多个试验组(或药物队列)开放⼊组时,应该采⽤随机化设计。随机化⽐率可以根据试验中新出现的数据进⾏调整,以倾向于更有前景的治疗组,并提前终⽌⽆效治疗组。
由于试验药物的研究是在同⼀个平台上进⾏,且通常在某些特定的研究中⼼开展,因⽽不同药物队列之间患者群体的异质性可能较⼩,试验药物之间的⽐较也会⽐单独研究的结果更可信。
随机对照伞式/平台试验可看作⼀种特殊类型的多臂III期试验,因此可遵循相同的原则进⾏多重性调整。如果试验的重点在于分别回答每⼀种治疗的疗效问题,⽽不是为了得到总体疗效的单个结论声明,则与单独的对照试验相⽐,采⽤共同对照的伞式/平台试验的总体I类错误率总是更低,原则上不需要进⾏多重性调整。
但是,如果试验中包含了同⼀治疗的不同剂量组,则必需进⾏多重性调整以回答该治疗的疗效问题。
若试验中同时采⽤了响应适应性随机化或其他适应性设计,多重性问题的控制将更为复杂。在随机对照伞式/平台试验中,试验组和对照组之间的主要⽐较⼀般应基于同期参加试验被随机分配的受试者。
参考⽂献:
1. Bretz F, Maurer W, Brannath W, et al. A graphical approach to quentially rejective multiple test procedures[J]. Statistics in medicine, 2009, 28(4): 586-604.
2. Chapman P B, Hauschild A, Robert C, et al. Improved survival with vemurafenib in melanoma with BRAF V600E mutation[J]. New England Journal of Medicine, 2011, 364(26): 2507-2516.
3. Chen C, Li X N, Li W, et al. Adaptive expansion of biomarker populations in pha 3 clinical trials[J]. Contemporary clinical trials, 2018, 71: 181-185.
4. Freidlin B, Simon R. Adaptive signature design: an adaptive clinical trial design for generating and prospectively testing a gene expression signature for nsitive patients[J]. Clinical cancer rearch, 2005, 11(21): 7872-7878.
5. Garrett-Mayer E. The continual reasssment method for do-finding studies: a tutorial[J]. Clinical trials, 2006, 3(1): 57-71.
6. Hobbs B P, Barata P C, Kanjanapan Y, et al. Seamless designs: current practice and considerations for early-pha drug development in oncology[J]. JNCI: Journal of the National Cancer Institute, 2019, 111(2): 118-128.
7. Howard D R, Brown J M, Todd S, et al. Recommendations on multiple testing adjustment in multi-arm trials with a shared control group[J]. Statistical methods in medical rearch, 2018, 27(5): 1513-1530.
8. ICH. E9 (R1) Addendum on estimands and nsitivity analysis in clinical trials to the guideline on statistical principles for clinical trials. 2019.
9. Ji Y, Liu P, Li Y, et al. A modified toxicity probability interval method for do-finding trials[J]. Clinical trials, 2010,
7(6): 653-663.
10. Kang S P, Gergich K, Lubiniecki G M, et al. Pembrolizumab KEYNOTE-001: an adaptive study leading to accelerated approval for two indications and a companion diagnostic[J]. Annals of oncology, 2017, 28(6): 1388-1398.
11. Mandrekar S J, Sargent D J. Clinical trial designs for predictive biomarker validation: theoretical considerations and practical challenges[J]. Journal of clinical oncology, 2009, 27(24): 4027.
12. Mayawala K, T A, Rubin E H, et al. Do finding versus speed in amless immune-oncology drug development[J]. The journal of clinical pharmacology, 2017, 57: S143-S145.
13. Proschan M A, Follmann D A. Multiple comparisons with control in a single experiment versus parate experiments: why do we feel differently?[J]. The american statistician, 1995, 49(2): 144-149.
14. Schwartz L H, Litière S, de Vries E, et al. RECIST 1.1—update and clarification: from the RECIST committee[J]. European journal of cancer, 2016, 62: 132-137.
European journal of cancer, 2016, 62: 132-137.冬瓜丸子粉丝汤
15. Seymour L, Bogaerts J, Perrone A, et al. iRECIST: guidelines for respon criteria for u in trials testing immunotherapeutics[J]. The lancet oncology, 2017, 18(3): e143-e152.
16. Sun L Z, Kang S P, Chen C. Testing monotherapy and combination therapy in one trial with biomarker consideration[J]. Contemporary clinical trials, 2019, 82: 53-59.
17. Yuan Y, Hess K R, Hilnbeck S G, et al. Bayesian optimal interval design: a simple and well-performing design for pha I oncology trials[J]. Clinical cancer rearch, 2016, 22(17): 4291-4301.20
18. Zhou H, Yuan Y, Nie L. Accuracy, safety, and reliability of novel pha I trial design[J]. Clinical cancer rearch, 2018, 24(18): 4357-4364
*本⽂参考国家药品监督管理局药品审评中⼼2020年12⽉发布的《抗肿瘤药物临床试验统计学设计指导原则》摘编改写,原⽂请查看国家药品监督管理局药品审评中⼼--指导原则专栏
版权信息
本⽂由嘉议肿瘤编辑部负责编写或约稿。如需转载,请联系********************。未经授权使⽤⽂章内容及部分内容是侵权⾏为,版权⽅保留追究法律责任的权利。