单组⽬标值临床试验的统计学考虑
作者:中国临床试验⽣物统计学组(CCTS) 李卫,赵耐青(执笔)
随机对照临床试验(randomized controlled trial,RCT)是临床研究的⾦标准,药物/医疗器械临床研究中,尤其是提供关键证据的临床研究中⼀般均采⽤RCT。在极少数的医疗器械临床试验中,如采⽤随机对照试验,会存在伦理学风险,致使临床操作不可⾏。在此情况下,单组⽬标值(single-arm objective performan cecriteria,OPC)临床试验不失为⼀种替代策略,为产品注册提供关键证据。探索性研究也可采⽤单组⽬标值法。本⽂将对单组⽬标值法的定义、适⽤范围、⽬标值的确定以及评价⽅法等进⾏说明。
单组⽬标值的定义
单组⽬标值临床试验是指在事先指定主要评价指标的⼀个有临床意义⽬标值的前提下,通过⽆同期对照的单组临床试验考察该主要评价指标的结果是否在指定的⽬标值范围内,以此来评价被试产品有效性/安全性的⼀类⽅法。
⽬标值是指专业领域内公认的某医疗器械的有效性/安全性/性能评价指标所应达到的标准。
⽬标值的确定
单组⽬标值临床试验设计的关键是事先确定⽬标值,虽然没有同期平⾏对照,但设计时必须考虑适应证、受试⼈群、主要疗效评价指标及评价时间点,以保证当前试验所获得的结果与外部对照具有可⽐性,从⽽保证单组⽬标值法研究结果的科学性。
⽬标值的确定有以下三种⽅式。
1 临床试验监管部门指南
临床试验监管部门(例如:国家⾷品药品监督管理总局医疗器械技术审评中⼼)会针对某些特定产品制订涉及该产品临床试验的技术指导原则,如果指导原则中明确写明,该类产品可采⽤单组⽬标值对照的⽅式进⾏临床试验,且指南中对有效性和/或安全性和/或性能所对应的主要评价指标给出了明确的⽬标值。在此种情况下,可将指南推荐的⽬标值作为该产品临床试验主要评价指标的⽬标值。如2002年7⽉美国FDA发布的有关射频消融导管扩⼤室上速适应证的临床试验指导原则,提出了射频消融导管扩⼤室上速适应证的⽬标值:即刻成功率≥85%、远期成功率≥80%及主要并发症发⽣率
≤7%,只有当上述三项指标同时达到统计学要求时,才认为被试射频消融导管达到要求。
2 ⾏业标准或专家共识
如果监管部门没有相应产品的指导原则,可参考该产品所属专业领域公认的⾏业标准或公开发表的专
家共识,从中获得该医疗器械主要评价指标所应达到的疗效和/或安全性和/或性能⽔平,并以此⽔平作为⽬标值。可参考的⾏业标准包括但不限于ISO标准、国标、部标或⾏标等。如2014年美国⼼胸外科协会制定的外科⽣物瓣评价标准:主动脉瓣⾎栓栓塞发⽣率≤1.5%、⼆尖瓣⾎栓栓塞发⽣率≤1.3%、主动脉瓣瓣膜⾎栓发⽣率≤0.04%、⼆尖瓣瓣膜⾎栓发⽣率≤0.03%、及所有出⾎发⽣率≤1.4%等,只有当上述所有指标全部达到统计学要求时,⽅可认为被试瓣膜达到要求。
3 同类产品历史研究结果
当上述两种情况均不适⽤,可依据⽬前已上市的同类产品、相同适应证的RCT临床试验系统综述和/或meta分析结果作为⽬标值的确定依据。研究设计时要考虑到与历史研究的可⽐性,如研究⼈群、适应证、纳⼊和排除标准、疾病严重程度、主要评价指标及评价⽅法等。
由于疾病的严重程度、分型等因素有可能影响疗效,其构成⽐对总体疗效的估计是有直接影响的。因此,设计时需参考历史研究,明确规定相应亚组的构成⽐,以及当实际构成⽐与设定的构成⽐不⼀致时的校正⽅法。
安静
虽然有上述三种⽬标值的确定⽅式,但⾸选的⽅式是依据监管部门指南,其次是依据⾏业标准或专家共识,再次是依据同类产品历史研究结果的综合。⽆论采⽤何种⽅式,设定的⽬标值应该充分结合产品的特点,⽬标值应在研究⽅案设计阶段由申办⽅、临床研究者和统计学专家共同制定。⽆论采⽤何
种⽅法确定⽬标值,均建议事先与监管部门进⾏沟通,达成共识后开始临床试验。
单组⽬标值试验的检验假设、样本量估计与统计分析
单组⽬标值试验的检验假设、样本量估计与统计分析
单组⽬标值法的假设检验对应于单侧检验。在不同试验中,根据研究的⽬的,主要评价指标可分为⾼优指标(如:有效率)或低优指标(如:不良事件发⽣率)。下⾯将针对不同的变量类型,分别按照⾼优指标或低优指标的情况,给出相应的检验假设、样本量估计以及对应的评价⽅法。
1 检验假设
设θ1为主要评价指标的总体参数,θ0为主要评价指标的⽬标值。单组⽬标值法的假设为:
对于低优指标:H0:θ1≥θ0,H1:θ1<θ0
对于⾼优指标:H0:θ1≤θ0,H1:θ1>θ0
检验⽔准为α取0.025。
女人图片大全2 样本量估计
样本量估计是临床试验设计中极为重要的环节,充⾜的样本量能够保证试验有⾜够的检验效能发现实际存在的差异。单组⽬标值法的样本量估计所需的参数包括:主要评价指标的总体参数、⽬标值、I类错误率α、II类错误率β(1-β为检验效能)。
(1)率的样本量估计
样本量计算需包含如下参数:
π1:被试产品的预期总体发⽣率;
π0:被试产品的率的⽬标值;
对应的样本量计算公式为:
式中,α为检验⽔准,建议取单侧0.025;1-β为检验效能,⼀般取值80%或以上;π0为⽬标值;π1为总体率;Z1-α和Z1-β为标准正态分位数。
公式(1)给出的是率的正态近似的样本量计算公式,当⽬标值π0或总体参数π1接近100%或0%时,应采⽤确切概率法计算样本量。
(2)均数的样本量估计
样本量计算需包含如下参数:
µ1:被试产品主要评价指标总体均数;
µ0:被试产品主要评价指标均数的⽬标值;
σ:主要评价指标的预期标准差。
对应的样本量计算公式为
公式(1)及(2)同时适⽤于⾼优或低优指标。
研究⽅案中应明确样本量计算⽅法及其依据。
研究⽅案中应明确样本量计算⽅法及其依据。
多个主要指标试验样本量的确定,应充分考虑I类错误的控制,同时也应注意是否达到预设的总检验效能。
3 统计分析
单组⽬标值试验的统计学推断。带有酒的诗句
(1)假设检验
单组⽬标值法相应的假设检验为单侧检验。当P≤α时,拒绝H0,认为试验产品达到设计要求。
假设检验⽅法是设计时确定的,分析时应考察是否满⾜应⽤条件。
对率的假设检验,当总体率π接近0%或100%时,应选择确切概率法
(2)置信区间法
试验结果也可以根据置信区间是否包含⽬标值来评价。主要评价指标为⾼优指标时,如果被试产品主要评价指标(1-
2α)%双侧置信区间的下限⾼于⽬标值,则认为被试产品达到设计要求;主要评价指标为低优指标时,如果被试产品主要评价指标(1-2α)%双侧置信区间的上限低于⽬标值,则认为被试产品达到设计要求。
对率的假设检验,当总体率π接近0%或100%时建议⽤Clopper Pearson精确概率法构建置信区间。
对于主要评价指标,应同时给出全分析集(FAS)和符合⽅案集(PPS)的统计分析结果。
实例分析
某临床试验欲验证体外循环⼿术患者使⽤⼀次性膜式氧合器进⾏⾎⽓交换的有效性和安全性,试验采⽤单组⽬标值法设计,主要评价指标为产品达标率(产品达标需满⾜:氧合性能、⼆氧化碳排除能⼒和变温能⼒达到CFDA指南中的评价标准要求),基于CFDA指南,该研究中达标率⽬标值应⾄少90%,预期达标率为95%。
1 建⽴检验假设,确定检验⽔准
H 0:π1 ≤0,H 1:π1 >0
其中,π1为总体达标率(预期能达到95%),π0为⽬标值(规定为90%)。检验⽔准α取0.025。
单组⽬标值设计实际是采⽤样本统计量与总体参数差异性检验作统计推断的,虽然单组⽬标值设计α取双侧0.05.实际上监管部门仅通过估计的总体参数的95%置信区间的上限(低优指标)或下限(⾼优指标)与预先设定的⾮劣效界值进⾏⽐较,来判定被试产品是否能达到临床要求,因此实际上α也相当于取0.025。由此可见,单组⽬标值设计中α取0.025(单侧)与α取0.05(双侧)相同。
淮安旅游
2 确定试验所需样本量
假设本试验总体达标率为95%,⽬标值为90%。当单侧检验的检验⽔准取0.025,检验效能取80%时,根据样本量计算公式(1)得试验⾄少需要⼊选239例受试者,考虑研究过程有5%受试者的脱落,本试验预计⼊选252例受试者。
3 计算⼀次性膜式氧合器产品达标率的点估计及其双侧95%置信区间:
施工进度计划表本研究⼊组260名受试者,有250名受试者达标,产品达标率点估计及其双侧95%置信区间为96.2%(93.8%,98.5%)。
4 结果解释:
统计分析结果显⽰,⼀次性膜式氧合器产品达标率的双侧95%置信区间下限值为93.8%,⼤于⽬标值90%,可以认为该⼀次性膜式氧合器能够达到临床应⽤的要求。
⼀次性膜式氧合器能够达到临床应⽤的要求。
单组⽬标值试验的局限性及适⽤范围
单组⽬标值法的主要缺陷是难以从设计上控制选择性偏倚和评价偏倚。由于单组⽬标值法采⽤的是历史信息对照(简称历史对照),受时间、空间的限制,历史对照的受试者与本次试验的受试者可能来⾃
不同的总体;除试验因素外,可能影响试验结果的因素众多,如⼈⼝学特征、诊断标准、诊断技术、疾病分期或亚型、疾病严重程度、伴随⽤药和观察条件等,致使试验组和外部对照组可⽐性差;此外,还可能有⼀些潜在的、⾮常重要但未被认知的、或⽆法测量的预后因⼦也可能影响试验结果。另⼀⽅⾯,由于缺乏同期平⾏对照,难以对不良事件与产品的相关性、以及不良事件发⽣率进⾏科学的评价。因此单组⽬标值法⼀般仅适⽤于安全性良好、不良事件发⽣率很低的产品/适应证。鉴于单组⽬标值法的固有缺陷,其应⽤范围是极其局限的。
同样,仍是由于没有同期对照组的原因,单组⽬标值法原则上仅适⽤于⾮⾃限性疾病/适应证,⾄少在临床试验的疗效评价阶段⾃愈、症状缓解或部分缓解的可能性较⼩。对于有⾃愈倾向的病症,如不得不采⽤单组⽬标值时,需有充分的证据,能准确估计在临床试验的疗效评价阶段受试者⾃愈、症状缓解或部分缓解的发⽣率,应通过对产品⽬标值的合理设置,确保在排除⾃⾏痊愈、缓解或部分缓解的影响以后,其产品的有效性仍在临床可以接受的范围内。
正是由于上述局限性,选择单组⽬标值法进⾏医疗器械临床试验时应极为审慎。通常,仅在某些探索性的试验中,考虑采⽤单组⽬标值试验设计。⼀般来说,对于⽤于⽀持产品上市的关键性临床试验,仅在以下三种情况时,才有可能考虑采⽤单组⽬标值法对被试产品开展关键性临床试验:(1)与现有治疗⽅法相差过于悬殊;(2)被试器械为换代产品(其前代已上市多年,为技术成熟产品),且本质上没有发⽣太多的改变,仅对外形设计等进⾏少许改进;(3)医疗器械临床试验审评审批等相关机构已制订针对此类
依法行政的内涵产品有效性和安全性指标的评价标准。
陕西省高校排名总之,为了客观评价产品的安全性和有效性、规避产品研发及评价风险,建议医疗器械临床试验申办⽅在临床试验⽅案设计阶段与临床医学专家、⽣物统计学家和法规监管部门进⾏充分的沟通和协商,达成共识后⽅能进⾏单组⽬标值临床试验。
应⽤注意事项
1 质量控制
⾼⽔平的试验质控是单组⽬标值试验结果真实可靠的必要保障。由于⽬标值试验的受试者选择偏倚、测量偏倚、评价偏倚等的潜在风险较⼤,因此,试验过程中应采取合理的措施尽可能弥补试验设计本⾝的缺陷。(1)尽可能的采⽤相对客观,可重复性强的“临床终点”作为主要终点指标,如死亡、操作失败等;不建议选择容易受主观因素影响、可重复性差的指标作为主要评价指标,也不建议⽤与临床客观终点指标相关性不⾼的“替代终点”作为主要评价指标。(2)尽可能的提⾼随访质量,设置合理的随访频度,尽最⼤可能控制受试者脱落。(3)为了保证数据的完整性,⿎励采⽤中央注册登记系统记录所有筛选受试者的全部信息,以避免事后⼈为筛选受试者。
2 主要评价指标缺失值的处理
与随机对照临床试验⼀样,单组⽬标值试验中应尽可能避免数据缺失。特别是主要评价指标的缺失。当主要评价指标缺失时,应采⽤敏感性分析,如:最差值法(worstcascenario),临界点分析(tippingpoint)等⽅法,以说明结果的稳健性。缺失值的处理⽅法应事先在研究⽅案和/或统计分析计划书中予以明确。
常见问题回答
1.乐观估计总体疗效π1值导致的风险?
乐观估计总体疗效,会低估研究所需要的样本量,将导致检验效能不⾜,增加临床试验失败的风险。建议在尽可能接近被试产品真实⽔平的前提下,对被试产品的总体成功率作保守的估计,以避免由于低检验效能致使试验失败。即使是被试产品成功率⾮常⾼、⼏乎不可能失败时,在进⾏研究设计时,通常也不建议按照100%成功率进⾏样本量估计。
2.单组⽬标值临床试验是否没有对照?
事实上,单组⽬标值临床试验采⽤的是历史信息对照或理论对照。⽬标值法不同于传统的⾃⾝前后对照,后者仅评价主要评价指标的⽔平在治疗前后是否有变化。⽽单组⽬标值法,则要求主要评价指标不但有改变,⽽且要求改变的程度必须达到临床的最低要求或同类产品具有的疗效⽔平(即:⽬标值)。
时和岁丰
3.单组⽬标值试验的样本量是否相对较⼩?
不⼀定。单组⽬标值试验的样本量取决于相应参数的设定。当被试产品的预期疗效与⽬标值相近时,所需样本量是很⼤的。
4.试验终点指标的点估计超过⽬标值时,是否就可以认为达到设计要求?
不可以。应采⽤假设检验或置信区间对试验结果做出判断,仅点估计达到⽬标值还不⾜以说明产品达到设计要求.