非劣效性临床试验是评价试验药的治疗效果不比阳性对照药差的临床试验,目的在于证明试验药物与所选定的阳性对照药的疗效差别很小,这么小的差异没有临床上意义。本文主要介绍非劣效性临床试验中所涉及的统计学考虑。
8 a' f" V/ }! A" k0 |8 p一. 非劣效性检验的基本概念
5 i* Q8 v1 j7 A! m2 J
为了证明试验药与对照药的效应相差有无临床意义,需要定义一个“临床意义”的标准,即通常所说的“界值”,在非劣效试验中,称为“非劣效界值”。主要研究者从临床实践的角度、生物统计人员从数据分析的角度确定非劣效性界值,但以主要研究者为主。
/ b, z6 z' ~1 H# Z统计学上确定非劣效界值,分二个步骤,首先确定M1,在M1的基础上确定M2。
% B/ N# M$ y) j4 P( H. R/ o
1.1 M1界值的确定
' D$ e5 L/ E8 J2 P+ }; Z. D
M1是非劣效临床试验中阳性药物的全部效应值(相对于安慰剂的净效应)。应该根据阳性药的一个设计良好的安慰剂对照试验或多个试验的Meta分析结果。根据历史资料的同质性特征,可以采用固定效应模型或随机效应模型进行估计。
4 C+ Q; H7 ~/ |6 z如果阳性药曾有与安慰剂比较的随机对照试验资料,其假设检验一定为:$ ~: a: l4 Q) K
H0:C-P=04 j4 \+ K/ K* p+ r" r
H1:C-P>0
7 s9 i! p9 r/ Q+ z2 }- N9 }$ j
这里的(C-P)就是阳性药物相对于安慰剂的净效应,如果其双侧95%CI下限值(记为LCL)>0时,拒绝H0,说明阳性药的效应值优于安慰剂。
# c* ^; ~. v( D- _6 e3 u1 Q为了保守地估计阳性药的净效应,FDA建议采用LCL作为M1。
4 p$ u9 [* f3 | }
1.2 M2界值的确定
; K5 m% O4 c4 C d
虽然M1的非劣效性检验能够保证试验药物比安慰剂好,试验药的效果大于零。然而,在很多实例中,这并不能保证试验药物的有效性具有临床意义。应用非劣效性检验设计的原因在于需要考虑阳性对照药物的有效性,通常情况下,试验药丢失了阳性对照的大部分效应是不可接受的。因此在非劣效性研究中,需要选择或确定这个“不可接受”的界限,一般选择临床上可以接受的最大丢失值作为非劣效性检验的界值,记为M2。M2是临床可以接受的试验药较阳性对照药疗效差的最大界值,它应该小于M1,因为当M2比M1大时,表示试验药物将丧失阳性对照药的所有效应,是完全不能被接受的。FDA一般推荐M2=f*M1 (0<f<1)。
7 v5 h6 q, {) t* H由于T-P>C-P- M2 >(1-f)(C-P),就是说试验药最少能保持阳性对照药疗效的(1-f)倍,如果f=0.5,表示试验药能保持阳性对照药疗效的一半。f越小,(1-f)越大,说明试验药的疗效越接近阳性药。当然f 越小,所需样本量越大,但f过小时,样本量可能非常大,以至于根本无法实施试验,所以需要权衡选择一个合适的f值。一般地说f最大可取0.5. 即:要求试验药最少能保持阳性对照药疗效的50%。
% {+ x8 a2 u% ?- d8 u如果试验药物显示具有一些重要的优势时(例如在安全性方面或第二终点方面),则临床可接受的界值可以比较宽松。
; R9 q* [4 w9 S9 ^9 e: s0 { ]* C当既往没有阳性药与安慰剂的随机对照临床试验时,M2可以采用阳性药的效应值的10%~15%来确定。例如:阳性药疗效为70%,则M2=10%×70%或者15%×70%,即M2在7%~10.5%之间。
4 z4 s) k/ w; z) t( ?% f1.3 非劣效性假设检验
: ]7 k% H! s, L1 u% i/ X* C! R
所有非劣效性临床试验的方案,需要明确非劣效性假设检验:
9 h) j( h8 n6 ` V8 c
* M7 B1 `: i" VC:对照组效应,T:试验组效应
9 T4 Q+ v7 V' J9 g; }试验组与对照组的非劣效判断,可采用可信区间法:若上限小于M2,可认为试验组与对照组相比为非劣效。
# b7 `; l# u7 e7 ?# ~; u二. 执行偏倚对非劣效性临床试验结果的影响
! q: v1 l- [4 ]" s1 v
在优效性临床试验中,对方案的不依从,常常导致“失败”的结果,其分析人群是基于ITT原则的全分析人群。与之相反,非劣效试验中,对方案的不依从常常抹杀试验药与对照药效应异常,从而导致非劣效的成立。虽然在非劣效临床试验中,目前倾向于将符合方案集作为主要分析人群,但是执行偏倚对试验结果的影响,不仅无法采用统计学技术进行校正,而且其大小也难以评估。很多的非劣效临床试验的结果存在一个有趣的现象,即试验组总比对照组的效应高出一点点,这可能归因于执行偏倚。因此如何控制非劣效试验的执行偏倚,就显得尤其重要。我们认为,非劣效性临床试验的设计应该符合:
0 Z, f4 H+ M7 c" s v1. 试验方案(入排标准、用药情况等)尽可能与阳性药物历史研究相似
. R! y' M; y* {" x
2. 应该具有阳性对照药的充分、完备的临床资料以支持选择具有临床意义的非劣效性界值M1、M2;
: m! f& X; x: C7 h0 P
3. 科学合理的样本量估计方法,并按照样本估计值完成试验。
' o, v# l& v$ t* l- B+ y& G9 h J4. 严格按照方案执行临床试验,尽可能减少方案违背与偏倚的发生。
+ l i) x) Z" P/ s% B三. 临床实例:
. ]2 P0 [2 f: X
例1:M1,M2的选择
, h4 [, v9 {% {1 h# p, ?一个新药的临床试验中,根据所选取的阳性对照药,既往与安慰剂比较的随机对照试验资料显示:样本量为177对,阳性对照药有效率=0.52,双侧95%可信区间上下限值分别是0.446和0.594,安慰剂有效率=0.30,两组有效率差值的点估计为0.22,差值的双侧95%可信区间为0.1201~0.3199,由于下限是0.1201,故可取M1 =0.12,按照美国FDA保守的推荐可以取 M2=0.5×M1 =0.06。
% Y' `* j. d! b& D" o9 t如果选取的阳性对照药,以前没有与安慰剂比较的随机对照试验,建议可直接取阳性对照药疗效的10%~15%作为M2。本例资料可取M2=0.052 ~0.078。
* y) q; Z1 i6 L' k2 X- G例2:非劣效的判断
% w4 b. A) |8 t+ l1 G2 v
* C# J0 Y$ [( }
阳性对照药—试验药(C-T)
根据上图,我们可以认为:
: R) L% {* \) Z6 G
1. C-T点估计值≤0,双侧95%可信区间的上限< M2,提示非劣效成立,试验药物非劣于阳性对照药。
0 X4 V3 i& ? h. ~7 [' q
2. C-T的点估计值>0,表明阳性对照组更好,95%双侧可信区间上限小于M1但大于M2,显示试验药虽有疗效,但对阳性药物疗效的丧失不可接受;
) }3 [0 t5 o: Y: \; y
3. C-T点估计值=0,双侧95%可信区间上限小于M1但稍微大于M2,显示试验药有疗效,但非劣效不成立。
4 b, W0 Q8 @5 ^2 k+ u- B
4. C-T的点估计值大于0,95%双侧可信区间的上限> M1,提示非劣效不成立。
4 ^% D- u4 Y7 p: T: I$ Z R例如:评价某新药对心绞痛症状的缓解情况,采用与阳性药物的非劣效研究,主要指标为心绞痛症状缓解有效率,非劣效界值M2=10%。试验结果显示:阳性药物组340例受试者,有效率为78%;试验组338例,有效率80%。两组有效率差值=-2%,95%CI为-8.13%~4.13%。95%CI的上限小于10%,非劣效性成立,可以认为试验药物非劣于阳性对照药。
参考文献
1. Guidance for Industry, Non-Inferiority Clinical Trials, U.S. Department of Health and Human Services Food and Drug Administration Center。March 2010
B: ]3 J5 h4 u5 |. f) D" C7 D 2. Committee for Medicinal Products for Human Use (CHMP). Guideline on the Choice of the Non-Inferiority Margin.London, 27 July 2005 Doc. Ref. EMEA/CHMP/EWP/5872/03 Cor