从临床试验实例来看样本含量的计算(五)
前几篇博文,我们详细介绍了描述性统计分析试验的样本量计算方法-precision based sample size calculation,但众所周知,我们接触到的绝大部分试验都是验证性试验(confirmatory trial),都是建立在假设检验基础上的研究设计,因此对其样本量的计算应基于检验假设、显著性水平及把握度等,这就是我们通常所称的power based sample size calculation。我们先看一下下边的例子吧:
例5:Clin Ther. 2008 Aug;30(8):1492-504.
4 \) d% U6 ` K' ~4 b- B
沙美特罗氟替卡松对比孟鲁司特治疗儿童哮喘的双盲双模拟随机对照研究
研究目的:比较沙美特罗氟替卡松和孟鲁司特治疗儿童哮喘的疗效和安全性
主要疗效指标:晨间最大呼气流量与基线相比的变化值
样本量计算描述:
With a SD of 60 L/min in both treatment groups, a minimum of 526 evaluable patients (263 per arm) would be required to detect a difference between treatment groups of 17 L/min at P = 0.05 (2-tailed), with a power of 90%.
解释:假设标准差为60 L/min,至少需要526例病人(每组263例)有90%的把握度在显著性水平为0.05(双侧)上检验出两组17 L/min的差异。
例6:Lancet 2001; 358: 958–65
聚乙二醇干扰素alpha-2b联合利巴韦林对比普通干扰素alpha-2b联合利巴韦林初始治疗慢性丙型肝炎的随机对照研究
研究目的:比较聚乙二醇干扰素alpha-2b联合利巴韦林对比普通干扰素alpha-2b联合利巴韦林初始治疗慢性丙型肝炎的疗效和安全性
主要疗效指标:持续应答率(SVR)
样本量计算描述:
This study was designed to have 525 patients per group so as to achieve 90% power to detect a 10% difference in SVR rates (40% vs 50%), at the 5% level of significance.
解释:假设普通干扰素alpha-2b和聚乙二醇干扰素alpha-2b两组的持续应答率分别为40%和50%,则每组需要525例病人有90%的把握度在显著性水平为0.05的基础上检验出两组持续应答率10%的差异。
以上两个例子就是临床试验中最常见的两种样本量计算的情况,例5的为连续性变量的样本量计算,例6为分类性变量的计算,下一篇博文,小胖将就这两种样本量的计算方法和思路作一详细的介绍。
小胖说统计之七十四:ICH E9临床试验的统计学指导原则解析(五十一)
从临床试验实例来看样本含量的计算(六)
上篇博文,小胖列举了两个临床试验样本量确定的例子,那么这两个临床试验本身有什么特点呢?
(1)研究设计都是随机对照研究
(2)研究目的都是对治疗组之间的疗效进行比较
(3)研究设计都是基于检验假设,而统计分析则是为了验证检验假设
基于此,我们在计算样本量时用到的也是与前边所提及的precision based sample size calculation所截然不同的power based sample size calculation。
下边我们先看一下这两个例子中具体的计算方法吧:
(1)根据连续性变量的样本量计算:
例5中的样本量计算是根据主要疗效指标晨间最大呼气流量与基线相比的变化值这个连续性变量来计算的,具体计算方法:
预先制定的参数:
Δ:希望检测出的差异值,这里Δ=17;
σ:标准差 ,这里σ=60;
α:I类错误概率,也叫显著性水平,这里α=0.05
1-β:把握度(power),这里为90%,1-β=0.9,β=0.1
单侧还是双侧检验:这里为双侧
计算公式:
N=[2×σ×σ/(Δ×Δ)]×f(α,β)
f(α,β)是根据α和β计算所得,由于我们α一般都取0.05,在α=0.05时,对应不同的power ,f(α,β)大概值有个简单方便的表格,如下:
Power | β | f(α,β) | |
单侧 | 双侧 | ||
70% | 0.30 | 4.7 | 6.2 |
75% | 0.25 | 5.4 | 6.9 |
80% | 0.20 | 6.2 | 7.85 |
85% | 0.15 | 7.2 | 9.0 |
90% | 0.10 | 8.6 | 10.5 |
95% | 0.05 | 10.8 | 13.0 |
例5中,power为90%,α=0.05 双侧,那么f(α,β)查表应该为10.5。
因此n=[2×σ×σ/(Δ×Δ)]×f(α,β)=[2×60×60/(17×17)]×10.5=262
每组262例和文中所述大体一致
/ r* \0 `8 r& v# c4 E+ Q& o& E# i
静注:例5我们采用PASS的Inequality Tests for Two Means using Differences (Two-Sample T-Test)过程进行计算,结果为262例,其所填参数与计算结果详细如下两图。
(2)根据分类变量的样本量计算:
例6中的样本量计算是根据主要疗效持续应答率这个分类变量来计算的,具体计算方法:
预先制定的参数:
P1:试验组的率,这里为50%
P2:对照组的率,这里为40%
α:I类错误概率,也叫显著性水平,这里α=0.05
1-β:把握度(power),这里为90%,1-β=0.9,β=0.1
单侧还是双侧检验:这里为双侧
计算公式:
N={[P1×(1-P1)+P2×(1-P2)]/[(P1-P2)×(P1-P2)]}×f(α,β)= {[0.5×(1-0.5)+0.4×(1-0.4)]/[(0.5-0.4)×(0.5-0.4)]}×10.5=515
每组515例和文中所述大体一致。
另外有人还会采取另一种计算公式,即:
N={[2×P×(1-P)]/[(P1-P2)×(P1-P2)]}×f(α,β)
这里P=(P1+P2)/2=(0.5+0.4)/2=0.45
这时N={[2×0.45×(1-0.45)]/[(0.5-0.4)×(0.5-0.4)]}×10.5=520
两个计算结果类似。
/ ?) J7 ?/ `. A. ~& N+ U欢迎光临 药群论坛 (http://yaoqun.net/) | Powered by Discuz! X3.2 |