信息来源:微信公众号--静远医学统计在线(微信号:jeeyor) 授权转载,点击阅读原文可进入该公众号。ICH E9临床试验的统计学指导原则解析(四十六)
* e* Q1 W f# ^& L" o2 I9 G
从临床试验实例来看样本含量的计算(一)
& U9 k; @+ n. _" C- s
关于样本含量,小胖在先期的一些博文中已做了一部分介绍,但由于各种原因并没有进行一些完整的介绍,从本文开始小胖将结合临床试验的实例对样本量的一些相关内容做一比较详细的介绍。
静注:针对临床试验实例的样本量计算系列的学习,我们就以NCSS-PASS软件为例,进行图文并茂的学习吧。需注意的一点是,PASS在计算时会适当微调一些参数(如α、β)来控制最后的样本量结果为整数,所以可能有时候PASS所算结果与公式计算的结果会有一点小区别。
% O. Z2 }1 T4 G5 ]+ @ \
我们先看一下以下两个临床试验的实例:
例1:贝伐单抗联合多西紫杉醇和卡培他滨术后新辅助治疗乳腺癌
研究目的:观察贝伐单抗联合多西紫杉醇和卡培他滨术后新辅助治疗乳腺癌的疗效
主要疗效指标:病理应答率
例2:高剂量普萘洛尔治疗心绞痛
研究目的:观察高剂量普萘洛尔治疗心绞痛的疗效
主要疗效指标:心率的下降值
碰到以上两种情况,你会怎么计算样本量?
2 s! t. ~6 q5 P# V5 Y- L/ ?
我们先看一下解决方案吧。
例1:
With an expected pathological response rate of 20%, the sample size of 62 patients allowed for the calculation of a 95% confidence interval with a precision of +/- 10%.
翻译:假设预计病理学应答率为20%,以95%可信区间估计,大约需要62例受试者可使病理学应答率在真值的+/- 10%内。
计算公式:
n = (Z1-α/2)2*P*(1-P)/d2
α=0.05则Z1-α/2=1.96
p=0.2
d=0.1
则n=1.96*1.96*0.2*(1-0.2)/(0.1*0.1)=62
静注:例1我们采用PASS的Confidence Intervals for One Proportion过程进行计算,结果为64例,其所填参数与计算结果详细如下两图。
3 f+ r4 W2 Z0 ]# E+ z' Q
例2
With an expected standard deviation of 15, the sample size of 35 patients allowed for the calculation of a 95% confidence interval with a precision of +/- 5.
翻译:假设心率下降的标准差为15,以95%可信区间估计,大约需要35例受试者可使心率下降值在真值的+/- 5内。
计算方法:
n = (Z1-α/2)2*s2/d2
α=0.05则Z1-α/2=1.96
s=15
d=5
则n=1.96*1.96*15*15/(5*5)=35
静注:例2我们采用PASS的Confidence Intervals for One Mean过程进行计算,结果为35例,其所填参数与计算结果详细如下两图。
下篇博文,我们将就以上两个例子反应的样本量的计算作一详细评论。
ICH E9临床试验的统计学指导原则解析(四十七)5 s2 D! a. w3 @+ P8 Y. {6 B3 m
从临床试验实例来看样本含量的计算(二)
0 d( K* g! P) J$ O! L4 Y; C
上篇博文中我们举了两个临床试验例子,那么这两个临床试验本身有什么特点呢,小胖简单总结了以下几点:
(1)研究设计都是单组非对照
(2)研究目的都是观察估计治疗的疗效值(病理学应答率和心率下降值),而不是检验某个检验假设
那么在两个试验计算样本量时,又有什么特点呢?
( h6 y8 i8 {& {1 K# h
其实我们在这两个试验中用到的样本量计算方法使用统计中一个很简单也是很基本的思路就是降低不确定度(reduce uncertainty)。怎么理解呢?
8 l @1 v5 W" O
上述两个试验目的都是想确定治疗组的疗效(病理学应答率和心率下降值)。此时所有的病人就是一个总体,而你选择的一定数量的病人就是一个样本,我们要做的就是用这个样本的疗效来估计总体的疗效,当然用样本来估计总体就会有一个准确不准确的问题,这时我们就需要适当地降低这种不准确度也就是我们常说的不确定度(reduce uncertainty),对于这个不确定度你自己得有个允许值,也就是说你最多能接受多大的不确定度,这个值就是我们常用到的精确度(precision),而这个又通过95%可信区间来实现,比如说咱要求咱估计出来的率的95%可信区间在总体值的+-5%范围内,你也可以这样简单地理解,就是你临床试验作出来的率和整个病人人群的率的差异不会超过+-5%。此时5%就是这个precision。很显然precision越小,你估计的越精确,当然需要的样本量越多。你也可以反过来想想,当你抽取的样本量越大,即做的受试者越多时,你估计出来的结果就越接近总体值啊。所以这种样本量的计算方法也叫precision-based sample size calculation。
, i# Q7 A+ b! ^) a
那对于precision-based sample size calculation,我们需要什么要素呢?
(1)研究的目的必须是估计某种疗效结局,可以是率,也可以是均数
(2)对于主要疗效指标是率的试验,需要粗略估计一个平率值即p值(比如例1中,我们估计病理学应答率为20%);对于主要疗效指标是均数的试验,需要粗略估计一个标准差(比如例2中,我们估计标准差为15)。
(3)精度水平也就是最大能接受的不确定度,例1中为10%,例2中为5;
(4)可信区间水平,一般取95%可信区间
率和标准差估计的tips:
(1)如果没有一个好的对p的估计值,最直接简单的方法就是p取0.5,此时最保守,样本量也最大
(2)对于标准差的估计,则可以参考以前的研究,专家的意见或预试验的结果
) m0 I4 f) J; M: p- n- P
小胖最后提出一个问题,上边的两个例子都是单组非对照的临床试验,那么对于两组对照的试验能不能也采用precision-based sample size calculation,如果采用这种样本量计算方法对临床试验有什么要求,又怎么计算呢?这个问题就留给下篇博文来解答吧。
2 a4 B& G* x7 Y9 l# _