跟着小胖学统计038：ICH E9临床试验的统计学指导原则解析（五十二）-（五十七） - 药群论坛

9 A5 O# D$ o4 t1 r$ FICH E9临床试验的统计学指导原则解析（五十五）

从临床试验实例来看样本含量的计算（十）

前边的博文小胖介绍的都是基于连续性变量和分类变量的样本量计算方法，其实在我们的临床试验中特别是在肿瘤临床试验中还有一种十分重要的变量类型，即time to event（时间事件）变量，也就是我们通常所说的生存数据，比较常见的如OS（总体生存）、PFS（未进展生存）等。这类试验的样本量的计算与传统的样本量计算有所不同，从本篇博文开始，小胖将就这种类型试验的样本量的计算作一简单介绍。

例8：N Engl J Med. 2009 Feb 5;360(6):563-72

Chemotherapy, bevacizumab, and cetuximab in metastatic colorectal cancer.

基本的研究设计情况：随机、开放的III期研究，受试者按照1：1的比例被随机分配到capecitabine–bevacizumab (CB)组合和capecitabine–bevacizumab–cetuximab (CBC)组。

主要终点：未进展生存（PFS）

样本量确定的描述：

It was estimated that with 540 events (progression or death), a two-sided log-rank test at a significance level of 5% would have a power of 80% to detect a difference in median progression-free survival of 11 to 14 months (hazard ratio, 0.79). On the assumption of an accrual and follow-up period of 36 months, we planned to include approximately 750 patients in the study.

例9：N Engl J Med. 2003 Nov 6;349(19):1793-802

A randomized trial of letrozole in postmenopausal women after five years of tamoxifen therapy for early-stage breast cancer

基本的研究设计情况：随机、双盲、安慰剂的III期研究，受试者按照1：1的比例被随机分配到letrozole (2.5 mg)组和安慰剂组。

主要终点：无病生存（disease-free survival, DFS）

样本量确定的描述：

The sample size was calculated under the assumptions of a four-year disease-free survival rate of 88 percent in the placebo group and the detection of a difference of 2.5 percent in the four-year disease-free survival rate (hazard ratio for local or metastatic recurrence of the disease or the diagnosis of contralateral breast cancer, 0.78), with 80 percent power at a two-sided alpha level of 0.05. These assumptions necessitated the enrollment of 4800 women over a four-year period with two years of follow-up, accounting for 515 events.

以上所提到的两个例子是生存分析试验中计算样本量最简单也是最常见的方法，这个方法由Freedman LS提出，其发表的文章为Tables of the number of patients required in clinical trials using the logrank test，Stat Med. 1982 Apr-Jun;1(2):121-9.

大家可以从上边的两个例子中发现，与先前提到的基于连续性变量和分类变量额样本量估算方法有所不同，基于time to event变量的样本量计算方法首先估算的是events的数量。这一点其实是与time to event变量的性质相关的，在主要终点是time to event变量的临床试验中，power是由临床试验中观察到的events的数量决定的，而不是直接由受试者的数量决定的。说白了，就是必须由足够数量的病人进入试验，然后随访足够的时间，以便能观察到所需数量的events。因此，这种临床试验样本量的确定一般要分两步：（1）先确定所需的events 的数量；（2）确定所需受试者的数量。

下一篇博文中，小胖将具体介绍一下，上述两个例子中所用到的样本量的计算方法。

小胖说统计之七十九：ICH E9临床试验的统计学指导原则解析（五十六）

& G V7 b0 P6 j, d# A' ?+ B

从临床试验实例来看样本含量的计算（十一）

上文中列举了一个time to event变量样本量确定的例子，如前面所说这时样本量的确定的第一步就是计算events数量，那下边我们具体看一下events的计算方法吧：

假设两组1：1随机分配：

e＝f(α，β)×[(HR+1)×(HR+1)]/[(HR－1)×(HR－1)]

上述计算出来的e值就是总共需要的events数量。

其中f(α，β)和前边所提的一样，是根据α和β计算出来的，具体数值可以参见前文所提的表格

HR为hazard ratio

从上边的计算公式来看，确定events数量的关键是确定HR，而HR的简单估计有两种方法：

（1）根据median survival time来确定，比较简单的估计方法是：

HR= 第一组的median survival time/第二组的median survival time；

例8中，HR就是根据median progression-free survival time来估计的，两组的中位未进展生存时间分别为11个月和14个月，则HR=11MONTHS/14MONTHS=0.79;

（2）根据Survival proportion at a given time来确定，假设两组分别为P1和P2即：

HR=log(P1)/ log (P2);

例9中，HR就是根据安慰剂组和letrozole (2.5 mg)组4年无病生存率（four-year disease-free survival rate）来估计的，两组4年无病生存率分别为88％和90.5%，则HR=log(0.88)/log(0.905)=0.78;

在这里小胖需要提一点就是，上述提到的只是用来对HR进行估计，并不代表平时我们就可以这样来计算HR。

小胖说统计之八十：ICH E9临床试验的统计学指导原则解析（五十七）

' l) f4 o/ z+ i! Y2 G4 Z

从临床试验实例来看样本含量的计算（十二）

1 z$ D" t" N6 z+ |6 I

上篇博文，我们简单介绍了，events的计算方法，那么events确定后，最终还是要确定入组的受试者数，那具体怎么确定呢？

总的受试者数N＝2e/(2-P1-P2)

其中：

e为events数量

P1和P2为两组Survival proportion at a given time。

具体到例9中就是：

N＝515×2/(2-0.88-0.905)≈4800

在生存分析的试验中，我们常用log－rank检验来比较两组生存情况的不同。它对治疗组生存分布情况不作任何假设。而我们以上提到的样本量计算方法便是基于log－rank检验，而且是建立在以下假设的基础上的：

（1）病人接受固定时间的随访

（2）Hazard ratio保持不变

以上我们所提到的样本量计算方法广泛应用于各种生存数据的临床试验中，当然还有别的样本量计算方法，比如基于exponential survival and accrual的方法，这种方法是假设生存分布是exponential的，计算方法相对比较复杂，小胖在此不再赘述了，如有兴趣的同学，可向小胖索要相关资料。

静注：例9我们采用PASS的Logrank Tests (Freedman)过程进行计算，结果为4823例，其所填参数与计算结果详细如下两图。