作者:姚晨(北京大学临床研究所)
* h7 L. c5 K5 L' Y0 c# D5 P G0 r. L" S8 D( U
编者按:目前,我国有关RCT的研究日益受到重视,但是在RCT研究报告的撰写上存在一些不规范问题,根据文献报道,在不符合RCT标准的论文中,有85.6%的作者(1913例)是因为未能理解RCT的设计原则,误将其所做的非RCT称为RCT;5.1%的作者(115例)了解RCT的原则,但有意将其所做的非RCT称为RCT。
% S2 B9 R$ A: {' a3 L3 N% D
! u; S+ n. h$ X# \) J1 ] i自循证医学(evidence-based medicine,EBM)概念兴起之后,临床研究中越来越多的医生认识到了临床实践中的各种治疗应该依靠证据,而不是凭借经验和传统来指导临床实践。对于临床证据,随机对照试验(randomized controlled trial,RCT)被公认为治疗性研究的“金标准”。尤其近十几年来,RCT在筛选和评价临床治疗方法上获得了更为广泛的应用,研究内容涉及各系统疾病。
目前,我国有关RCT的研究日益受到重视,但是在RCT研究报告的撰写上存在一些不规范问题,根据文献报道,在不符合RCT标准的论文中,有85.6%的作者(1913例)是因为未能理解RCT的设计原则,误将其所做的非RCT称为RCT;5.1%的作者(115例)了解RCT的原则,但有意将其所做的非RCT称为RCT。
一个完整的科学研究应该是由科学探索到科学验证的有序过程,此次点评的5篇论文均属于RCT研究,其中包括新药Ⅱ期临床试验2篇[“蔗糖凝胶治疗细菌性阴道病Ⅱ期临床试验研究”(简称“蔗糖凝胶临床研究”)和“前列腺素E1乳膏治疗女性性唤起障碍的多中心随机双盲对照研究”(简称“前列腺素E1乳膏临床研究”)],临床治疗新方法研究1篇[“拉米夫定或干扰素单药治疗及序贯治疗慢性乙型肝炎的随机对照临床研究”(简称“拉米夫定临床研究”)],新器械研究1篇[“超声微创手机和工作头在儿童龋病治疗中的应用评价”(简称“超声微创临床研究”)]和药代动力学研究1篇[“老年患者靶控输注瑞芬太尼对丙泊酚药代动力学的影响”(简称“药代动力研究”)]。
一个良好的RCT试验是在大量的临床前研究,或者合理的临床观察证据基础上设计的,实施一个规范的RCT试验更需要巨大的人力和物力投入。有些作者的研究立题很好,临床试验设计和实施也科学规范,但是研究论文的撰写格式仍沿用基础研究论文的形式,不能全面展示所研究的过程及结果。只有作者准确、充分的报告临床试验的设计、实施和分析,读者才可能对其临床研究的质量及结论进行评价与应用。所以如何将研究的成果科学全面地展示在读者面前,这也是一个研究者需要重视的问题。
下文将以CONSORT声明为模板,向研究者解释如何撰写RCT研究的科学论文。CONSORT声明是由科学家和编辑们共同于1996年发表的随机对照试验报告的统一规范,旨在改进RCT的报告,促进读者对试验设计、实施、分析和解释的理解,并有助于评价试验结果的真实性,还可用于指导审稿和编辑(关于CONSORT声明的说明和详述文件可参阅网址
http://www.consort-statement.org)。
CONSORT内容主要包括文题和摘要、引言、方法、结果和讨论等几大部分。
1 题目和摘要
如何将受试者分配到干预组,要求作者尽量在题目中使用“随机”一词,可使用“病人是随机被分配到××组”等,这样可以有利于在MEDLINE被检索出。
如李静等的“超声微创手机和工作头在儿童龋病治疗中的应用评价”这个题目,并未显示出RCT研究的特色,若改为“超声微创手机和工作头治疗儿童龋病的随机对照研究”更加合适。
2 前言
正如前面提到的,在设计RCT试验之前,研究者必须在有充足的理论依据和前期研究的基础上,才可进行前瞻性临床干预研究。这是因为RCT研究通常属于验证性研究,一般预先应明确研究目的和研究假设,而不是边试验边分析。因此,在前言中应描述所研究科学背景和原理解释,说明进行拟开展临床试验的必要性,并报道前期临床研究的初步结果,或类似临床研究的文献系统评价。
本次点评的5篇RCT文章均在前言部分详细描述了背景和原理,并或多或少的描述了研究目的。
3 受试者、受试者的纳入和排除标准及资料收集环境与地点
每个RCT都要阐述与主题相关的人口学特征,入选标准一般与年龄、性别、临床诊断和合并症等有关,排除标准一般是为了保护受试者安全性而进行的选择,作者需详细描述研究对象的特征和所处的地理社会背景,以便读者评价研究结果的外部真实性(可推广性),作者还应特别描述征集研究对象的方法。
本次点评的5篇RCT文章均对入选排除标准进行详细的描述。除“药代动力学研究”一篇外,其余4篇在文章中均提出研究的地点和参与中心等信息。
4 各组干预措施的细节及其实施时间和方法
作者应详细描述干预措施包括对照措施,还应详细描述安慰剂的特征及如何编盲,对于对照的“常规干预措施”或联合干预措施更应详细描述。
在临床试验中设立对照组的主要目的,就是可以将所研究的干预因素给患者带来的效应(症状、体征或其他病情的改变)与其治疗过程中其他因素(如疾病的自然进展、研究者或患者的期望、其他治疗措施等非研究因素)造成的效应区分开来。而对照的选择会影响到对试验的推理,被招募的受试者类型和募集的速度,研究结果的公众可信度等方面。
目前比较常见的对照有安慰剂和阳性药对照两种。在这5篇文章中,2篇新药Ⅱ期临床试验文章采用的是安慰剂和不同剂量组的对照方法;新器械研究则采用常规器械作为对照;而对于临床治疗新方法研究文章采用的是单一用药方案作为对照;药代动力学研究采用了不同剂量组和常规麻醉的比较。
综上,此5篇文章中对照的选取,均能满足“专设、同步、均衡”的原则,并且均详细描述了用药方案以及药物规格,对于器械的临床研究也详细地提出了具体操作流程。
5 特定的研究目的和假设
相关的5篇文章和大多数RCT文章一样,均充分报告了研究目的和假设。
6 明确定义主要和次要结局指标,必要时,提高测量质量的方法(如多次观察、培训评估人员等)
主要结局指标是估算样本量的重要指标,RCT报告中的主要指标应充分报告,对于次要指标也应列出完整定义。并且作者应充分描述主要结局指标和次要结局指标的测量方法,并说明为提高测量可信度是否采用了特殊措施。
本刊5篇文章均不同程度描述了所要观察的终点指标,其中3篇明确说明主要终点和次要终点指标。但是略有不足的是,在应用量表评分作为终点指标的时候,并未说明量表出处和可信度问题,这对非本专业的读者来说,可能会使其产生对试验结果可信度的疑虑。
7 样本量估算方法,必要时,解释中期分析及试验终止原则
本次点评的5篇文章中仅有一篇“前列腺素E1乳膏临床研究”中提到明确的样本量计算过程。样本量问题是临床研究中常见问题,很多研究在设计阶段并未进行样本量估算,这使样本设计缺乏科学性,会由于样本量过小而导致检验效能过低,而另一方面,对于前瞻性研究来说,缺乏合理的样本量计算,可能会导致研究由于纳入过多没必要的病例而造成浪费。
8 产生随机分配序列的方法及所有限制细节(如区组、分层)
文中应详细描述如何产生区组(如序列区组设计)、区组长度、区组长度的变换是否随机。文中还应指姚 晨,等 如何科学全面地展示随机对照试验研究成果出是否应用分层。
9 执行随机分配序列的方法(如IVRS,IWRS),阐明分配干预前,随机序列是否隐藏
在临床研究中随机化可保证组间比较的均衡性,避免主观选择偏倚,是统计分析评价疗效和安全性的坚实的理论基础。科学的随机化应保证产生随机分配序列的方法及所有限制细节(如区组、分层)均提前设计,并由专业人员通过计算机产生分组序列,通过药品管理人员按受试者就诊顺序或其他方式(IVRS,IWRS)发放,在此过程中,盲底和应急信件也都经过密封处理。只有满足以上条件,才算是进行了真正的随机化。
10 谁产生分配序列,谁登记受试者,谁分配受试者
在科研论文中,对于随机的描述可长可短,但最好写明谁产生分配序列,谁登记受试者,谁分配受试者。
比如“蔗糖凝胶临床研究”一文中,建议对随机分配的描述改为:“随机分组方案由统计专业人员按分段方法产生,研究者依据方案要求负责纳入受试者,当受试者符合纳入标准时,由药品管理人员按照就诊顺序发放相应的药物给受试者进行试验”。按照这种格式虽然仅有一句话,但是也体现了随机分配的细节。
11 受试者、干预措施实施者和结果评估者是否使用盲法,若使用了盲法,如何评价盲法的成功
盲法的实施可根据药物的属性和试验的设计要求分为单盲、双盲和评价者盲等几种。正确的应用盲法,可以最大效果地达到随机和评价准确客观的目的,当评价指标为主观结局指标时,盲法的应用格外重要。对医生盲,可避免医生有选择的入组病人以及在评价疗效指标时带有偏倚;对受试者盲,可避免病人心理因素对疗效的影响。未使用盲法的试验被称为“开放性试验”。即使是开放性临床试验,盲法也是可以被应用的,如对于评价指标的测量、数据管理与统计分析采取第三方参与的方式。
所以在进行文章描述时,作者应说明对谁使用盲法(如病人、医生、评估者、监测者或资料分析者),盲的方法(如胶囊、片剂)及治疗措施特点的相似性(如外表、味道、给药方法以及模拟片的应用)。作者还应解释某些病人、医生和评价者未采用盲法的原因。
而对于盲法的操作“前列腺素E1临床研究”一文描述的比较全面,可参考。
12 用于比较组间主要结局的统计学方法,附加分析如亚组分析和校正分析
目前的科研论文对于统计学的应用越来越重视,5篇文章都不同程度的提及了统计分析方法和统计软件的应用情况,均说明了统计方法、统计量、检验水准的调整等问题。
13 极力推荐用流程图报告各阶段受试者流程
推荐使用流程图,特别是报告随机分配到各小组的病例数、拟接受治疗的病例数,完成研究方案,分析主要结果,以及描述实施与研究计划不符的情况及原因。随机对照试验各阶段流程图必备信息包括试验登记、随机分组、治疗分配、随访和分析。这一点请详见“前列腺素E1乳膏临床研究”文中的“图1”。
14 明确定义募集受试者的时期和随访的时间
随机分组后,随访期常不固定。很多RCT中,结局指标是出现某事件的时间,每位受试者的随访均结束于某一特定日期,作者应报告此结束时间及中位随访期。
本次5篇文章均写清随访的时间。值得一提的是在“前列腺素E1乳膏临床研究”文章中,由于初始方案中设计时间窗内完成不了试验的干预要求,故在中途进行过一次方案修正,并记录在方案变更部分。这种做法是值得提倡的,在科学研究中,即便设计阶段出现考虑不周,操作阶段出现瑕疵纰漏,也不要失去信心,只要以科学的原则为准绳,如实记录并修正,绝不能造假和瞒报。
15 各组的人口学和临床基线特征
可采用表格简明地描述基线信息,对连续变量(如体重或血压)应报告平均值和变异度,可以采用均值±标准差的形式总结各组的连续变量。如果连续性资料呈偏态分布,则最好采用中位数和百分位数间距(常为第25和第75百分位数)来描述。对有序分类组成的变量不应作为连续变量处理,而应报告每个分类的例数和构成比。
5篇文章基本上都在结果描述的第1个表中即进行人口学和主要疗效指标的基线特征描述,但是“超声微创临床研究”文中,仅对样本进行了简单的描述,并未做相应的比较,尽管目前学术界对于基线资料是否需要显著性差异检验仍有争议,但是笔者仍然建议在RCT研究中除提供基线资料外,最好同时进行显著性检验,使读者了解疗效的差异是否因由基线不平衡所致。
16 分析各组的受试者数量(作分母)及分析是否采用“意向性分析”
如可能,用绝对数描述结果。由于事实上,大部分试验都不能得到完美的数据,都会产生偏离方案的情况,这些受试者不能被纳入常规分析,但通常却可纳入所有受试者做意向性(intention-to-treat,ITT)分析。
ICH-E9给出“全分析集”(full analysis sets,FAS)、“符合方案集”(per-protocol sets,PPS)和“安全数据集”(safety set,SS)的概念。一般来说,FAS人群为根据ITT分析原则确定的理想受试者人群,是所有经随机化入组、至少服用过一次研究药物,并至少有一次疗效评估的人群。此5篇文章中仅有2篇提到了ITT原则和划分数据集的问题,也是在方法学上设计较好的2篇。笔者认为即便没有描述数据集划分的情况,在文中也最好描述试验方案执行情况、违背方案的病例情况,以及脱落或者剔除的病例情况。
17 对每一个主要和次要结局,每组应有一个结果总结和效应估计值及其精确性(如95%的可信区间)
应报告所有研究方案中计划的主要和次要结局指标的结果,而不是仅仅报告差异有统计学意义的分析。
18 报告所进行的任何其他分析以说明方法的多样性,包括亚组分析、校正分析
指出哪些是预先制定的,哪些是临时添加的分析,对于同一组数据采用多种统计分析很可能得到假阳性的结果,所以选择性报告亚组分析结果可能会导致偏倚。
19 各组所有重要不良事件或副作用
在安全性方面,通过本次点评的文章中,发现研究者并未仅仅针对疗效指标进行分析描述,对安全性有关方面也都做了较大篇幅的描述和比较。
20 结果解释应考虑研究假设、潜在偏倚和不精确的原因及与结果重复分析相关的危险因素
所有5篇文章均根据之前设计的目的和主要指标、次要指标应用了相应的统计学方法进行计算,结果描述合理,表达准确,但在统计分析时,我们除了关心主要终点在末次随访时的表现外,也不要忽视基线对结果的影响,比如“拉米夫定临床研究”一文中,表2中比较了A、B、C组内3个随访时间点(基线、治疗结束时和随访结束时)之间的差异,也比较了在不同随访点3组之间的差异,但是却忽视了基线的作用,若能再将治疗结束时(和随访结束时)主要指标值与基线的主要指标值之间的差值进行3组间比较,也许更能说明这3组对于降低丙氨酸氨基转移酶(ALT)和乙型肝炎病毒(HBV)DNA上无显著性差异。
在评审论文阶段,笔者发现很多文章的统计表达并未使用表格形式,而是一味的罗列结果数字,这样不利于读者更高效的提取结果信息,而应用统计表格来表示研究结果,会使结果更加清晰,便于读者阅读和比较。
21 试验结果的可推广性(外部真实性)
根据研究的入选和排除标准、试验环境、剂型剂量、用药时间、用药途径以及评估方法等信息对研究在一般人群中的推广进行阐述。
22 根据当前证据,全面解释结果
此次的5篇文章结论描述均简明扼要的概括了文章的主要研究结果,适当的进行了解释和推断。仅姚 晨,等 如何科学全面地展示随机对照试验研究成果“药代动力研究”中,在收集指标和目的中提及收集术后24h随访患者有无术中知晓及患者满意度的信息,但是在文章中的结果部分和结论部分并未根据此信息进行相应描述和分析,所以建议文章结论应与研究的背景、目的和结果相呼应。
以上便是CONSORT对RCT科研论文的基本格式要求,可见CONSORT本身就是很好的临床研究教材。除了格式要求之外,笔者还想再简略提两个与临床研究密切相关的话题,一个是伦理,另一个是临床试验注
册制度。
因为RCT试验均是以人体(健康志愿者或患者)为研究对象所进行的科学研究,所以伦理学问题应处于重中之重的地位。一流的临床研究,不仅意味着对科学与创新的追求,更意味着对受试者提供最好的保护。
通过这5篇文章,可以看到当前研究者对于伦理问题的重视,5篇文章中均不同程度的提及伦理审查和获得知情同意的要求。
临床试验注册是指一种新药或干预措施的临床试验注册,指在试验的起始阶段将试验的重要信息在公开的临床试验注册机构进行登记,以便向公众、卫生从业人员、研究者和赞助者提供可靠的信息,使临床试验的设计和实施透明化。
临床试验注册的原因最初是因为未注册和未发表的临床试验不能对循证医学做出贡献,系统综述和meta分析仅仅收录了少部分获得发表的、却可能有偏倚的临床试验。近年来,医学界强烈呼吁临床试验应进行注册并公开其试验结果,避免选择性偏倚和报告偏倚。临床试验注册能使所有试验的结果得到保留。
我国目前也已开展了临床试验注册制度,由中国循证医学中心建立的全球第4个、中国惟一的临床试验注册中心(ChiCTR),于2007年在四川大学华西医院正式运行,以后该中心联合国内65家核心期刊发起成立了中国临床试验注册与发表协作网(CHICTRPC),创建了中国临床试验注册与发表机制。
尽管我国大部分期刊不要求临床试验注册,而本次点评的5篇RCT文章也并未写明是否已进行临床试验注册,但是笔者发现此状况正在得到改善,目前已有不少投稿者在提交文章的同时也附上了注册号。
总之,一个好的RCT研究离不开好的设计。临床研究的设计既要符合伦理道德,也要科学合理,既要达到安全性评价要求,也要满足有效性评价的需要。所谓临床研究中的科学就是指在具有以良好的研究为基础的设计,按照既定方案高质量完成研究。而统计师在研究中也起到至关重要的作用。
JAMA杂志曾要求其投稿文章必须具备以下3点要求:
(1)需要提前在循证医学网站上登记注册;
(2)需按照CONSORT格式撰写文章;
(3)必须由学术机构的统计师进行分析。
临床科研已经逐渐得到研究者的重视,近年来研究者的临床科研水平正在逐年提高。
" a( B$ b8 O5 a$ X. W3 @