马上注册,结交更多好友,享用更多功能,让你轻松玩转社区
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
作者:廖星(中国中医科学院中IK临床基础医学研究 编辑:春雪
0 U/ i* b0 J- l6 l: a作者简介:廖星,博士,助理研究员,研究方向为循证中医药临床评价方法研究, 摘要:比较效益研究(comparative effectiveness research,CER)被认为是一种可以提升医疗卫生研究质量的有力工具,该工具从策略层面上有益降低医疗卫生成本。比较效益研究的提出仍然源自于“效力”和“效果”的研究问题。以往的效力研究总是在较为严格的控制条件下探索干预措施是否有效,而现今的医学研究除了探索有效之外,更关注针对谁有效,在哪一种情况下有效的效果问题。过去经典的效力研究常通过比较一种新干预措施和安慰剂,来获得其效力的评价。现今CER发展到对两种或多种不同干预措施进行直接对比,而且强调在尽可能接近临床实际减少人为控制因素的情况下进行对比。该文通过对系列文献和报告的归纳和总结,就如何设计、实施、分析CER,进行了分析和综述,为以后中医药研究者开展类似研究提供参考。
& f* Q) Q9 V, B9 U0 z1 CER背景介绍 2009年8月,比较效益研究(comparative effectiveness re-search,CER)正式兴起,当时美国以法案形式将CER写入2009年《美国复苏与再投资法案》,并计划投入11亿美元,专研CER。在美国总统奥巴马签署相应法案后,美国相关负责机构,如NIH,AHRQ,OS--DHHS立马着手CER的研究计划论证以及实施部署工作。同时法案指定IOM设立CER优先发展项目。于是在紧锣密鼓的准备后,2010年初《病人保护和可负担医疗法令》创立了可持续CER发展项目办公室,即患者为中心的医疗结局研究所,旨在确立CER优先发展项目,并促进CER研究方法 ,强调以人为中心作为CER发起最为主要的目的。 根据美国几家权威机构对CER的定义可知,CER并不是一个完全新概念,它涉及内容仍然是形成或综合证据,为医疗实践服务,CER涵盖了所有预防、诊断、治疗、监测、医疗保健等领域,并着重对不同干预措施的利弊进行对比。直接对真实世界里的各种医疗干预措施进行对比,使用各种各样的数据源和策略方法来发现干预措施针对哪类人群有最大的利或弊。CER的目的在于帮助所有医疗相关人员,包括医生、病人、决策者做出明智的决定,从而将医疗水平从个体和群体水平上进行提升。CER有6个方面的突出特征 :CER研究会直接从病人角度或者是大众的医疗决策角度出发,为他们提供最为详尽的临床决策信息;CER研究在研究中会对至少2种不同的干预方案或措施进行对比,每种方案或措施都有可能是临床中“最好”的那个;CER研究会从群体和亚群两个方面对结果进行报告;CER研究会从利弊2个方面来选择那些对病人重要的结局进行测量;CER研究会尽可能应用一切有利于医疗决策的各种方法和数据/信息源;CER研究所进行的场所一定是在干预措施应用的真实临床环境里。定义和特征都充分说明了CER是以“病人个体”为决策中心的研究,病人的个体特征和个人偏好决定了对于不同干预措施的选择和决策。因此CER也被称之为病人为中心的研究(patient-centered healthresearch)。 CER相关概念、产生的渊源、及其评价标准GRACE准则,笔者已在一系列相关CER文章中有所表述 。本文将在此基础上对CER的设计和具体方法,作进一步的阐述。 2 CER研究设计类型介绍 目前国际上许多医学研究者认为CER可以成为提升医疗卫生体系质量的潜在有力工具 ,而且从策略层面上有益降低医疗卫生成本 。而就CER本身来说,其“评价真实世界治疗措施”的理念可以溯源到医学史上那个最早的著名试验,即对坏血病各种可能的治疗措施进行比较。那么,到底什么样的研究可以被称之为比较效益研究?如何判断某一研究是否属于CER,目前尚无严格定论,还取决于研究者、评审者以及杂志编辑的观点。近期有一篇综述在国际医学研究领域里具有高影响因子的6大医学杂志上,检索2008年6月1日至2009年9月30日相关328篇文章,从中遴选出104篇CER研究文献进行分析。其遴选依据是:将那些和现有阳性干预措施对比的研究归为CER,而那些涉及到新药研究或者是非阳性对照的归为非CER研究。该研究认为在已发表的研究中,约有1/3的药物评价研究是CER。其纳入的研究类型主要有:随机临床试验、观察性研究、Meta分析;具体类型有:随机对照试验,病例对照试验,队列研究和Meta分析。对于那些系统综述、前后对照研究,以及一些没有纳人真实病人的模型研究都被排除在外。另一综述报道则排除那些和安慰剂以及常规治疗对照的研究,根据相关研究者和临床专家的个体访谈从2个大型临床试验注册数据库(Clinicahrials.gov和Health Services Re—search Projects in Progress,HSRProj)中分辨出689个美国在研的CER研究,即3大类研究:头对头临床试验(head—to—headtrials),观察性研究(observational studies),综合类研究和模型类研究(syntheses and modeling)。美国退伍军人事务部(veteransaffairs)的医学研究人员在其报道的文章中 总结了他们所认为的CER研究类型,包括:随机对照研究、观察性研究、数据库系统的研究、系统综述以及二次研究中的模型研究。也有学者通过调查和定性研究发现,目前大家较为公认的CER主要集中在5种类型:头对头试验(headtohead trials):如实用型(pragmatic)试验;观察性研究:如注册登记研究(registry);前瞻性队列研究;数据库类研究;综合合成性研究,如系统综述和建模。此外,也有一些国际知名大型药厂(如默克制药公司)研究者报告 中提到他们眼中的CER:随机临床试验来可以好地进行效果(effectiveness)研究,比如开展大样本的实用型临床试验,如观察性数据库或者是注册登记研究;观察性研究,如回顾性观察研究,队列,病例对照,病例.队列研究,前瞻性观察研究如注册登记研究。生态研究(ecological studies)等。除此之外,还提到了近期CER方法学上的一些新趋势,如注重以病人为中心的结局研究,简化的数据库分析研究,系统综述和Meta分析,试验模拟研究(trial simulations),自适应随机对照试验(adap-tive randomized controUed trials)。此外,还有美联邦CER协调理事会在其2009年向美国总统和国会提交的一份报告” 中分析了过去所做的CER研究,其归类中以下研究被视为CER:主要有两大类,原始研究和二次研究。原始研究包括随机对照试验,实用型对照研究(practical/pragmaticcontrolled tria1),非随机对照研究,前瞻性/注册登记式的观察性研究(natural experiment),回顾式的观察性研究;二次研究主要有系统综述、meta分析、数学统计模型等。 2011年3月,美国AHRQ公布的CER方法学指导,以及美国医学杂志Medical Care分别于2007和2010年专刊出版了关于CER方法介绍以及讨论的相关文章 。两者对CER的研究设计类型提到了如下种类:随机化类研究、实效型(效果型)研究、基于实践的研究(practice-basedstud-ies)、注册登记式研究。资料收集方法主要有:电子化的,基于计算机或网络平台的,基于硬件的,EMRs,分布式数据网络,管理机构的数据或者是基于病人报告的原始数据。以及这些方法的联合使用。统计方法有:倾向性评分,贝叶斯分析技术(Bayesian techniques),混杂,数据缺失等分析方法。而美国医学技术政策中心(CMTP)则提出CER研究应该涵盖以下内容:对现有研究进行系统综述;进行相关成本有无的决策模型研究;对现有临床或管理部门的数据进行回顾性分析;进行相关前瞻性的非实验类研究,包括注册登记研究。进行实验类研究,包括随机对照试验;必须权衡内部效度、可行性、推广性、成本和时间之间的关系;研究问题和决策者会影响到最佳实践;实验类研究在CER研究中有重要作用,因此必须提升其设计和实施的水平;非实验类研究有很大的发展前景,特别是观察性研究中应用相关分析方法和工具以提升混杂因素分析水平时。 选择何种研究设计类型始终取决于研究问题和可行性,这在以往研究中如此,在CER研究中亦然。研究设计类型的选择对于研究效度有决定作用。以下是对2个国际权威机构中对目前CER研究类型选取的分析。从CER的定义和特征可以看出,所强调的是在“真实世界”里进行研究,而这正是观察性研究的优势所在。因此有许多研究组织结合CER的理念和宗旨,开始了新一轮对观察性研究 E随机化研究的梳理。 3 ISPOR提到的非随机CER研究类型和统计分析 3.1 ISPOR提到的非随机CER研究类型 国际药物学经济学和结果研究会(ISPOR)在其报告中明确提到了以下几种研究类型可作为非随机CER研究考虑。 横断面研究(CROSS-sectional designs):这类研究往往截取的是一个“片段”的数据,作用在于描述那个时段里的数据信息,或者是对数据集里不同的变量进行关联分析。其局限性在于该类研究不能把握数据的时态,不能明确确定暴露因素是否和结局相关。 队列研究(cohort designs):在队列研究中,多组病人暴露在不同的治疗措施下,伴随着治疗时间的推移获得不同队列之间的事件/结局的发生率的比较。队列研究可以很好地弥补横断面研究的不足,即能够把握好数据的时态,能够推测出暴露和结局之间的相关关系。 病例对照研究(case-control designs):病例对照研究里可以同时对那些发生了结局变化和没有发生结局变化的个体进行对比。即在一段时间内暴露在干预措施下,直到不同结局的发生,从而形成对比。这种研究通常在罕见病研究中多用,特别是一些罕见结局研究中。通常这类研究提供的是相对危险度,而不直接提供绝对危险度评价。 病例交叉设计(case-crossover designs):对于队列和病例对照研究来说,总是面临如何选择对照组及其产生的选择偏倚问题。病例交叉设计中,个体自身就可以成为对照。这类研究中,只有那些暴露在一定的干预措施之下一段时间后有结局变化的病例才被纳入研究。这类研究往往选择发生某种急性事件的病例,对事件发生时及事件发生前的暴露情况及程度进行比较,以判断暴露危险因子与某事件有无关联及关联程度大小的一种观察性研究方法。这种研究是一种用于研究短暂暴露对罕见急性病瞬间影响的流行病学方法。这类研究可以用于那些对比组之间存在非常大的差异,可能会有非常大的选择偏倚时,以及瞬时暴露和即时结局的研究中。 病例-时间-对照设计(case-time-controldesigns):病例交叉研究设计的缺陷之一在于它的“短暂性混杂”,即病例交叉研究要求暴露非常短暂,暴露到事件发生的时间很短,而且暴露有很少的遗留效应,但是实际情况可能是个体会有自然治疗增加效应,这种效应不是真正的一种因果关联关系,从而造成混杂。对于这种情况的解决可以在本类研究设计中体现,即设立一组和病例组类似的对照组,但是对照组中的个体没有发生该相关的事件,从而屏蔽那种随着时间推移而出现的“自然增加效应”。用对照组的风险比除以病例组的危险比达到一个整体水平的风险比。这类研究需要足够的样本,并同时要求确有事件的发生和暴露。 断续时间序列设计(interrupted time series designs):该类研究主要是指结局出现前以及结局出现后随着时间推移变化而获得的横断面数据。将当下随着事件发生下的暴露或结局的变化趋势和基于历史数据估算的趋势进行对比。比如一个有关评价药物政策对药物使用影响的研究中,历史趋势估算是基于政策不变的情况下算出药物使用率。再用这个预算率和正实施的药物政策下所观察到的使用高级统计方法算出的率作对比。这类研究能够最大程度地降低选择性偏倚。不足之处也有“短暂性混杂”,比如在干预期间其他事件会同时发生,而且这类研究也需要大样本。这类研究适合于药物使用情况和即时结局的事件发生率的研究。 3.2 ISPOR提到的非随机CER统计分析方法 对于非随机CER统计方法的选择,主要从减少非随机所带来的各种混杂因素影响的角度考虑。 分层分析(stratification analysis):分层分析是观察性研究里最为基本而常用的一种分析方法。分层顾名思义将数据分成许多亚类,即层次。分层分析的用处多体现在标准化处理(standardization)、控制混杂、效应测量调整(effect meas-uremodification)中的亚组分析,以及病例配对分析中的选择性偏倚等问题的处理上。在队列研究中,通过分层分析可以防止来自失访和竞争性危险(competing risks)的偏倚。 回归分析(regression analysis):回归分析是一种强有力的统计分析技术,能够同时达到多个分析目标。当分层分析中有多个层次形成需要分析,或有好几个潜在混杂因素需要调整时,回归方法可以在回归方程里同时调整其他所有独立因素的效果之后,分析治疗措施和结局之间的相关关系。最为常见的是针对在一系列协变量校正后对给定变量给出RR值,OR值,95%可信区间。回归分析另外一个重要的用处就是使用回归方程来建立回归模型,预测结局在非研究人群中的发生概率。这也是下面将提到的倾向性评分(propensityscoring)中多元logistic回归的主要用途。 倾向性评分分析(propensity score analysis):倾向性评分现在越来越多地被用来解决评估疗效的观察性研究中的选择性偏倚,以及内生性混杂问题。目前倾向性评分在观察性研究领域里应用主要涉及到了经济学评价、临床疗效评价、流行病学调研以及其他研究目的。倾向性评分的一个明显优势在于它可以直接对治疗组和各对照组之间的各个已知混杂变量进行平衡处理,并进行随机化状态的事后模拟。随着多种方法的结合使用,倾向性评分的发展更新迅速,出现了较先进的倾向评分加权分析法(propensity score weigh-ting),即将倾向评分与传统标准化法结合而成的一种新型分析方法,也被称之为“基于个体的标准化法”。倾向评分加权也是边际结构模型(marginal structural models)的一种简单应用,后者往往是使用的是逆处理概率加权法(inverse probabil-ity of treatment weighting,IPTW),有关结局,治疗,混杂之间的因果关联可以通过DAGs图(directed acyclic graphs)来直观表示。 工具变量分析(instrumental variable analysis,IVs):工具变量分析是一种主要针对内生性(endogeneity)的计量经济学方法。IVs通过至少一个数量的变量和其他内生变量进行关联,而不和结果进行关联。在结局应用研究中,内生性问题经常以抽样时的选择性偏倚形式出现。尽管像工具变量分析这些类似的先进分析方法可以解决相关问题,但仍需要在研究中尽力减少各种偏倚的来源,而不是一味追求高端统计学方法。 结构方程模型(Structural equation modeling):在诸多的统计模型应用中,虚拟变量比较常用于疗效评价之中。尽管多变量模型可用于控制可观测变量或不可观测变量(如工具变量方法中),但是它们最终测量的是一个对各组自变量均差的估计值。结构模型能够为诱发疗效提供详细的信息。 目前的研究领域里还有许多其他先进高级的分析方法,比如多项logit模型(muhinomial logit modeling),有序logit模型(ordered logit modeling),Probit模型,参数生存分析(para-metric survivalanalysis),G估计法(G-estimation),transitionmodeling,nested models等等。对于这些方法的选择和使用需要研究者有关相关的培训和对相关知识的熟悉和掌握。总的来说,确立一个明确可行的研究问题,选择合适的研究方法,以及采用恰当的统计分析方法能够为观察性研究结果提高研究效度,并能为非随机化研究的凶果推断提供可靠的依据。 以上是基于观察性研究一些常用或推荐使用的统计分析方法。但是就观察性研究数据本身来说,还有2个问题需要在研究资料分析过程中需谨慎处理。即缺失数据(missingdata)和残余混杂(residual confounding)。缺失数据是观察性研究数据分析里非常常见的一个问题。如何处理缺失数据很大程度上取决于数据类型。最简单的方法是用均值插补,或者是基于此原理的回归模型预测值替代法。两种方法都是针对所有病人的相同值进行替补,从而降低数据的变异性。还有更为复杂的方法,即将数据中的变异进行保留,比如从hot deck填补方法到多重填补(multiple imputation,MI)等一系列方法。残余混杂指的是由于混杂未得到充分控制,导致一些因素的混杂效应仍然残留在所观察的治疗一结局效果中。研究者应该对残余混杂进行适当的分析,比如进行敏感性分析。 4 IOM报告中提到的CER设计类型 美国国家科学院医学研究所(IOM),在2008年的报告中 钊该提到以下研究类型为CER常用研究设计。 4.1 实验类研究(experimental study) 这类研究中,研究者积极进行干预对所立假设进行检验。常见形式是对照研究,实验组和另外一组形成对照,另外一组可以是一种阳性对照,可以是空白对照,标准治疗,或者是空白对照。在随机对照试验中,研究对象通常被随机分配到试验组和对照组。由于是一种前瞻性的研究,所以RCT往往需要很长时间才能收集到足够的样本量来观察结局。集群随机对照试验是指研究对象以“群”或组的形式被分配到试验组和对照组,同一组的人群通常具备类似的特征。头对头式试验才是CER最为切合的研究方法,因为在研究中对多种阳性干预措施进行对比。 4.2 观察性研究或非实验类研究 这类研究中研究者并不去干预而只是去观察事件的发生过程。观察性研究可以是前瞻性的也可以是回顾性的。前瞻性的观察性研究,比如有注册登记式研究,它能够互动获得多年积累到的病人数及其结局。队列研究中,不同人群以一定暴露或特征而被长期观测。在回顾性研究中,有病例对照研究,观察对象以有无某事件或疾病群分,然后观察其过去的暴露或事件的发生,从而对比两组之间的差异。横向研究则可以发现在某一特定时段里某种疾病或暴露因素的患病率。病例系列研究可以对有统一特征的病人群进行描述。回顾性的观察研究可以在现有数据库里进行数月的设计和分析,但是所提供的信息是有限的。 4.3 研究合成(research synthesis) 也可以称作合成型研究,这类研究中研究者将来自不同研究但有类似研究问题的信息进行汇总综合。在CER系统综述研究中,研究者尽可能地将收到的科学证据以一定的组织、结构、程序进行评价合成。其目的是为决策者提供准确、科学、严谨的信息,为临床干预措施提供安全使用的信息。现今系统综述的地位在临床实践中变得越来越重要。系统综述包括Meta分析,是指使用统计方法来将同类研究的结果进行定量综合,以便更好地将结果应用到临床实践中。此外还有一些技术评估,即通过单个试验或系统综述对于一些医疗技术的效果进行评估。 综合以上2家机构对CER研究设计类型的分辨,可以发现,如果从方法学角度来说,随机对照试验无疑是最佳CER研究,早期的美国FDA就竭力推崇它,用来进行效力研究。循证医学兴盛后,RCT开始转向效果研究,即实用型随机对照,尽可能地在接近临床“真实世界”的条件下进行研究。因此CER可以在此发展基础进一步落实PRCT的具体应用。如果是就“临床实际”研究的理想追求来说,CER研究还是推崇广泛使用观察性研究随机类试验,这样可以更贴实际地探索临床真实世界,更有利于病人、医生、医疗决策者从实际决策。 5 CER研究的实施 关于CER具体的实施,美国有权威机构FCC和IOM相关CER研究员提出了5个步骤:首先必须制定一个整体的资金筹集战略。其次CER项目应该建立一个优先发展项目并对每个项目的现有研究状况进行评估。CER项目的开展应该在相关专家和研究者的指导下选定合适的研究方法针对特定的研究主题创新性地研究。CER项目应该从全局出发,争取对各个重要研究领域进行均衡施力,不可顾此失彼。CER研究项目应该对过程进行评估并向公众进行报告。 而对于每一种具体的研究方法的实施指导和评估,美国相关研究机构也相应出台了一些比较正式的准则或规范,如由国际药物流行病学会(International Society of Pharmacoepi-demiology)签署,GRACE促进会(GRACE Initiative)发布的“好的比较效益研究准则(good research for comparative effec-tiveness,GRACE),GRACE准则该准则正是针对观察性CER研究制定的。再比如国际药物学经济学和结果研究会(ISPOR)以3篇连续报道的形式制定一系列针对CER具体实施的指导原则和方针。这些报告主要针对使用二次数据源的非随机试验(即回顾性观察性研究)的CER研究,从不同的角度进行了规范化研究的报道。此外,ISPOR还从决策,实践指导以及前瞻性观察研究3个方面对CER进行了具体方法学上的探讨 。基于此,CER作为研究来说也应该遵循相关研究步骤比如:确定好研究问题,落实一个可行性强的研究设计,收集和临床相关的高质量的数据,使用合适的统计分析方法。切记CER的落脚点不会在备受争议的证据级别评价上,也不是归结于严格设计上,而是真实地从临床中来还到临床中去。 6 CER研究在中国医学研究中的开展 目前中国开展CER研究,主要还处于探索和准备阶段,还需要政府的重视和鼎力支持。这方面的研究水平较之美国来说,落差较大,但是如果能够系统地开展CER研究,这是一个良好的契机,毕竟中国国内已经积累了大量病人,疾病和医疗服务的原始数据。比如可以适当地进行一些观察性研究,甚至可以利用医院里的一些数据库系统进行注册登记式研究。当然,现实实际中还存在许多挑战,比如缺乏明确的CER规范体系和相关的专业人才,对复杂大型数据库整合、管理分析存在许多问题,缺乏医院用药和药物的相对疗效,以及药物价格制定等极为重要的信息和数据。最后需要说明的是如果想从国家水平上来组建CER研究,无论是研究类型的选择还是方法学问题的解决,这都是必须考虑的两大重点。 8 G1 p1 V9 O! h, d
摘自:《中国中药杂志》,2013年3月第6期 |