马上注册,结交更多好友,享用更多功能,让你轻松玩转社区
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
转自微信号:肿瘤时间 作者:sensenma " {+ E% e3 T9 A# {/ [) T9 ~
临床试验的结果和终点应当结合治疗方法和癌症类型,因为这些因素能够影响临床医生和患者的期望值。 来自加拿大的多伦多大学 Princess Margaret 癌症中心的Wilson等联合了美国、澳大利亚和英国的研究者,在综述中探讨肿瘤临床试验结果与终点的问题,文章于2015年1月发表于The Lancet Oncology。 作者在综述中就临床试验设计的终点问题展开论述:如何明确终点的重要性、如何使终点为患者所了解、患者报告结局的结果怎样提高使用、如何预测终点发顺应试验设计变化和治疗性干预、以及如何将这些改进整合到临床试验和临床实践中。 临床试验终点必须反映患者的获益,表明肿瘤大小的变化具有临床相关性,无论是绝对值大小(缓解和进展)或与对照的相对值(进展)。 临床试验设计的改进应同时改进现有终点指标。临床试验各方需共同决定研究的最佳手段,确定责任并优化现有资源的使用。 背景 癌症治疗优先关心的问题是患者生存时间更长或生活质量更好,能够兼顾二者是最理想的。讨论肿瘤试验的结果和终点,就必须考虑癌症类型和治疗方法,因为这些参数可影响临床医生和病人的期望。 本综述讨论了总生存期作为临床试验终点的长处及挑战,包括交叉的作用、疾病进展后的治疗、支持疗法的采用。 这带来了一些重要问题:谁来决定什么是合适的终点、应该如何向患者解释临床试验所选择的终点、患者报告结局在肿瘤临床试验中是否未受重视也未得到充分利用、应该更好的应用终点指标来反映患者的临床获益、这些终点指标应该如何纳入临床试验的设计和临床实践中? 确保患者安全的同时,优化临床试验设计和开发需要可重复的、有效的、合适的终点指标。能够最好地利用现有资源以及有临床获益的明确终点,在设计临床试验时同等重要。 如采用中间或替代终点,需评估以确保有效的替代性。替代终点的有效性可能随时间而改变,新治疗方法临床试验中使用替代终点需要不可测的假设。 一篇跨越20年的美国食品和药物管理局(FDA)药品审批的综述显示,在药品审批中越来越多使用时间事件(time to event)终点,如进展时间或无进展生存期(PFS),2006-2011年有43%的批准药物采用时间-事件终点,而在6年前这个数据为33%(即2000-2005年),之前十年(1990-1999年)更低,仅为13%。 鉴于不断变化的环境以及新治疗方法的出现,一种方法可能要定期再评估,以确定替代终点是否仍有临床意义。本综述根据癌症类型讨论评估试验结果的重要注意事项和局限性,为前进方向提供导航。 谁来决定什么最重要 临床医生、患者、监管机构和企业是决定哪些终点具有临床相关性的试验各方。监管机构拥有负责药品批准的最终决定权。这种决定是安全性和疗效数据的全面审查与使患者得到更好治疗选择的宗旨之间所取得的平衡。 虽然首先目标是证明生存期获益,但FDA和欧洲药品管理局等监管机构也承认替代终点,在特定疾病中能够客观地衡量患者获益的终点。 作者在第一篇综述中介绍了缓解率,它在FDA的突破性药物审批过程中尤为重要,可使新药尽早用于患者。但这种策略有研究者质疑也有研究者拥护,是否恰当仍有待商榷。 试验设计和适当的终点选择强调的是监管部门批准新药时要求提供的论证证据。尽管越来越多的意见分歧导致了药物的超适应症使用(off-lable),但对于多数国家,药物获得监管部门的批准被视为药品合理使用的通道。 应该如何对患者解释临床试验所选择的终点指标 临床试验终点选择的争论点是患者的生存与死亡的问题。临床试验的开展原因对于研究者来说显而易见,但对于普通大众可能却不是那么清楚,对患者乃至其治疗医生可能也不具吸引力。 总生存期对预后较好的疾病可能并非现实的测定终点。因此试验可能会选择能够替换真实终点的替代性终点。试验的参加者不一定需要了解中间终点的意义。 患者需要能够反映他们的体验、能够获得最相关治疗的终点。替代终点的验证可以在线进行,如美国临床肿瘤学会(ASCO)的CancerLinq为这类活动提供了平台。 在上千名患者参与的大型试验中,新药与标准治疗可能只有1-3个月的小幅生存期差异。虽然结果差异显著,但药物的作用可能并没有临床意义。目前没有任何指南规定治疗性新药获得批准所需达到的临床获益的门槛。 其他终点,如药物不良反应或严重不良事件,对患者也有重要意义,生活质量终点能够真实反映患者的日常身体机能。最重要的是,药物毒性对患者的临床获益无害,但如果临床试验中发现和报告的药物毒性,其毒性评估仍是一项挑战。 例如,PFS是一个重要的终点指标,直到周围神经病变成治疗结果,造成患者不可能再工作或含饴弄孙的后果。 一项调查显示,女性卵巢癌患者愿意牺牲5个月的PFS,来换取治疗相关毒性的减轻,即从重度神经病转为轻度神经病变。与此类似,患者对副作用的接受程度受对治疗结果的期望以及个人治疗史的影响。 当患者被告知所接受的治疗不可能使疾病治愈时,不可接受的副作用发生率增加一倍。 许多转移性癌症患者能生存多年,因此,护理的生活质量与在临床研究中的生活质量对于患者同样重要。围绕临床终点的讨论应以允许患者了解终点的细微差别的方式继续进行,并继续加强知情同意过程。 患者报告结局在肿瘤临床试验中是否未受重视也未得到充分利用? 假如患者报告结局不仅仅针对症状问题,那么这些结果在临床决策时也相当重要。验证过的生活质量评估方法不仅能够解答问题,而且也能够保证最佳的病人护理可能性。这些结果已经越来越多被视为患者获益的直接评估手段和独立的终点指标。 患者报告结局结果的重要性在于它对解释生存获益和临床获益地位至高。这种方法在以症状缓解为目标的不可治愈癌症的药物临床试验中尤为准确。 对晚期或复发癌症患者来说,症状改善、症状进展的延迟以及和健康相关的生活质提高作为终点,可能比传统的实体瘤疗效评价标准(RECIST)或PFS更有意义。 Brundage等的研究结果显示了临床试验中报告患者结局的不足。在对2002年至2008年近800项随机试验的分析中,健康相关的生活质量评估了一系列的身体状况, 56%的发表文章解释了所采用的结果检验方法的基本原理。 50%的研究报告了健康有关的生活质量假设;28%指出了缺失数据的处理演绎法;36%未在其他临床结果中提及健康相关生活质量的结果。患者报告结局的分析数据往往在出版物中并不公布。 专家对临床试验报告统一标准(Consolidated Standards of Reporting Trials, CONSORT)的延伸曾建议:1.在摘要中指定患者报告结局为主要结果或次要结果;2.描述对患者报告结局的假设;3.提供评估患者报告结局方法学的有效性和可靠性的证据;4.规定处理缺失数据的统计方法;5.讨论研究中的患者报告结局的特定局限性以及结果对于其他人群和临床实践的可适性。 遵循这些建议将有助于改善关注患者报告结局的概念框架和假设的试验设计,更好选择合适的患者报告结局指标;提高报告和解释患者报告结局的标准。虽然这种方法很有价值,但其操作的可行性,结果的解释和适用性在临床实践中仍然具有挑战性。 在治疗后和后续治疗期间应收集评估健康相关生活质量方法的信息。治疗重要组成部分可能是疾病进展的延迟和需治疗的继发疾病相关症状的延迟。例如,后续治疗延迟有可能降低化疗相关的神经病变或蒽环类相关心肌病变。相反,迟发性药物毒性可能抵消治疗带来的生活质量初步改善。 在肠癌幸存者治疗后2-11年随访发现,神经病变及相关症状仍然存在,并对患者的健康相关生活质量产生负面影响。从患者或临床医生的不同角度来看,神经病变的严重程度也大不相同。 20位肠癌幸存者中2位(10%)是经临床医生诊断为严重的外周神经病变。诊断结果与患者访视和自发报告问卷调查结果大相径庭,60%的患者描述了因神经病变症状所致的大量生理限制。 如何更好地应用临床终点以反映患者的临床获益? 研究可靠的临床终点以早期识别患者的临床获益,是临床试验一个重要目标。使用替代终点的问题在于目前测量手段(如RECIST)需要时间来准确评价和评估。 学术界提倡采用PET成像来预测缓解率,对于特定的肿瘤类型,它比CT更准确也更具有决定性。PET能够区分活肿瘤组织与治疗诱发的纤维化或疤痕组织,具有临床实用性,例如鉴别非霍奇金淋巴瘤及睾丸精原细胞瘤。传统的评价标准(如RECIST)可能对评价分子靶向药物在肿瘤体积缩小前的早期活性并不适用。 与此相反,氟(18F)脱氧葡萄糖(FDG)-PET成像可能在治疗很早期就可预测临床结果,尤其是伊马替尼等分子靶向药物治疗结果。然而并非所有疾病上均能在FDG-PET显示活性,肿瘤摄取葡萄糖的早期变化也不是预测所有靶向性治疗的肿瘤反应所必须的,例如已经被证明的mTOR抑制。 活检取样对于确立肿瘤疗效和耐药的分子标记物可能具有价值,但并非总可行。某些情况下可能无法触及病灶,即使能够成功采集活检样品,也会因坏死组织、组织纤维化或正常组织存在而发生肿瘤疗效评价的技术性失效。 若分子标记物能预测和反映临床结果,则须经验证。当标记物经过验证后,每例患者的基线表达状况与治疗疗效和结果之间的关联有助于优化药物治疗,通过改进患者选择策略来实现。 机会窗(Window-of-opportunity)试验开始使用不同的疾病状态来实现这种方法,如局部晚期乳腺癌。 研究者习惯用机会窗试验来评价一种药物是否值得开发,现在这种试验被视作评价新药药效的安全有效方法,和确定有效的预测预后标记物以指导临床决策的安全有效方法。 研究者正在探索传统终点的替代指标,如开发细胞传导信号来评估肿瘤对激酶抑制剂的早期疗效。 人体蛋白激酶是具有快速响应和重组能力的信号传递酶的动态网络,可导致癌细胞内激酶发生重新编程,也导致耐药性的产生。测定激酶组的表达变化提供了变化早于临床表现的肿瘤疗效指标。 MEK抑制的激酶活性在基因工程小鼠和三阴性乳腺癌细胞模型进行了评估,从中提出了索拉非尼和司美替尼联合用药的机理。 早期评估方法的开发以及对在耐药性机制的认识提高(如肿瘤变得耐药),使治疗手段有望改变为克服耐药的治疗,从而避免无效药物的延长暴露。 与临床试验使用的传统终点比较,上述方法仍然处于试验性阶段,但已为特定患者、特定疾病和特定药物的肿瘤疗效早期评估提供了可能。 临床试验设计需要整合新终点指标与传统终点指标(如RECIST),以能够更好地预测主要结果。这些方法和终点需要按照Prentice标准进行严格的验证和评估,即替代终点干预作用必须与真实终点的临床意义变化平行。 临床终点应如何整合到临床试验和和临床实践中? 在过去的20年,药物开发的模式基本保持不变;然而新的试验设计已经开始挑战这个架构。研发成本的增加可能已经成为药物开发的限制因素,也影响患者获得有效的治疗。因此,挑战临床试验的传统设计的时机已经到来。 首先,III期临床试验的理念需要从一个群体是否获益向群体中哪些人可以获益转变。临床试验结果可能会忽视一小群疗效超常者和无疗效者,但这些小群体可能最需要应该了解。 虽然小群体中的病例数可能很少,但他们的结果能够提高研究者对于肿瘤疗效、肿瘤耐药和免疫系统的逃逸机制的认识。 美国国家癌症研究所在这一领域的研究一路领先,由主治医师推荐的各型肿瘤中100种疗效超常的基因分型已列入计划(NCT02243592)。迄今为止,在1例膀胱癌患者中获得了概念验证,患者对治疗有双倍的疗效,全基因组测序的结果显示TSC1突变,随后8%的膀胱癌患者中评估了这一结果。 突变-治疗配对是目前正在探索中的模式。从超常疗效者中获得的知识将对试验设计产生影响,驱使患者的分层将根据突变类型进行而非根据组织学进行。 在肿瘤试验中,癌症类型的分子分层给患者带来的好处显而易见。一项I期试验中,Tsimberidou等对多重既往治疗的患者采取匹配靶向性治疗,匹配治疗组的疗效(27%)高于治疗未经匹配者(5%)。 此外,研究者发现,至治疗失效的时间提高(5.3个月比2.2个月),中位生存期提高(13.4个月比9.0个月)。 但50%的患者无效,仅40%的突变型获识别。即使已知其中涉及癌基因(例如,KRAS或MYC)或肿瘤抑制基因(如TP53、BRCA1或BRCA2),这些突变型在药物开发中也不是好靶点。 组合突变更增加了其中的复杂性,在乳腺癌、肠癌、脑癌或胰腺肿瘤中被检测出来的突变基因平均有3-6种。 Tsimberidou的研究显示,17.6%的患者携带2种以上的突变基因。Val600Glu BRAF突变型是一个典型例子,维罗非尼(vemurafenib)治疗黑色素瘤有良好疗效而治疗肠癌疗效不佳。 只要选择恰当患者,特异性选择性的治疗传递了产生实质作用和临床获益的期望。成功的靶向治疗的例子已在临床出现,如乳腺癌治疗中曲妥珠单抗靶向HER2,黑色素瘤治疗中维罗非尼靶向BRAF,肺癌治疗中克唑替尼靶向ALK,都是临床中靶向治疗的成功典范,但这种治疗理念在许多肿瘤中难以实现。 靶向治疗的适当使用,可能允许在少量经选择人群中开展随机试验,结果预期差异较大。尽管试验设计是创新的,试验仍然保持了对历史性终点的本质依赖。 研发药物从II期临床延展到III期临床的可能性仍然很低,这是试验各方的一个关注点。1995年和1996年ASCO大会上展示的II期试验,仅13%在10年内推进到III期临床阶段。 正在开发的新型试验设计能够解决时间、财务投入和患者人数的限制。例如,治疗局部晚期或转移性前列腺癌的STAMPEDE试验便采用了多组多级设计,以随机化的方式同时对单个对照组检验几种药物的疗效。 治疗转移性结直肠癌的FOCUS4试验也采用类似的多组多级设计。这种设计使新型生物标记物-治疗方法匹配以增加药物有效性的证据。 生物标志物互补的多组别临床试验目前有两项正在进行中,一项是治疗乳腺癌的I-SPY2试验(NCT01042379 ),另一项是治疗肺癌的BATTLE-2试验(NCT01248247)。 由于临床试验中分层增加,受试者招募进展缓慢逐渐成为临床试验所面临的问题之一,这个问题因为临床试验的竞争性环境而在加剧。 约1/4的生殖泌尿试验的关闭原因并非药物毒性或缺乏治疗作用,入组人数增加困难是主导原因。HIV阳性患者人数也有类似问题,主要由于竞争性试验的数量引起。 现有药物治疗HIV都已取得较好的疗效,注册试验的患者招募速度已出现大幅下降。对此临床试验各方共同商议制定了未来临床试验设计路线图,拟订了一个HIV临床试验设计方法,在不增加耐药患者的耐药风险基础上评估新药的安全性与疗效。 试验设计包括10-14天联合治疗期,在此期间采用无效药物和试验新药联合治疗,随后以最佳给药方案开始新药治疗。 选择合适的终点指标 如果临床试验设计正处于变革,试验终点是否也应该平行演变?把恰当的终点指标整合到临床试验设计中,是临床试验取得成功的最重要一环。不恰当的终点指标和不好的试验设计可能会终止一个前景良好药物的开发。 例如,吉非替尼是首个获准用于晚期非小细胞肺癌的三线治疗药物,最初随机试验发现治疗仅在10%的患者中产生疗效,中位持续时间为7个月。 随后的III期试验中,吉非替尼二线或三线治疗近1700例未经选择的晚期非小肺癌患者,尽管PFS有所改善,但总生存率没有显著获益。这个结果导致了药物开发重新评价。 研究人员过后对这项试验进行了分析,检验了肿瘤活检样本,调查生物标志物与EGFR突变型和临床结果之间的关联性。发现215份突变基因检测的患者样本中仅26份EGFR突变呈阳性。吉非替尼对37.5%的EGFR突变患者有疗效,但在EGFR突变(-)的患者中有效率仅2.6%。 如果设计良好,取得阴性结果的试验与取得阳性结果的试验一样有价值;设计不当的试验且不论结果如何,都会留下未解决的问题。FDA的肿瘤药品审评部提倡临床试验设计的协作,以确保对于疾病的部位和分期能够采用恰当的终点指标。 由于治疗选择的改进,许多癌症患者如今能够生存更长时间,研究界对某些癌症现在是否应该当作慢性病治疗的观点存有争议。20世纪80年代早期卵巢上皮癌的中位总生存期是15-24个月,现今已经提高到36-40个月。 监管部门批准新药上市要求的总生存期提高已经成为了临床学和统计学的挑战,因为PFS和总生存期之间的差异仍在持续增加。 有人认为,复发卵巢癌患者的PFS延迟可以成为新药注册批准的替代终点之一,因为逐步提高的PFS从理论来说应该能够带来总生存期的改善。 这种情况下,须评估延迟进展时间的临床价值,评估因素包括:治疗过程中的风险(不良事件和耐受性);将来治疗的副作用风险(如神经病变、中性粒细胞减少和铂类药物过敏);后续治疗的开始时间;后续治疗的疗效损失等。同时评估症状和生活质量。 类似争论也出现在转移性乳腺癌治疗领域,几种新治疗药物用于临床实践理应提高转移性患者的总生存期,但实际上这些药物没有一种能够改善总生存期。然而近期研究显示,一些 药物(如曲妥单抗治疗HER2-阳性的转移性乳腺癌)的确带来了生存期的显著改善。 然而,PFS在试验设计和分析中作为主要结果却引来风险,使药物的长期疗效获得无效结论,尤其是,对于疾病部位而言,PFS并不是真正的替代终点。大型随机对照试验的证据显示,PFS除了使临床实践采纳该治疗是否有价值的疑问声浪更大,患者的总生存期或生活质量未见改善。 例如,近2500名HER-2阴性乳腺癌女性患者入组一项随机对照试验,比较贝伐单抗加化疗与单独化疗的疗效。结果显示PFS改善但总生存期无改善。而贝伐单抗最初获得FDA的加速审批的适应症却是联合紫杉醇用于治疗局部复发或转移性乳腺癌。根据新提供的证据以及安全性的问题,FDA撤回了这项批准。 这个例子凸显了明确患者获益的重要性,早期终点在药物注册的临床试验中使用且可能是优化进程的最佳方法;然而如果患者长期获益未能通过验证,药品批文应予以撤销。严格评估新药疗效的验证性试验是必要的,但并未坚持一直这么做-有综述显示FDA加速审批的47种新药中,14种未进行完成验证性试验。 奥沙利铂治疗晚期结直肠癌的加速审批是另外一种情况。这种治疗确实能够令患者从中受益。合并奥沙利铂和氟尿嘧啶-亚叶酸使疾病进展时间从单一治疗的2.7个月(氟尿嘧啶-亚叶酸)或1.6个月(奥沙利铂)延长至4.6个月,根据这个结果,奥沙利铂于2002年获得了批准。 试验证明奥沙利铂一线治疗复发结直肠癌有临床获益,故它在2004年通过了FDA的注册审批。时至今日,奥沙利铂仍然是结直肠癌护理标准方法的组成之一。 另一个例子是OCEANS试验检验贝伐单抗治疗铂类敏感的复发性卵巢癌疗效的结果。PFS获益但总生存期无差异。总生存期无差异的原因被认为是进展后的治疗以及贝伐单抗的后续使用(在安慰剂组中为40%),提示在疾病进展时保留使用贝伐单抗(加化疗)而使得两组的生存期相近。 尽管PFS结果为阳性,但贝伐单抗加入一线化疗治疗12个月的疗法增加了副作用,还加剧了治疗费用的增长,即没有临床获益,也不是必须性治疗。 PFS作为主要终点用于临床试验设计和分析的考虑可能会危害患者。将贝伐单抗引入一线治疗可能使将来试验设计变得更复杂,因为研究人员有可能倾向于在这种治疗中结合更多的药物,这比将一种新药加入化疗更加具有挑战性(和毒性)。总生存期和PFS的统计效力可能有助于减少这些问题,应在试验设计中包含进来。 强调临床结果的总生存优势是肿瘤临床试验特别之处。大多数慢性疾病(如糖尿病、类风湿关节炎和阿尔茨海默氏病),药品审批的侧重点是其他方面的获益,某些情况下证明死亡率并未升高便可。 这些疾病的临床试验极少要求将总生存期获益作为必要的试验终点,原因可能是这些疾病不危及生命,从确诊到死亡经历的时间阶段很长。 FDA在2013年批准的糖尿病新药系基于药物对血糖控制的改善作用(卡格列净和阿格列汀)。试验显示醋酸艾司利卡西平降低了癫痫患者的发作频率,因而获得了批准。 然而抗肿瘤药物仅凭症状改善就能通过审评的情况较少,米托蒽醌治疗转移性前列腺癌是个例外。它的试验设计采用疼痛评分和止痛剂的使用作为疗效的客观评价指标。 患者报告结局被纳入设计正面例子是鲁索替尼治疗骨髓纤维化。研究者在与监管机构沟通后采用脾脏大小的变化作为主要终点,以患者自述结果、改良的骨髓纤维化症状评估表支持(MFSD)。 为了表现出临床的相关性,改良的MFSD重点放在那些对患者具有临床意义的症状,如盗汗、瘙痒、易饱感、腹部不适等。 总生存期在 药品注册为目的的试验中不是必须指标,因此,患者能够交叉。这种设计不仅使注册监管机构加快了审批,使药物能够尽早用于患者,也有助于加快临床试验中的入组。 试验结果转化到日常临床实践 并存其他疾病或少数族裔及社会经济地位弱势群体中的老年患者往往在临床试验中没有足够的人群代表性。药品批准后的观察性研究是决定其在普通人群是否真正产生临床获益所必须的。 药物的副作用常常被低估,但却至关重要。当从临床试验的小规模人群过渡到社区性广泛使用时,药物的毒性作用可以超过生存期小幅改善的优势。 有效性验证试验的理想入选标准应该足够严格,使试验的受试者组成均一,但也应足够宽松,以确保结果的普遍可靠性。 研究者将西南肿瘤III期试验中的患者与药物监测、流行病学与最终结果癌症注册数据库中的患者进行比较后发现,在确诊后第一年,试验参加者的生存率数据占优,但超过这一时间点后,两组患者的结果相似。 大规模的合作基因测序项目的开展,如癌症基因谱,国际癌症基因联盟的出现,意味着肿瘤学正迅速地从肿瘤亚型的组织学分类体系转向分子学分类体系。 这使得癌症正在转变成一系列的罕见病。肿瘤学的研究者越来越多依赖于观察性群体性研究和汇总性数据库来评估护理模式,副作用和治疗的疗效。 总之,肿瘤试验设计的目标是改善患者的生存期和生活质量。作者阐述了肿瘤的异质性需要肿瘤临床试验设计乃至终点指标的个性化,试验设计的这种转变将有利于临床价值(如患者获益)的决策,包括新药,成本效益等。 这些因素对于监管机构的新药审批产生影响。终点指标须与疾病相适应,以不变应万变的方式不再适用。患者报告结局的结果,如症状控制的改善或生活质量等,不应被视为替代终点,而是可使用终点中的一个重要选项。 肿瘤学在改善预后和患者治疗方法的选择方面在过去二十年中取得了巨大的进步,当前,许多声音质疑某些癌症是否可以当作慢性疾病来看待。 肿瘤学的重点已经转向了如何改善患者的生活质量;明确哪些患者需要积极治疗以及避免过度治疗。研究机构、公司和监管机构之间的密切合作是这些进展的基石。 肿瘤学挑战传统试验设计和开发新终点指标的时机已经到来,新的终点是经过验证的反映临床获益的终点,而非传统的肿瘤大小偏差。试验终点必须跟上临床试验设计演变的步伐。通过HIV临床研究的映像,试验各方需要一起决定未来肿瘤试验的最佳方法。 最重要的是,临床试验设计的变化,将有助于确保临床试验主要终点不被新技术的进步所遗忘,即为了患者生活更好,生存更久。 ' |5 t, J4 I. A4 h/ d: q$ H- D
|