[size=17.14285659790039px] 编者按:临床数据管理是临床试验实施过程的重要组成部分,是数据收集、录入、清理和管理过程的综合体现,其目的是获得高质量的临床数据用于统计分析,从而得到真实可信的结论。为了获得高质量临床数据,数据管理需注意的过程应包括:建立合理的临床数据管理人员团队,特别是统计分析人员的早期介入;设计高效的数据收集工具和方式;选择合适的数据管理系统进行严格的临床数据审查和清理。
' X# L9 e& d- i! C7 t/ [
7 q6 `) T* H( ]+ g$ o" m
9 X$ P" X" Y' v- Z. q4 P4 r9 b/ F& Q
临床试验是通过收集和整理临床数据来验证研究假设,从而回答研究问题,并且将结果应用于具有类似特征的目标患者人群。
临床试验以获得高质量临床数据为前提才能保证统计分析得到可靠的结论,可见临床数据的质量对于研究结果起着至关重要的作用。高质量临床数据应包括哪些条件呢:首先,数据必须真实可信,这不仅要求研究者不能有捏造、伪造和抄袭数据等违反职业道德的行为,也要求通过严谨的试验设计、临床数据管理等手段来控制各种系统误差和随机误差。其次,数据必须是和研究目的相关。在开展临床试验前,研究者需要明确研究方案,包括相应的研究问题。收集的数据是为回答研究问题而服务的,和研究目的无关的数据不是本次研究所需要的。第三,高质量数据应该适合于统计分析。这要求研究者考虑如何控制缺失数据,严格的来说,研究者应该避免数据缺失,但这很难做到,最低的要求是保证缺失的数据不会让统计分析结果产生偏倚。
获得高质量的研究数据是临床数据管理(Clinical Data Management,CDM)的基本要求。临床数据管理包括数据收集、录入、清理和管理等环节,首要目标是通过将错误数据和缺失数据降到最低从而获得最大化的高质量数据用于统计分析,从而得到真实可信的回答研究问题的结论。为了达到这个目标,研究者需要在数据收集、录入、清理和管理等过程中采取严格的质量控制措施来确保数据的完整和可靠。因此,本文拟从如何获得高质量的临床数据的角度,探讨在数据管理过程中应注意的问题,并为以后的临床试验提供借鉴。
1.建立合理的临床数据管理团队
临床数据管理小组应由多学科人员组成,小组中的每一个成员都在数据管理过程中承担着相应的职责。具体的临床试验可根据其特点调整相应的人员组成,但基本的人员组成应包括:数据管理负责人,数据采集人员,质量控制人员,数据库设计人员,统计分析人员等。数据管理负责人对临床数据管理的整个过程负责,包括制定数据管理计划和临床数据管理需要的相关文件,以及参与解决在临床数据管理过程中每一阶段遇到的问题。
在上述成员中,尤其需要重视的是统计分析人员。现阶段很大一部分中国临床试验尚没有意识到统计分析人员早期介入的重要性,只是在数据收集、清洗完毕,数据库锁定以后才将临床数据交给统计人员进行分析。虽然研究者为了控制数据的质量采取了一些措施,但是没有统计人员早期介入的临床试验收集的数据仍然存在目的不明确、缺失过多等问题,导致不适合做统计分析。一个设计严谨的临床试验,统计分析人员在早期方案制定的过程就应参与进来。此外,统计分析人员一个很重要的前期工作是主导统计分析计划的制定。
统计分析计划是从严格的统计学角度为回答试验方案中的研究目标或终点的临床问题而设计的。从某种意义上来说,制定统计分析计划既能确保完整收集所需要的临床研究数据,又能避免收集不必要或重复数据。传统的临床试验的步骤为:研究方案→病例报告表→病人入组及数据收集→数据库设计及临床数据录入→统计分析计划及统计分析→研究报告;现在越来越多的临床试验步骤为:研究方案→统计分析计划→病例报告表→病人入组及数据收集→数据库设计及临床数据录入→统计分析→研究报告。统计分析计划的制定仅在研究方案之后,可见,现代临床试验越来越强调统计分析计划的重要性。
2.设计高效合理的数据收集工具
病例报告表(CRF)是研究者收集研究方案所需要信息的工具,包括纸质病例报告表和电子病例报告表。相比于纸质版病例报告表,电子病例报告表犯错误的机会较小,且处理数据质疑的速度更快。因此,现在越来越多的大型临床试验采用电子病例报告表收集临床数据。所有的临床数据都需要病例报告表来收集,因此,临床试验数据质量的好坏直接与病例报告表设计和填写的质量好坏相关联。
2.1 三种常见类型的数据及相应的病例报告表设计格式
临床试验常需收集三种类型的数据:时间无关的独立数据,时间相关的独立数据,和累积性数据。图一显示了对不同的数据类型的病例报告表格式设计。
2.1.1时间无关独立数据是指数据一次性收集完成,这样的数据包括人口学资料和既往疾病史等。
2.1.2时间相关独立数据是指在不同的访视时间多次收集,但数据不是累计的,例如生命体征信息。对于时间相关独立数据,病例报告表设计有两种方法:一是每次访视单独一页;二是多次访视放在一页记录,注明访视的时间。两种方法各有其优缺点,第一种方法能更准确的反映访视的进度,但是会导致病例报告表更庞大。第二种方法能节省病例报告表的纸张而且符合数据库的格式,但是不方便研究者查看每次访视的所有信息。另外,第二种方法也更容易导致数据录入错误。
2.1.3累积性数据是指数据多次收集但不仅限于特定的访视日期,且每次可以收集多个信息。不良事件以及接下来的对应处理措施就是典型的例子,不良事件的发生并不仅限于访视时才发生,一旦发生就要记录,且每次可能发生多项不良事件。常用的累积性数据方法就是上述的第二种方法。
2.2 病例报告表设计的注意事项
2.2.1符合研究方案。这包含两层含义:一是病例报告表收集研究方案要求的所有数据;二是不需要分析的数据不出现在病例报告表上。
2.2.2避免重复。重复收集相同的数据是对人力、时间、资源的浪费。常见的重复收集如收集年龄和出生日期。
2.2.3问题清晰、简洁、明确。病例报告表的条目切忌模棱两可,让填写人员揣摩问题的意思,或者采用反问的形式导致理解错误。
2.2.4以方便统计的方式收集数据。一是对需要计算的数据进行预先编码;二是使用复选框;三是尽量不要使用开放性问题,尽可能避免文本型问题,因为这不仅会造成设计数据库的困难(比如字节长度的设置等),同时也给统计分析增加了难度。
3.进行严格的临床数据审查和清理
临床数据的审查和清理是保证数据质量的又一重要环节,主要工作是通过检查病例报告表的填写质量,数据对方案的依从,核实数据的有效性、完整性、逻辑性,以及对发现的差异进行内部和外部解决,目的是使数据真实、准确和便于统计分析。
3.1 临床数据管理中的数据审查
数据审查方法很多,常见如与原始病例核对的源数据监查、数据库数据的核实及汇总统计等。
3.1.1源数据的核查
ICHGCP 要求,监查员应该根据源文档来核查病例报告的数据,一旦发现错误或差异,应通知研究者,以确保所有数据的记录与报告正确和完整。为了完成这一任务,监查员需要到研究现场进行源数据的核实,重点检查数据的完整性、准确性、可辨认性、合理性;记录前后的一致性;入选和排除标准是否严格遵守;是否随机分配;受试者是否按规定进行随访,有无拖延或遗漏;安全性数据及记录的完整性,确认有无严重不良事件发生等。
3.1.2数据库核实
数据库核实主要包括数据格式、完整性、一致性与合理性的检查,如两次数据录入的核对、衍生型数据的计算、数据间的逻辑关系检查,以及数据范围的检查等。用计算机程序进行的逻辑检验是数据库核实最常用的方法,如下面的常见错误可以很容易用逻辑检验检查出来:正常值范围之外的数据,如研究方案的纳入标准为受试者大于18岁,出现15岁的受试者;自相矛盾的数据,如第二次的访视日期比第一次的访视日期更早;缺失数据等。
3.1.3汇总统计
研究者的弄虚作假以及故意违反研究方案是临床数据错误中较难发现的,通过数据库核实不能检查出此类错误。发现这些错误必须使用特别的软件(如数据库集成的应用软件)或者程序(如SAS的PROC UNIVARIATE、PROCFREQ)并进行汇总统计( aggregated statistics)分析。
3.2 数据的清理
数据的清理是指内部解决或外部解决在数据的审核过程中发现的问题数据或缺失数据。内部解决是根据病例报告表的其他部位的数据做出判断,最后解决问题. 外部解决主要是由数据管理员向研究者发出质疑表的形式,最终获得差异的解决。
3.3 数据管理过程中数据审查与清理过程
图2显示了数据管理过程中数据审查与清理的整个流程。研究者完成设计病例报告表后,在数据清理的多个环节(录入前人工检查、数据录入后的逻辑检查,以及数据锁定前的最终检查)可以对病例报告表和数据库进行纠错性修改或对数据进行质疑。
4.选择合适数据管理系统
越来越多的临床试验采用多中心设计,特别是Ⅲ期多中心临床研究,存在周期长、单位多、数据量大等特点,导致研究者对一款功能强大的临床数据管理系统的需求越来越大。临床数据管理系统是一个集成式的综合数据管理平台,改变了以往纸质化临床研究时数据采集速度慢、数据核查滞后、数据清理困难等状况。使用数据管理系统的目的是为了通过功能强大的数据管理系统来控制研究数据的质量,因此,一款好的数据管理软件应有以下功能:电子病例报告表的设计功能,数据一致性检查功能,质疑管理和数据的修改功能,数据的可溯源性,系统管理功能,生成便于分析的数据文件等。
现在市场上功能强大的数据管理系统大多是商用的,需要花钱购买,ORACLE CLINICAL,CLINTRIAL,MACRO等,这些系统在功能上大多相似。另外,这些系统通常都较昂贵,且需要相应的硬件支持。除了上述的商用系统外,也有一些免费使用的数据管理系统,包括Open Clinica,openCDMS,TrialDB和Epidata等。下面,介绍两款有代表性的数据管理软件。
4.1 Epidata
Epidata不属于商业软件,在网络上可以免费下载,基本功能齐全,适合于小型临床试验使用。EpiData的特点是使用便捷、容易操作。该软件功能可以概括如下:①基本录入功能,包括变量可设定取值范围、跳转条件、逻辑关系和计算衍生变量;②二次录入和一致性检查;③数据可用多种常用格式导入和转出;④输出包含变量列表、频数分布的数据编码本;⑤数据可采用符合美国联邦信息处理标准中的加密标准FIPS-197的Rijndael方法进行加密,以保护敏感信息;⑥进行基础统计分析、作图、重新编码和定义缺失值等。
4.2 Clintrial
Clintrial属于商业软件,使用其系统需购买,但其功能强大,适合于大型的临床多中心试验。Clintrial由管理设置、病例报告表设计、数据录入、数据管理和数据提取五个功能模块组成,其主要功能可概括如下:①设定研究方案基本信息和用户存取数据和使用的权限、②按照病例报告表设计数据库结构,采用结构化、标准化模板方式设计病例报告表录入页面,有利于多项研究之间资料利用和快速创建良好录入界面;③智能帮助数据录入,支持二次录入盲态数据核验;④可在不同阶段运行逻辑检查、一致性检查、衍生变量计算;⑤监察、报告数据矛盾和变化,所有修改均记录稽查痕迹;⑥支持多国多中心临床研究,通过广域网管理全球海量数据。
结语
中国目前大概有1110种医学期刊,每年发表数以万计的临床研究,如果这些文献研究能做到结果真实可靠,将极大地提升中国的医疗水平。获得高质量的临床数据是保证结果真实可信的前提,而临床数据管理是临床试验获得高质量临床数据的重要保证。研究者要通过临床数据管理来确保收集的临床数据符合研究方案、真实可信以及便于统计分析。病例报告表作为收集临床数据的工具,其设计的科学性与收集的数据质量成正比。同时研究者也需要对收集的数据进行严格的审核和清理,对问题数据及时进行处理。对于大样本多中心临床试验,往往需要收集海量的临床数据,一款功能强大的数据管理系统协助管理数据是必不可少的。总之,为了获得高质量的临床数据,需要参与临床数据管理的每一个成员认真履行自己的职责,高度重视临床数据管理过程中的细节问题。
9 B/ f+ }' D. ]