信息来源:微信公众号--静远医学统计在线(微信号:jeeyor) 授权转载,点击阅读原文可进入该公众号,查看静远学堂系列栏目。
9 A% L9 F+ h$ n8 v临床试验中常见的统计分析方法(十二)
重复测量数据分析(四)
& X$ b# t& i1 I5 Y
前面我们介绍了两种重复测量数据分析的方法,即univariate approcah和multivariate approach,都是通过SAS程序中的GLM来实现的。
8 n# K$ W j/ B, v8 l; T
然而,临床试验中常会出现一些缺失值,这时这两种方法的使用就会出现一些问题。一般情况下,如果缺失值较多,这两种方法就会不推荐使用。为什么呢?
! P" W* Y5 @9 v7 _
我们拿有两个时间点的数据为例,通俗点讲一下:
上表中001和003病人两个时间点有一个时间点数据缺失,那么:
对between-patient variability的贡献:
001病人为时间点1的数据信息
003病人为时间点2的数据信息
而对于within-patient variability来说,由于是病人自己之间的比较,001和003两个时间点缺失一个,则无法计算这个variability,因此对within-patient variability的贡献为0,而这个within-patient variability恰恰反应的就是病人的response profile,通俗来讲就是不同时间的反应的情况。因此,如果缺失值较多,导致很多病人无法纳入within-patient variability的计算,那么对于response profile的评价就会出现问题。
- b) {0 G7 ~$ b% A: R3 D
另外特别对于multivariate approach来说,每个病人只要有一个测量数据缺失,就会导致大量的数据被排除在分析之外,这样不仅会大大降低统计检验的power,而且还可能把那些有价值的信息排除在分析之外。
' i0 A2 m2 Q. p4 b* f% H. Y* J9 v
因此,当存在较多缺失值时,这两种方法就不是很合适了,这时我们就需要用到另外两种方法即SAS程序里的PROC MIXED和GEE(PROC GENMOD)方法了。
在下面的博文中,小胖将陆续简单介绍PROC MIXED和GEE(PROC GENMOD)两种方法。
临床试验中常见的统计分析方法(十三)
重复测量数据分析(五)
, L( m6 {% ^* X
3. PROC MIXED (Mixed Model混合效应模型)
我们先来理解一下Mixed Model (混合效应模型),小胖在先前的博文中就曾提及过固定效应(fixed effect)和随机效应(random effect)。 我们通常把某个因素对结果变量的影响称为这个变量的效应。而这种效应分为固定效应和随机效应。当这个变量水平是事先确定的,是个固定的常数时,那么它的效应就是固定效应;例如治疗组,我们这个试验就想研究A组和B组,那么水平只有A和B两个水平,因此组别就是个固定效应。
w0 Y. `0 ]/ I
而当这个变量具有随机的特点时,比如它的变量水平数是无限的或不确定的,我们试验中纳入的只是这些水平数的一个随机样本时,它的效应就是随机效应。比如病人这个效应吧,我们试验中纳入的病人是从病人总体中随机抽取出来的,是个随机样本,因此病人这个效应就是个随机效应。
. ?# V' T' J8 ?# C
那如果一个模型里既有固定效应,又有随机效应,那么这样的模型就是混合效应模型。
. k6 k& n* z+ r( _) C+ ?+ F" y
其实重复测量数据分析就是一个混合效应模型,为什么呢?
(1)我们纳入模型的治疗组别一般是固定效应
(2)我们纳入模型的病人效应一般是随机效应
混合效应模型现在已被广泛应用于重复测量数据的分析,那么混合效应模型在处理重复测量数据方面有什么优势呢?
3 b) s, W) r: |5 _9 A* J( |
(1)混合效应模型适用于有一定数量缺失值的数据。如果一个测量值缺失了,不会对这个病人其他的测量值产生影响。这样就充分利用了有缺失值的病人的数据,而不会像univariate和mulvariate方法那样,一个观察值缺失,整个受试者的数据均作为缺失。
$ D- Z$ i4 k) ~- y& G+ P% P
(2)混合效应模型允许每个病人测量次数不同和观测时间不同。比如说,一个病人在第4个月进行了测量,而另一个病人在第6个月进行了测量,这时我们只需要在时间(time)变量上记录下一个是4个月,另一个是6个月就可以了。
" t \% S" D8 L8 @, P+ i# _4 H
(3)混合效应模型不对compound symmetry做要求。你可以让模型选择自己的协方差结构(covariance structure)也可以自己指定一个协方差结构(covariance structure),关于协方差结构,小胖将在下篇博文中作一简单介绍。
o2 f2 O8 d" o" P, S) `
下篇博文,小胖将结合SAS中的PROC MIXED程序对混合效应模型在重复测量数据中的应用做进一步介绍。
静注:处理重复测量资料时,数据特点往往都是混合效应的(固定效应与随机效应),而且临床数据伴随缺失的情况也是很普遍的,所以为了使模型更稳健、效能更高、拟合更优,分析时尽可能直接选择MIXED过程或下一篇博文提到的GENMOD过程进行处理;就像做方差分析时选择ANOVA(要求均衡)还是GLM(无均衡要求)的问题一样,为了避免后面出现的一些不必要的麻烦,若非特殊情况都尽可能选择更少限定使用条件的分析过程。