信息来源:微信公众号--静远医学统计在线(微信号:jeeyor) 授权转载,点击阅读原文可进入该公众号,查看静远学堂系列栏目。
' A9 D% X1 d \8 _临床试验中常见的统计分析方法(十二)
重复测量数据分析(四)
4 V! X; n* a0 M+ s, @, Z% n
前面我们介绍了两种重复测量数据分析的方法,即univariate approcah和multivariate approach,都是通过SAS程序中的GLM来实现的。
- j- J; }6 Z4 \& N& v
然而,临床试验中常会出现一些缺失值,这时这两种方法的使用就会出现一些问题。一般情况下,如果缺失值较多,这两种方法就会不推荐使用。为什么呢?
, k" e/ r: B% [8 q" |' n" C8 ?' @
我们拿有两个时间点的数据为例,通俗点讲一下:
上表中001和003病人两个时间点有一个时间点数据缺失,那么:
对between-patient variability的贡献:
001病人为时间点1的数据信息
003病人为时间点2的数据信息
而对于within-patient variability来说,由于是病人自己之间的比较,001和003两个时间点缺失一个,则无法计算这个variability,因此对within-patient variability的贡献为0,而这个within-patient variability恰恰反应的就是病人的response profile,通俗来讲就是不同时间的反应的情况。因此,如果缺失值较多,导致很多病人无法纳入within-patient variability的计算,那么对于response profile的评价就会出现问题。
- P( f, K% L; E
另外特别对于multivariate approach来说,每个病人只要有一个测量数据缺失,就会导致大量的数据被排除在分析之外,这样不仅会大大降低统计检验的power,而且还可能把那些有价值的信息排除在分析之外。
2 W2 `& o M8 P' v, w& g; ^5 F
因此,当存在较多缺失值时,这两种方法就不是很合适了,这时我们就需要用到另外两种方法即SAS程序里的PROC MIXED和GEE(PROC GENMOD)方法了。
在下面的博文中,小胖将陆续简单介绍PROC MIXED和GEE(PROC GENMOD)两种方法。
临床试验中常见的统计分析方法(十三)
重复测量数据分析(五)
' T2 e$ _, A0 \- G
3. PROC MIXED (Mixed Model混合效应模型)
我们先来理解一下Mixed Model (混合效应模型),小胖在先前的博文中就曾提及过固定效应(fixed effect)和随机效应(random effect)。 我们通常把某个因素对结果变量的影响称为这个变量的效应。而这种效应分为固定效应和随机效应。当这个变量水平是事先确定的,是个固定的常数时,那么它的效应就是固定效应;例如治疗组,我们这个试验就想研究A组和B组,那么水平只有A和B两个水平,因此组别就是个固定效应。
: v5 `; A% ~+ P& I: y
而当这个变量具有随机的特点时,比如它的变量水平数是无限的或不确定的,我们试验中纳入的只是这些水平数的一个随机样本时,它的效应就是随机效应。比如病人这个效应吧,我们试验中纳入的病人是从病人总体中随机抽取出来的,是个随机样本,因此病人这个效应就是个随机效应。
6 S" N/ {7 C# f. o" v+ y( T* N
那如果一个模型里既有固定效应,又有随机效应,那么这样的模型就是混合效应模型。
/ y1 W* `% w4 V# C, w
其实重复测量数据分析就是一个混合效应模型,为什么呢?
(1)我们纳入模型的治疗组别一般是固定效应
(2)我们纳入模型的病人效应一般是随机效应
混合效应模型现在已被广泛应用于重复测量数据的分析,那么混合效应模型在处理重复测量数据方面有什么优势呢?
- Z+ w2 M8 H4 d d
(1)混合效应模型适用于有一定数量缺失值的数据。如果一个测量值缺失了,不会对这个病人其他的测量值产生影响。这样就充分利用了有缺失值的病人的数据,而不会像univariate和mulvariate方法那样,一个观察值缺失,整个受试者的数据均作为缺失。
+ y, G$ i& \0 o2 R) D- r: y( E
(2)混合效应模型允许每个病人测量次数不同和观测时间不同。比如说,一个病人在第4个月进行了测量,而另一个病人在第6个月进行了测量,这时我们只需要在时间(time)变量上记录下一个是4个月,另一个是6个月就可以了。
( S1 S7 l, Z' P: q
(3)混合效应模型不对compound symmetry做要求。你可以让模型选择自己的协方差结构(covariance structure)也可以自己指定一个协方差结构(covariance structure),关于协方差结构,小胖将在下篇博文中作一简单介绍。
* x& a9 B- [ A) P, l
下篇博文,小胖将结合SAS中的PROC MIXED程序对混合效应模型在重复测量数据中的应用做进一步介绍。
静注:处理重复测量资料时,数据特点往往都是混合效应的(固定效应与随机效应),而且临床数据伴随缺失的情况也是很普遍的,所以为了使模型更稳健、效能更高、拟合更优,分析时尽可能直接选择MIXED过程或下一篇博文提到的GENMOD过程进行处理;就像做方差分析时选择ANOVA(要求均衡)还是GLM(无均衡要求)的问题一样,为了避免后面出现的一些不必要的麻烦,若非特殊情况都尽可能选择更少限定使用条件的分析过程。