信息来源:微信公众号--静远医学统计在线(微信号:jeeyor) 授权转载,点击阅读原文可进入该公众号,查看静远学堂系列栏目。
临床试验中常见的统计分析方法(十四)
) W' X* _! |( c$ u; G" W6 p
重复测量数据分析(六)
* `; j% c3 p' F8 y, M6 G5 w: f
接上篇,我们通过SAS中的PROC MIXED程序来进一步介绍混合效应模型在重复测量数据中的应用。
" C/ _0 c# j9 _% y7 O- {3 Y
首先,我们看一下PROC MIXED程序需要用到的数据格式,与univariate方法类似,如下:
病人 Patient | | | |
001 | | | |
001 | | | |
001 | | | |
002 | | | |
002 | | | |
002 | | | |
003 | | | |
003 | | | |
003 | | | |
004 | | | |
004 | | | |
004 | | | |
SAS 程序:
PROC MIXED;
CLASS GROUP TIME PATIENT;
MODEL RESPONSE= GROUP TIME GROUP*TIME;
REPEATED / TYPE=UN SUBJECT=PATIENT(GROUP) PCORR;
RUN;
程序解释:
(1)TYPE= 选项:规定模型的协方差结构,即规定不同时间点的方差假设以及不同时间点关系的假设,常见的有以下几种:
Ÿ TYPE=UN: 即unstructured approach,对所有时间点的相关性不做任何假设,这时相邻时间短的测量之间的相关性比相邻时间长的测量之间的相关性往往更为紧密。
Ÿ TYPE=CS:即compound symmetric structure,假设任何两个时间点间的相关性是相同的,而各个时间点为方差齐性。这时如果我们在上述PROC MIXED程序里选择TYPE=CS,那么其结果和univariate approach的结果是相同的。
Ÿ TYPE=AR(1):即First-order autoregressive structure,相邻的时间点或者说连续的两次访视测量的相关性是相同的。假设相邻的两个时间点的相关性为ρ,那么第一次访视和第三次访视测量的相关性就是ρ的平方,第一次访视和第四次访视测量的相关性就是ρ的立方,依次类推;而各个时间点为方差齐性。
还有别的,如TYPE=ARMA(1,1), TYPE=TOEP, TYPE=HF等等,在此小胖就不再一一介绍了,有兴趣的同学,可参考SAS user’s guide。另外,我们可以利用SAS output中的Fit Statistics中的统计量AIC, AICC, BIC(静注:这几个统计量用于描述模型的拟合优度,其值越小,表示模型拟合得越好)等作为判断标准来判断那个协方差结构是最合适的协方差结构。
4 ]8 z6 _4 z2 R# @
(2)与PROC GLM不同,PATIENT(GROUP)这个效应在模型里是在SUBJECT=这个选项中规定的。
静注:PROC MIXED功能很多,还有许多参数支持输出,分析时需根据具体需求进行程序的适当修改,更多关于PROC MIXED过程的参数介绍请点击底部的原文链接,包括Example。小胖老师这里只是简单带了下关于重复测量资料的处理方法,针对此话题我们今后再整理些典型的案例进行比较详细的分析与解说。
临床试验中常见的统计分析方法(十五)
重复测量数据分析(七)
# g( t( j9 ]1 q
4. GEE分析
Generalized estimating equations (GEE)是另一种处理有缺失值的重复测量数据的方法,在SAS程序里是通过PROC GENMOD来实现的。它需要指定correlation structure(如compound symmetric(CS)和unstructured(UN)),但GEE对模型参数的估计通常会比较准确,即使你指定correlation structure时指定了错误的correlation structure。在这一点意义上,GEE分析比PROC GLM和PROC MIXED更为稳健(robust)。另外,我们知道一个重复测量数据不均衡或缺失值较多时,如果你还要纳入较多的协变量,这时使用PROC GLM时,会带来很多解释上的困难,而且这种困难会随着你更多地纳入协变量而变得更大。而GEE就很适合这种纳入较多协变量的数据,当然这时我们需要这个数据必须是较大的数据集。通常来说,如果有3-4个变量(包括治疗组别),这时至少样本量需要50-100。
我们来看一下SAS程序的实现吧:
数据结构
病人 Patient | | | |
001 | | | |
001 | | | |
001 | | | |
002 | | | |
002 | | | |
002 | | | |
003 | | | |
003 | | | |
003 | | | |
004 | | | |
004 | | | |
004 | | | |
SAS程序:
PROC GENMOD;
CLASS GROUP TIME PATIENT;
MODEL RESPONSE=GROUP TIME GROUP*TIME/ TYPE3;
REPEATED SUBJECT= PATIENT / TYPE=AR(1);
RUN;
在以上的几篇博文中,我们介绍了四种重复测量数据的分析方法,大家可以发现,我们所讲的重复测量值都是数值型变量。重复测量也较多低出现在一些分类数据中,这时我们就会使用到一些分类数据的统计方法,比如weight least squares(WLS)以及GEE。这些方法会用到SAS程序里的CATMOD和GENMOD,关于分类数据重复测量的分析方法就不在此做介绍了,以后小胖可以专门开辟一个系列来介绍。
, x) L# H3 W3 L4 z! L% Y% Y& v; R
_0 a4 k1 q, e, M+ o" |$ h4 g0 L