静远学堂—跟着小胖学统计034：临床试验中常用的统计分析方法(六）、（七）、（八） - 药群论坛

信息来源：微信公众号--静远医学统计在线(微信号：jeeyor) 授权转载

4 k7 p6 M% E5 u/ U; Z+ A- L

临床试验中常用的统计分析方法（六）

6 N/ z: X* G: y/ ?

两因素方差分析（Two-Way ANOVA）（三）

可能大家在临床试验统计分析过程中特别是在一些研究报告或发表的文章中对疗效的描述时会碰到这样一个名词least square means，那么它和我们所说的普通的means有什么区别呢？

小胖想通过下边一个简单的例子给大家介绍一下两个均数的计算法

中心	A	B
1	2, 2, 2	4, 5
2	6, 7	2, 4, 6

如上表，A和B为治疗组，1，2为研究中心。

1中心A治疗组有3例病人，疗效数据分别为2、2和2；

1中心B治疗组有2例病人，疗效数据分别为4和5；

2中心A治疗组有2例病人，疗效数据分别为6和7；

2中心B治疗组有3例病人，疗效数据分别为2、4和6。

means的计算：

治疗组A的means为所有A组的病人数据的均数，即（2＋2＋2＋6＋7）/5＝3.8；

治疗组B的means为所有B组的病人数据的均数，即（4＋5＋2＋4＋6）/5＝4.2

这时A<B;

Least square means的计算：

第一步计算每个格子（由治疗组和中心联合形成的）内的均数：

1中心A治疗组这个格子的均数为：（2+2+2）/3=2

1中心B治疗组这个格子的均数为：（4+5）/2=4.5

2中心A治疗组这个格子的均数为：（6+7）/2=6.5

2中心B治疗组这个格子的均数为：（2+4+6）/3=4

总结均数如下：

中心	A	B
1	2	4.5
2	6.5	4

第二步计算least square means即为这些格子均数的均数：

治疗组A的least square means为：(2+6.5)/2=4.25

治疗组B的least square means为：(4.5+4)/2=4.25

这时A=B。

临床试验中常用的统计分析方法（七）

+ f. p! c7 ~5 R2 V

两因素方差分析（Two-Way ANOVA）（四）

临床试验中，Least Square Mean（简称LS-mean）经常用在研究中心为区组的临床试验中来估计治疗的效果。在这种多中心的试验中，往往会出现某个中心的病人比另一个中心的病人也多出很多的情况。治疗效果的LS-mean等于各个研究中心平均值加起来再除以中心数，即每个中心对治疗效应的贡献具有相同的权重。

当中心的均值或中心样本量差异比较大时， LS –mean和一般的算术平均数会相差比较大。我们可以看下边这个例子：

中心		Placebo	30mg	60mg
1	Mean （N）	5.67 (12)	8.38 (8)	10.11 (9)
2	Mean （N）	6.82 (11)	6.40 (10)	12.11 (9)
合计	Mean	6.22	7.28	11.11
	LS－Mean	6.24	7.39	11.11

上表中，大家可以发现，由于各中心样本量差不多，Mean和LS-mean两个值比较接近。但如果中心病人数差异比较大呢，我们可以试着假设以下这种情况：

中心		Placebo	30mg	60mg
1	Mean （N）	5.67 (20)	8.38 (16)	10.11 (15)
2	Mean （N）	6.82 (3)	6.40 (2)	12.11 (3)
合计	Mean	5.82	8.16	10.44
	LS－Mean	6.24	7.39	11.11

上表中，我们假设维持各中心均数不变，但由于中心样本量的变化，mean和LS－mean两个值就会相差很大。

在SAS程序,我们可以通过LSMEANS语句来实现LS－mean的计算：

PROC GLM;
CLASS TRT CENTER;
MODEL X=TRT CENTER/SS3;
LSMEANS TRT/PDIFF STDERR;
RUN;

静注：反映数据资料平均数量水平的特征数，简称均数。它表示资料中数据的中心位置，常作为其代表……平均数种类较多，其中应用最为普遍的是算术平均数。此外，还有几何均数、调和均数、中位数、最小二乘均数等，可供特定情况下选用。另一方面，有时候如果只简单地使用算术平均数来评判一个结果，就有可能造成统计学错误，因为，任何一个结果，都有其多种条件影响。如较为离散的计量资料，此时用中位数来评价可能会比算术平均数评价该数据特征更恰当。最小二乘均数的作用也是这个道理，当各中心样本量出现较大的不均衡时，此时中心间的偏差会导致总体算术平均数无法更真实地反映数据特征，所以需要进行较正计算，得到的最小二乘均数更能反映该数据的特征。

临床试验中常用的统计分析方法（八）

3 G( u+ n9 X; {* E

两因素方差分析（Two-Way ANOVA）（五）

在方差分析模型中，一般有两种类型的效应，即固定效应（fixed effect）和随机效应（random effect）。

什么是固定效应呢？简单说就是你这个效应的水平是固定的，是事先已经确定的，比如治疗组吧，在一个试验中，你要比较两个药的疗效，治疗组效应就两个水平即A组和B组，这两个水平是固定的，因此治疗组效应就是固定效应。

什么是随机效应呢？随机效应就是其效应水平是从大量的水平中随机抽取的，而且没有事先规定。比较拗口，举个例子吧。比如研究中心有时就可能被当作随机效应，怎么说呢？当你选择的进行试验的几个研究中心是从大量的研究中心中随机选择的，那么此时研究中心就是个随机效应。

有了随机效应和固定效应之分，我们的方差分析也就有了区别。如果方差分析模型里纳入的效应全是固定效应，那么就叫固定效应模型；如果全是随机效应，就叫随机效应模型；既有固定效应又有随机效应，那就叫混合模型。

我们常见的包括治疗组和研究中心的两因素方差分析模型通常被认为是固定效应模型，特别是在你使用了较少的研究中心的情况下。当然，如果你是从大量合格的中心中选择了几个中心做你的试验，你可以把研究中心当作随机效应，此时这个两因素方差分析模型就成了混合模型了。

研究中心当作随机效应或是固定效应对结果有什么影响呢？如果模型中无中心－治疗交互作用，那么研究中心当作随机还是固定效应，其结果都是相同的；但是如果交互作用被纳入到模型里，那么两者就不一样了。而此时如果你把研究中心当作随机效应，那么你在SAS程序里可以通过RANDOM语句来规定哪一个效应是随机效应。

一些复杂的混合效应模型的分析我们也可通过SAS程序里的PROC MIXED来实现，具体方法，我们将在以后的博文中加以介绍。