当统计分析的数据不服从正态分布或分布未知时,可使用非参数统计方法对数据进行分析,本文将介绍几种常用的非参数统计方法。
Y! b6 |7 {2 L- n' i$ B1.符号秩和检验
, R) Y! e6 E3 V3 b- i; K, K# S) [* Z
类似于成对数据的t检验。当试验前后数据的差值非正态时,可采用符号检验或者符号秩和检验比较试验前后的数据是否有统计学差异。
+ C, f! o$ d4 b( P9 U9 F- T; @- T
统计假设为H0:差值的中位数Me=0 vs H1: Me≠0。
- }2 _) f( o8 _, `. E 计算步骤如下:
2 ^( `2 w/ i, j* ^$ L4 Y1)求配对数据(xi,yi)的差值di=xi-yi。
2 m* M; ~5 ]. y: E& i2)对差值的绝对值|di|由小到大排序,记为Ri。若差值的绝对值相等,取其平均秩。引入虚拟变量Ui,当di>0时,Ui=1;当di≤0时,Ui=0。
& W; X% }+ m- h+ \. A: _5 F# J9 @
3)计算统计量W+。如果Me>0,则总体X的分布关于正数Me对称。从而有P(X>0)>P(X>Me)=1/2,P(X<0)<1/2,故观察到的取正值的样本个数比较多。因此,当W+较大即W+≥c,c=inf{c*:P(W+≥c)≤α}时,拒绝原假设,认为差值大于0。
! G" x1 P, r4 U* U! i
(1)) ?. e3 G1 q8 Q- k0 E
- ]' U- j' V- \9 }0 g) I, [4)当n>50且H0成立时,W+近似服从正态分布,正态统计量为U。取α=0.05,当|U|>U0.975=1.96时,拒绝原假设,认为差值的中位数不等于0。
' F0 f: ^2 v, `) ^7 S+ _% ?, v% {- T! \7 C! G; b# Y+ b
(2)
, C$ w8 q8 G1 l: ? e1 M# d
2. Wilcoxon秩和检验
# ~) a3 O$ h8 |" ?' d
类似于团体t检验,在非参数统计中,考虑用Wilcoxon秩和检验比较两组间的统计学差异。设两总体分别为X、Y。
0 |- v1 K$ a7 l: Y- U: y
统计假设为H0:X与Y同分布 vs H1:X与Y分布不同
. ?* I, V4 w# g( R8 ` 记yi在合样本(x1,…,xm,y1,…,yn)中的秩为Ri,检验统计量为WY。
# i% p: G3 q9 @- }% `+ {% {5 Q
(3). ~1 I; I7 J6 }0 r, m/ }% a
% D6 ]$ K, S$ N$ H1 u当WY过大或过小时,拒绝原假设,认为两总体之间有显著差异。当N=m+n>50且H0成立时,WY近似服从正态分布,正态统计量为U。取α=0.05,当|U|>U0.975=1.96时,拒绝原假设,认为X与Y的分布不同。
3 I0 I. n, B6 z% k5 }(4)
6 h4 T+ }$ _) U
3. K-W秩和检验
# X, O) B l; T& b" W8 E
类似于方差分析。当有多组(>两组)按完全随机化设计进行比较时,若不满足方差分析的条件,可用K-W秩和检验,
% X2 B. Z2 ~" Q" l9 e
统计假设为H0:各组的均值相等 vs H1: 各组的均值不全相等。
" H$ W% E8 a4 D8 ?4 }& a/ J( f* X0 G 假设数据为连续型分布,记Rij是xij在合样本(x11,…,x1n1,…,xk1,…,xknk)中的秩。
3 Q8 w: P* _! t, ]6 G
(5)
$ T1 M- H( I7 |
(6)
, `( K4 I5 e9 |
(3)、(4)中N=n1+n2+…+nk。而SST=SSB+SSW,由于SST为定值,此时的方法分析不同于一般的方差分析(一般的方差分析法需通过计算SSB和SSW的值计算F统计量,再进行假设检验),这里只需计算SSB的值即可。
9 O3 a- {+ d7 ~( q3 R* p- B% ]
(7)7 f9 r" {6 n5 ^, j
/ {" ~- Y( I" ]: L4 A( n9 R# ?) |2 v
Kruskal和Wallis提出统计量H,并证明它近似服从卡方分布。
1 N8 _/ B3 Z6 ~2 F" c(8)
) |0 ]; \7 m9 N! U( \$ e1 ]9 m
取α=0.05,当H>χ20.95时,拒绝原假设,认为各组均值间有统计学差异。