理論関連事項

統計学の基本事項,確率分布の詳細,各種データ解析法の理論的背景について.

ウィルコクソンの順位和検定 (Wilcoxon rank sum test) とはノンパラメトリック検定のひとつである.マン-ホイットニーのU検定 (Mann-Whitney U test) と呼ばれる検定法と実質的には同じものである.一方で,ウィルコクソンの符号順位検定とは異なる検定法なので注意が必要.ウィルコクソンの順位和検定 (およびマン-ホイットニーのU検定) は,パラメトリック検定における対応のないt検定,すなわち,スチューデントのt検定とかウェルチのt検定に対応するものであるが,ウィルコクソンの符号順位検定はパラメトリック検定における対応のあるt検定に相当するものである.

ウィルコクソンの順位和検定は得られた2つのデータ間の代表値 (中央値) に差があるかどうかを検定する.主にサンプル数が少なく得られたデータに正規性を仮定できないときに用いられる.本検定では,観測値の大小を順位に置き換えて統計的推定を行う.以下に示されるようなそれぞれN1およびN2 (N1 ≤ N2) のサンプルサイズからなるデータ1およびデータ2が得られた場合,実際の検定は以下の流れで行う.帰無仮説 (H0) は2群間に差がないこととなる.

データ1X11, X12, X13, ..., X1N1
データ2X21, X22, X23, ..., X2N2

最初に,以上のデータ1および2を併せる.ただ単に混ぜ合わせる.

データ1+2X11, X12, X13, ..., X1N1, X21, X22, X23, ..., X1N2

以上のデータ1および2を併せたデータに小さい順に (または大きい順に) 順位を割り当てる.もし同順位を持つ要素が存在する場合は,順位の平均を計算し,その順位の平均を各要素に割り当てる.例えば,ある観測値と別の観測値が互いに4位タイであった場合は,(4+5)/2 を計算し,それらの観測値両方ともに4.5位を割り当てる.Xijに割り当てた順位をrijとするとデータ1および2は以下のように変換される.このように,ウィルコクソンの順位和検定は観測値を順位に置き換えるため,t検定に比べ,外れ値の影響を受けにくいという利点がある.このような尺度水準を順序尺度という.

データ1r11, r12, r13, ..., r1N1
データ2r21, r22, r23, ..., r1N2

次に,データ1およびデータ2においてサンプルサイズが少ない方の,すなわち,以上の場合はデータ1 (N1 ≤ N2) における割り当てられた順位の和 (順位和) を計算する.この順位和が求める統計量Tである.

\begin{eqnarray*}T=\sum_{j=1}^{N_{1}}r_{1j}\tag{1}\end{eqnarray*}

以上によって求められた統計量Tがウィルコクソンの順位和検定数表における w および W に対し,以下の式2または式3の条件を満たすとき,帰無仮説が棄却される.

\begin{eqnarray*}T\leq w_{N_1,N_2}\tag{2}\end{eqnarray*}
\begin{eqnarray*}W_{N_1,N_2}\leq T\tag{3}\end{eqnarray*}

以下の表がウィルコクソンの順位和検定の数表となる.上が有意水準0.05のとき,下が0.01のときに用いる.もし,(N1, N2)=(4, 5) である場合は,上で求めた順位の合計,統計量Tが11以下 (11位以下) または29以上 (29位以上) であるとき,有意水準5%で帰無仮説が棄却されることとなる.

有意水準5% (α=0.05) の数表
α=0.05N2
w/W456789101112131415
N12----3/193/213/233/254/264/284/304/32
3-6/217/237/268/288/319/339/3610/3810/4111/4311/46
410/2611/2912/3213/3514/3814/4215/4516/4817/5118/5419/5720/60
5-17/3818/4220/4521/4922/5323/5724/6126/6427/6828/7229/76
6--26/5227/5729/6131/6532/7034/7435/7937/8338/8840/92
7---36/6938/7440/7942/8444/8946/9448/9950/10452/109
8----49/8751/9353/9955/10558/11060/11662/12265/127
9-----62/10965/11568/12171/12773/13476/14079/146
10------78/13281/13984/14688/15291/15994/166
有意水準1% (α=0.01) の数表
α=0.01N2
w/W56789101112131415
N13----6/336/366/397/417/447/478/49
4-10/3410/3811/4111/4512/4812/5213/5513/5914/6215/65
515/4016/4416/4917/5318/5719/6720/6521/6922/7322/7823/82
6-23/5524/6025/6526/7027/7528/8030/8431/8932/9433/99
7--32/7334/7835/8437/8938/9540/10041/10643/11144/117
8---43/9345/9947/10549/11151/11753/12354/13056/136
9----56/11558/12261/12863/13565/14267/14969/156
10-----71/13973/14776/15479/16181/16984/176

これらの数表は,与えられたN1およびN2における考えられ得る全ての順位和の組み合わせを計算し,度数分布表を描き,棄却率以下の確率を示す順位を割り出すことで求められる.

Hatena Google+