理論関連事項

統計学の基本事項,確率分布の詳細,各種データ解析法の理論的背景について.

ウィルコクソンの符号順位検定 (Wilcoxon signed rank test) とはノンパラメトリック検定のひとつである.名前が似ているウィルコクソンの順位和検定とは異なる検定法なので注意が必要.どちらも2つのデータ間における代表値 (中央値) の差を検定する方法であるが,符号順位検定は得られた2つのデータ間に対応があるときに用いる検定法である.すなわち,ウィルコクソンの順位和検定は,パラメトリック検定でいうところのスチューデントのt検定とかウェルチのt検定に相当するものであり,ウィルコクソンの符号順位検定は,パラメトリック検定でいうところの対応のあるt検定に相当するものであるといえる.パラメトリック検定であるt検定等とは異なり,得られたデータに正規性を仮定できないときに用いられる.本検定法では他のノンパラメトリック検定と同様に,データを順位化して統計的推定を行う.以下に示されるような,それぞれがサンプルサイズ N からなる対応のあるデータXおよびデータYが得られた場合,実際の検定は以下のように行う.帰無仮説 (H0) は2群間の代表値に差がないことである.

データXX1, X2, X3, ..., XN
データYY1, Y2, Y3, ..., YN

まず,以上のデータ1および2の対応するサンプルの値の差からなるデータの差Dを作成する.この部分は対応のあるt検定に似ている.

データの差の絶対値D|X1-Y1|, |X2-Y2|, |X3-Y3|, ..., |XN-YN|

次に,以上のデータXiおよびYi (i=1, 2, 3, ..., N) の差の絶対値Dの小さい順に順位を割り当てる.もし同順位を持つ要素が存在する場合は,順位の平均を計算し,その順位の平均を各要素に割り当てる.例えば,ふたつの値が互いに10位タイであった場合は, (10+11)/2 を計算し,それらの値両方に10.5位を割り当てる.また,Xi=Yi の場合には順位は付けない.このようなルールにて順位 ri を割り当てることでデータの差の絶対値Dは以下のように順位に変換される.ここで,順位を付けない場合はその分だけ標本数は減る (N → N').

データの差の絶対値Dr1, r2, r3, ..., rN'

このようにして付けた順位から今度は統計量Wおよび w を求める.統計量Wは Xi>Yi が満たされるときの順位の合計値統計量wは Xi<Yi が満たされるときの順位の合計値である.これが本検定法が符号順位検定と名付けられた所以となる.この統計量Wおよび w を比較したときにより小さい値が最終的に求める統計量Tとなる.

\begin{eqnarray*}T=\mathrm{min}(W,\ w)\tag{1}\end{eqnarray*}

以上によって求められた統計量Tがウィルコクソンの符号順位検定数表における棄却限界値以下のとき帰無仮説を棄却する.すなわち,2群間の母代表値には差があると結論する.ただし,以上の方法はデータXおよびYにおいて,XiおよびYiの値が異なるときのサンプルサイズ N' が N'≤25 を満たすときに行う.もし,N'>25の場合は以下の統計量Zを考える.

\begin{eqnarray*}Z=\frac{\displaystyle\left|T-\frac{N(N+1)}{4}\right|}{\sqrt{\displaystyle\frac{N(N+1)(2N+1)}{24}}}\tag{2}\end{eqnarray*}

以上の統計量Zは近似的に標準正規分布 N(0, 1) に従う値である.よって,両側検定で有意水準 α=0.05 での検定を行いたい場合はこの統計量Zが1.96以上 (標準正規分布の数表から求める) の場合,帰無仮説を棄却する.すなわち,2群間の母代表値には差があると結論する.ウィルコクソンの符号順位検定の数表は以下のようになる.

N'両側 α=0.05両側 α=0.01片側 α=0.05片側 α=0.01
5--0-
60-2-
72-30
83051
95183
1083105
11105137
12137179
131792112
1421122515
1525153019
1629193523
1734234127
1840274732
1946325337
2052376043
2158426749
2265487555
2373548362
2481619169
25896810076
Hatena Google+