統計検定に関する事柄を忘れないようにまとめます.

対応のあるt検定 (paired t-test) とはパラメトリック検定のひとつである.得られたデータの各観測値がペアとして対応している対標本における各観測値の差の検定である.スチューデントのt検定ウェルチのt検定とは別物であるが,実際には,対応のあるt検定で求める統計量もスチューデントのtであり,本検定をスチューデントのt検定と呼んでも間違いではない.しかし一般には,対応のない2標本の平均値の差の検定をスチューデントのt検定,対応のある対標本の差の検定を対応のあるt検定という.

データ間の対応とは,以下のようなものとなる.ある学年のあるクラスで実施した数学のテスト結果をデータAとする.そのクラスに対し数学のドリルによる計算練習を一定期間与えた後に再度,同程度のレベルの数学のテストを受けさせ,得られたテスト結果をデータBとする.このデータAおよびデータBには対応がある.一方で,ある学年の別のクラスで実施した数学のテスト結果をデータCとする.このデータCとデータAには対応がない.2つのデータがペアとして対応している対標本から得られた場合を対応があるといい,別々の標本から得られた場合を対応がないという.なので,あるベンチマークデータセットに対して,2つのソフトウェアの性能を計算したときに,性能の良し悪しを検定したい場合に使う方法は,データが同一でそれらに対応があるため,対応のある検定方法となる.

2つのデータ間に対応がなく,また,データの分布に正規性が仮定できるとき,対応のあるt検定を行う.サンプルサイズがともに N のデータXおよびYの差の比較は以下のように行う.

データXX1, X2, X3, ..., XN
データYY1, Y2, Y3, ..., YN

最初に,データXおよびYの差dN (= XN - YN) を求める.これが検定の対象となる統計量の実質であり,この後の計算はスチューデントのt検定よりシンプルである.

データの差d1, d2, d3, ..., dN

次に,以下の統計量Tを求める.ここで,dはデータの差の平均,μdはデータの差の母平均,Udはデータの差の不偏標準偏差である.

\begin{eqnarray*}T=\frac{\overline{d}-\mu_d}{U_d / \sqrt{N}}\tag{1}\end{eqnarray*}

以上で与えられる統計量Tは自由度 N-1 のt分布に従う値である.ここで,検定の帰無仮説 (H0) を立てる.帰無仮説 (H0) は2群のデータに差がないこと,すなわち μd=0であること,となる.そこで,μd=0 を上の式に代入し,以下のTを得る.

\begin{eqnarray*}T=\frac{\overline{d}}{U_d / \sqrt{N}}\tag{2}\end{eqnarray*}

この統計量Tが,自由度 N-1 のt分布上にてあらかじめ設定した棄却域に入るか否かを考える.つまり,対応のあるt検定とはデータの差の1標本のt検定のことである.帰無仮説が棄却されたら比較している2群間の平均値には差がないとはいえない (実質的には差がある) と結論する.

Hatena Google+