F検定
F検定 (F-test) とは、2群間における等分散性、すなわち分散の一様性を検定する方法である。バートレット検定やルビーン検定が3群以上のデータ間の等分散性を検定するのに対し、F検定ではデータXおよびデータYで与えられた2群間における分散が等しいかどうかを検定する。パラメトリック、ノンパラメトリックに限らず多くの検定法はデータ間の分散に一様性を求めるため、データ間に等分散性が仮定できるか否かは、統計検定を行う際に非常に重要な要素のひとつとなる.ただし,F検定を行った後にt検定等を行うのは統計検定の繰り返しの観点から,必ずしも正しくはない。本検定における検定名の F は推定統計学の父、Ronald Aylmer Fisher に由来する。フィッシャーの名前に因んでいるだけあってF検定は等分散性の検定だけでなく、F分布に従う統計量の検定の総称として用いられることも多い。例えば、分散分析における統計量もF分布に従う値であり、広い意味では分散分析をF検定とよぶこともある。
F検定は以下のように行う。最初に、以下で示されるサンプルサイズN1およびN2からなるデータXおよびYが得られたとする。
データX | X1, X2, X3, ..., XN1 |
データY | Y1, Y2, Y3, ..., YN2 |
これに対して以下の統計量Tを求める。ここで、UXおよびUYはそれぞれデータXおよびデータYの不偏分散であり、σXおよびσYはそれぞれデータXおよびデータYの母分散である。この統計量がフィッシャーの分散比とよばれる値である。
以上で与えられる統計量Tは自由度 (N1-1, N2-1) のF分布に従う値である。ここで、検定の帰無仮説 (H0) を立てる。帰無仮説 (H0) は2群間の母分散が等しいこと、すなわち σX2=σY2であること,となる。そこで、σX2=σY2 を上の式に代入し、以下の T を得る。
この統計量Tが、自由度 (N1-1, N2-1) のF分布上にてあらかじめ設定した棄却域に入る場合は、帰無仮説を棄却し、2群間の母分散に等分散性は仮定できないと結論を下す。棄却域に入らない場合は帰無仮説を採択し、2群間の母分散に等分散性を仮定しても良いと結論を下す。