二変量統計検定
正規分布に従う変数X および Y の差の検定はそれらの2変量が以下の公式および分布に従うことを利用して行う.変数が正規分布に従うか否かはコルモゴロフ・スミルノフ検定やシャピロ・ウィルク検定等にて判断することができる.各変数に正規分布に従うと判断出来る場合,t検定は以下の4つの場合に分けることができる.最初に,変数Xと変数Yに対応がある場合である.さらに,対応がない場合は,以下の3つに場合分けされる.ひとつ目は,変数Xと変数Yの母分散が既知の場合である.普通は検定対象の母分散だけが判っていることは極めて稀なので,これを考える機会は少ない.次が,変数Xと変数Yの分散が等しいと仮定できる場合である.これはスチューデントのt検定で計算できる.最後が,変数Xと変数Yの分散が等しいとは仮定できない場合である.これはWelchのt検定で計算できる.変数XおよびYの2変数に等分散性が仮定できるか否かは,F検定,ハートレイ検定,バートレット検定およびルビーン検定等にて判断することができる (実際は検定の繰り返しになるので慎重に扱う).
- 変数Xと変数Yに対応がある場合
- 1以外で,変数Xと変数Yの母分散が既知の場合
- 1以外で,変数Xと変数Yの分散が等しいと仮定できる場合
- 1以外で,変数Xと変数Yの分散が等しいとは仮定できない場合
最初に,1ケースである変数XとYに対応がある場合は以下の統計量Tが自由度 n-1 の t分布に従うことを利用する.n は各変数のサンプルサイズ.
このとき,ud は変数X と変数Y の各サンプル間の差の不偏分散であり,以下の式で与えられる.ここで,di は変数X と変数Y の各サンプル xi および yi の差であり,d は di の平均値である.
次に,2のケースである,変数Xと変数Yの母分散が既知の場合は,以下の統計量Tが標準正規分布 N(0, 12) に従うことを利用する.変数Xのサンプルサイズがn,母分散がσx2であり,変数Yのサンプルサイズがm,母分散がσy2である.
次に,3のケース,変数Xと変数Yの分散が等しいと仮定できる場合,すなわち,変数Xと変数Yが等分散である場合は,以下の統計量Tが自由度 n+m-2 のt分布に従うことを利用する.
ここで,uxy2は以下の式で与えられる値である.nおよびmはそれぞれ変数XおよびYのサンプルサイズであり,ux2およびuy2は変数XおよびYの不偏分散である.
最後に,4のケースである,変数Xと変数Yの分散が等しいとは仮定できない場合,すなわち,変数Xと変数Yが等分散であるとは仮定できない場合は,以下の統計量Tが自由度 l のt分布に従うことを利用する.
ここで,自由度 l は以下の式で与えられる.得られる値が整数でない場合は四捨五入する.