理論関連事項

統計学の基本事項,確率分布の詳細,各種データ解析法の理論的背景について.

ハートレイ検定 (Hartley test) とは得られた複数のデータ間の母分散の均一性を検定する検定手法である.1950年にアメリカの統計学者,Herman Otto Hartley によって開発された.バートレット検定ルビーン検定と同様,2群のデータ間の等分散性を検定するF検定を一般化した検定法といえる.バートレット検定やルビーン検定と比較して検出力 (1-β) に優れている.得られたデータが以下のようなデータ1,データ2,...,データkのk水準からなる場合,ハートレイ検定は以下の手順によって行う.帰無仮説 (H0) はk群間の母分散は等しいことである.

データ1X11, X12, X13, ..., X1N
データ2X21, X22, X23, ..., X2N
・・・・・・
データkXk1, Xk2, Xk3, ..., XkN

ハートレイ検定においては,それぞれの水準におけるサンプルサイズの N は互いに一致している必要がある.検定を行うには最初に,以下の統計量 Fmax を求める.

\begin{eqnarray*}{\rm F_{max}}=\frac{\displaystyle \max_{1\leq i \leq k}\{U_i^2\}}{\displaystyle \min_{1\leq i \leq k}\{U_i^2\}}\tag{1}\end{eqnarray*}

ここで,Ui2 はデータiの不偏分散を表す.すなわち,上の式はデータ1~kの分散の中で最も大きなものを最も小さいもので割ることを意味しており,この比が1のとき,水準内の最大分散と最小分散が等しいということを意味する.この統計量Fmaxが以下のFmaxの数表の値より大きい場合,帰無仮説を棄却し,k個のデータ間の母分散には差があると判断する.

上限5%点, df: 水準内の自由度 (サンプルサイズ-1), k: 水準数
k
2345678910
df239.087.5142202266333403475550
315.427.839.550.962.072.883.593.9104
49.6015.520.625.229.533.637.541.244.8
57.1510.813.716.318.720.922.924.726.7
65.828.3610.412.113.615.016.317.518.6
74.996.948.449.7010.811.812.713.514.3
84.436.007.198.179.029.7710.511.111.7
94.035.346.317.117.798.408.949.449.90
103.724.855.676.346.917.417.868.278.64
152.863.534.004.374.674.945.175.385.57
202.462.953.283.533.743.924.084.224.35
302.072.402.612.772.903.013.113.193.27
501.751.962.092.192.262.332.392.442.48
1001.481.601.681.731.781.811.841.871.89
上限1%点, df: 水準内の自由度 (サンプルサイズ-1), k: 水準数
k
2345678910
df2199422729103711841705206124312812
347.550.653.393.596.698.7133136137
423.236.748.459.167.978.387.295.7104
514.914.527.933.038.041.946.050.054.0
611.115.619.222.224.927.329.631.733.6
78.8912.114.616.618.420.021.522.824.1
87.509.9411.813.314.615.716.817.718.6
96.548.499.9911.112.113.013.814.515.2
105.857.478.649.6010.411.111.812.412.8
154.074.935.525.986.386.717.007.277.51
203.323.904.304.604.855.065.255.425.57
302.632.993.233.413.563.683.793.883.97
502.102.312.452.562.642.712.772.822.87
1001.681.801.881.931.972.012.042.072.09
Hatena Google+