統計検定に関する事柄を忘れないようにまとめます.

R にてジャック・ベラ検定 (Jarque-Bera test) を行う.ジャック・ベラ検定はコルモゴロフ・スミルノフ検定やシャピロ・ウィルク検定等と同様に,得られたデータの正規性を検定する手法である.すなわち,対象のデータが正規母集団に由来するという帰無仮説を検定する.本検定はメキシコの経済学者 Carlos Jarque Uribe とアメリカの計量経済学者 Anil Kumar Bera によって開発された比較的新しい手法である.これらの開発者は,2014年時点では,どちらも未だ現役で活躍している.多くのパラメトリック検定では検定における対象のデータは正規分布に従うことを仮定しており,正規性の検定は以降の検定をパラメトリックで行うのか,または,ノンパラメトリックで行うの判断するという観点からも重要である.R では,パッケージ tseries の jarque.bera.test() にて実行できる.

最初に,Rを起動させ,以下のコマンドにてパッケージをインストールし,そのパッケージを読み込む.既にパッケージをインストールしている場合は1行目は不要.

$ install.packages("tseries", repos="http://cran.ism.ac.jp/")
$ library(tseries)

p値の計算

ジャック・ベラ検定は得られたデータが正規分布に従うか否かを検定する手法である.以下のようなデータXが得られたとき,このデータが正規分布に従うか否かを検定する.帰無仮説 (H0) は標本分布が正規分布に従うことである.有意水準5%にて検定する.

データX58, 63, 83, 10, 62, 41, 41, 31, 54, 44, 31, 34, 35, 15

R を起動させ,以下のコマンドにて,上のデータXを変数 vx に格納する.

$ vx=c(58, 63, 83, 10, 62, 41, 41, 31, 54, 44, 31, 34, 35, 15)

ジャック・ベラ検定の使い方はシンプルで以下のように jarque.bera.test(x=) と打つだけで実行できる.

$ jarque.bera.test(x=vx)

結果は以下のよう表示される.

 
        Jarque Bera Test

data:  vx
X-squared = 0.18607, df = 2, p-value = 0.9112

結果の X-squared は本検定の検定統計量である.カイ二乗値と示されているが,これは帰無仮説のもとで本検定における検定統計量は自由度2のカイ二乗分布に近似的に従うからである.この検定では,p値が0.9112であるため,有意水準が5%でも帰無仮説は保留され (p > α),データXは正規性をもつと判断できる.

コマンド jarque.bera.test() には,特にオプションは存在しない.

Hatena Google+