理論関連事項

統計学の基本事項,確率分布の詳細,各種データ解析法の理論的背景について.

分散平均偏差以外でデータのばらつきを表す指標のひとつに四分位偏差 (quartile deviation) がある.しぶんいへんさと読む.四分位偏差はデータの四分位点 (quartile) から計算できる.

四分位点とは,昇順に並べたデータを4等分したときの3つの分割点のことである.第1四分位点 (四分位数),第2四分位点,第3四分位点の3つからなる.全データの中央値が第2四分位数であり,第2四分位数 (中央値=メディアン) を除いた2つデータにおいて,平均値が小さいほうのデータのメディアンが第1四分位数,大きいほうのデータのメディアンが第3四分位数である.すなわち,データ小さいほうから数えて,全データの25%をカバーする点が第1四分位数,50%が第2四分位数,75%が第3四分位数となる.

以上の四分位点を用いて,四分位偏差 Sq は以下の式で与えられる.ここで,Q1 は第1四分位数,Q3 は第3四分位点を示す.

\begin{eqnarray*}S_q=\frac{1}{2}(Q_3-Q_1)\tag{1}\end{eqnarray*}

すなわち,四分位偏差とは,全データのメディアン (第2四分位数) 周りの50% (Q3 - Q1) のばらつく具合を示す値である.データ中に存在する極端に大きな値,または小さな値 (外れ値) の影響を受けにくい指標である.

Hatena Google+