四分位偏差
分散や平均偏差以外でデータのばらつきを表す指標のひとつに四分位偏差 (quartile deviation) がある.しぶんいへんさと読む.四分位偏差はデータの四分位点 (quartile) から計算できる.
四分位点とは,昇順に並べたデータを4等分したときの3つの分割点のことである.第1四分位点 (四分位数),第2四分位点,第3四分位点の3つからなる.全データの中央値が第2四分位数であり,第2四分位数 (中央値=メディアン) を除いた2つデータにおいて,平均値が小さいほうのデータのメディアンが第1四分位数,大きいほうのデータのメディアンが第3四分位数である.すなわち,データ小さいほうから数えて,全データの25%をカバーする点が第1四分位数,50%が第2四分位数,75%が第3四分位数となる.
以上の四分位点を用いて,四分位偏差 Sq は以下の式で与えられる.ここで,Q1 は第1四分位数,Q3 は第3四分位点を示す.
\begin{eqnarray*}S_q=\frac{1}{2}(Q_3-Q_1)\tag{1}\end{eqnarray*}
すなわち,四分位偏差とは,全データのメディアン (第2四分位数) 周りの50% (Q3 - Q1) のばらつく具合を示す値である.データ中に存在する極端に大きな値,または小さな値 (外れ値) の影響を受けにくい指標である.