分散と標準偏差
分散ならびに標準偏差とはデータ集団の分布の広がりを表す量である.データXに対して,それぞれ V(X) および D(X) と表記されることがある.平均値と併せて統計学で最もよく用いられるパラメーターである.
母集団の分散および標準偏差は母分散および母標準偏差と呼び,それぞれ σ2 および σ で表される.この量は対象とするデータ集団が母集団であるときに用いるものとなる.n はデータ数,μ は平均値.
\begin{eqnarray*}\sigma^2=\frac{1}{n}\sum_{i=1}^{n}(x_i-\mu)^2\tag{1}\end{eqnarray*}
\begin{eqnarray*}\sigma=\sqrt{\sum_{i=1}^{n}\frac{(x_i-\mu)^2}{n}}\tag{2}\end{eqnarray*}
一方で,標本集団の分散および標準偏差は標本分散および標本標準偏差と呼び,それぞれ s2 および s で表される.これらの量は標本集団そのもののばらつきを知りたいときにのみ用いる.母分散および母標準偏差の不偏推定量ではない.n はデータ数,xは平均値.
\begin{eqnarray*}s^2=\sum_{i=1}^{n}\frac{(x_i-\overline{x})^2}{n}\tag{3}\end{eqnarray*}
\begin{eqnarray*}s=\sqrt{\sum_{i=1}^{n}\frac{(x_i-\overline{x})^2}{n}}\tag{4}\end{eqnarray*}
また,標本集団から母集団の分散 (母分散) および 標準偏差 (母標準偏差) を不偏推定する量は不偏分散および不偏標準偏差であり,u2 および u で表される.n はデータ数,xは平均値.
\begin{eqnarray*}u^2=\sum_{i=1}^{n}\frac{(x_i-\overline{x})^2}{n-1}\tag{5}\end{eqnarray*}
\begin{eqnarray*}u=\sqrt{\sum_{i=1}^{n}\frac{(x_i-\overline{x})^2}{n-1}}\tag{6}\end{eqnarray*}