統計検定に関する事柄を忘れないようにまとめます.

あるデータXに関する期待値 E(X) と分散 V(X) には以下で示される関係性がある.

\begin{eqnarray*}V(X)=E(X^2)-\{E(X)\}^2\tag{1}\end{eqnarray*}

この関係性は,μ をデータXの平均値,pi を事象 xi が起こる確率として以下のように証明することができる.まずは,V(X) の定義式を展開する.

\begin{eqnarray*}V(X)&=&\sum_{i=1}^{n}(x_i-\mu)^2p_i\\&=&\sum_{i=1}^{n}({x_i}^2-2x_i\mu+{\mu}^2)p_i\\&=&\sum_{i=1}^{n}x_i^2p_i-2\mu\sum_{i=1}^{n}x_ip_i+\mu^2\sum_{i=1}^{n}p_i\tag{2}\end{eqnarray*}

ここで,以下のふたつの関係を用いる.

\begin{eqnarray*}\sum_{i=1}^{n}x_ip_i=\mu\tag{3}\end{eqnarray*}
\begin{eqnarray*}\sum_{i=1}^{n}p_i=1\tag{4}\end{eqnarray*}

この関係を用いることで式2の V(X) はさらに以下のように変形される.

\begin{eqnarray*}V(X)=\sum_{i=1}^{n}x_i^2p_i-\mu^2\tag{5}\end{eqnarray*}

ここで,以下のふたつの関係を用いる.

\begin{eqnarray*}E(X^2)=\sum_{i=1}^{n}x_i^2p_i\tag{6}\end{eqnarray*}
\begin{eqnarray*}E(X)=\mu\tag{7}\end{eqnarray*}

この関係を用いることで最初の式が導かれる.分散の計算を定義式に従って実直に行うと煩雑な場合がある一方で期待値の計算は簡単な場合がある.このようなときにおいて,以下の式は分散を求めるために非常に便利.

\begin{eqnarray*}V(X)=E(X^2)-\{E(X)\}^2\tag{1}\end{eqnarray*}
Hatena Google+