理論関連事項

統計学の基本事項,確率分布の詳細,各種データ解析法の理論的背景について.

あるデータXに関する期待値 E(X) と分散 V(X) には以下で示される関係性がある.

\begin{eqnarray*}V(X)=E(X^2)-\{E(X)\}^2\tag{1}\end{eqnarray*}

この関係性は,μ をデータXの平均値,pi を事象 xi が起こる確率として以下のように証明することができる.まずは,V(X) の定義式を展開する.

\begin{eqnarray*}V(X)&=&\sum_{i=1}^{n}(x_i-\mu)^2p_i\\&=&\sum_{i=1}^{n}({x_i}^2-2x_i\mu+{\mu}^2)p_i\\&=&\sum_{i=1}^{n}x_i^2p_i-2\mu\sum_{i=1}^{n}x_ip_i+\mu^2\sum_{i=1}^{n}p_i\tag{2}\end{eqnarray*}

ここで,以下のふたつの関係を用いる.

\begin{eqnarray*}\sum_{i=1}^{n}x_ip_i=\mu\tag{3}\end{eqnarray*}
\begin{eqnarray*}\sum_{i=1}^{n}p_i=1\tag{4}\end{eqnarray*}

この関係を用いることで式2の V(X) はさらに以下のように変形される.

\begin{eqnarray*}V(X)=\sum_{i=1}^{n}x_i^2p_i-\mu^2\tag{5}\end{eqnarray*}

ここで,以下のふたつの関係を用いる.

\begin{eqnarray*}E(X^2)=\sum_{i=1}^{n}x_i^2p_i\tag{6}\end{eqnarray*}
\begin{eqnarray*}E(X)=\mu\tag{7}\end{eqnarray*}

この関係を用いることで最初の式が導かれる.分散の計算を定義式に従って実直に行うと煩雑な場合がある一方で期待値の計算は簡単な場合がある.このようなときにおいて,以下の式は分散を求めるために非常に便利.

\begin{eqnarray*}V(X)=E(X^2)-\{E(X)\}^2\tag{1}\end{eqnarray*}
Hatena Google+