理論関連事項

統計学の基本事項,確率分布の詳細,各種データ解析法の理論的背景について.

あるデータXに関する期待値E(X) および分散V(X) には以下で示される関係性がある.以下において,変数X および Y に対して c は定数である.

期待値は離散型および連続型の変数X に対し,f(x) を確率密度関数としてそれぞれ以下で与えられる値である.

\begin{eqnarray*}E(X)=\sum_{x}xf(x)\tag{1}\end{eqnarray*}
\begin{eqnarray*}E(X)=\int_{-\infty}^{\infty}xf(x)\,dx\tag{2}\end{eqnarray*}

以上で与えられる期待値"E(X)"について,以下の変換公式が成り立つ.

\begin{eqnarray*}E(c)=c\tag{3}\end{eqnarray*}
\begin{eqnarray*}E(X+c)=E(X)+c\tag{4}\end{eqnarray*}
\begin{eqnarray*}E(cX)=cE(X)\tag{5}\end{eqnarray*}
\begin{eqnarray*}E(X+Y)=E(X)+E(Y)\tag{6}\end{eqnarray*}

以上に加えて,変数XおよびYが互いに独立である場合のみ,以下の公式が成り立つ.ここで,E(XY)-E(X)E(Y) は変数X および Y の共分散そのものであり,以下の式が成り立つということは変数X および Y の共分散が0であることを意味する.

\begin{eqnarray*}E(XY)=E(X)E(Y)\tag{7}\end{eqnarray*}

次に,分散は V(X) で表され,離散型および連続型の変数X に対してそれぞれ以下で与えられる値である.μ は変数Xの平均値,すなわち期待値である.

\begin{eqnarray*}V(X)=\sum_{x}(x-\mu)^2f(x)\tag{8}\end{eqnarray*}
\begin{eqnarray*}V(X)=\int_{-\infty}^{\infty}(x-\mu)^2f(x)\,dx\tag{9}\end{eqnarray*}

以上で与えられる期待値 V(X) について,以下の変換公式が成り立つ.

\begin{eqnarray*}V(c)=0\tag{10}\end{eqnarray*}
\begin{eqnarray*}V(X+c)=V(X)\tag{11}\end{eqnarray*}
\begin{eqnarray*}V(cX)=c^2V(X)\tag{12}\end{eqnarray*}

以上に加えて,変数XおよびYが互いに独立である場合のみ,以下の公式が成り立つ.ここで,V(X±Y) は本来は Cov(X, Y) を変数X および Y の共分散としたときに,V(X±Y)=V(X)+V(Y)±2Cov(X, Y) で与えられるが,上の E(XY)=E(X)E(Y) で示されるように変数XおよびYが独立である場合はそれらの共分散が0になるために以下の式が成り立つことになる.

\begin{eqnarray*}V(X\pm Y)=V(X)+V(Y)\tag{13}\end{eqnarray*}
Hatena Google+