理論関連事項

統計学の基本事項,確率分布の詳細,各種データ解析法の理論的背景について.

確率変数Xの値に関わらず,確率密度関数が常に一定の値を与える確率分布を一様分布という.特に,確率変数Xが離散確率変数であるとき,その分布を離散一様分布 (discrete uniform distribution) という.正しいサイコロを投げたときの出る目の確率の分布に対応する.パラメーター (母数) は確率変数Xの取り得る最大の値Nである.離散一様分布は DU(N) で略記されることがある.確率質量関数は以下で与えられる.

\begin{eqnarray*}f(x)=\frac{1}{N}\tag{1}\end{eqnarray*}

ここで,Nは確率変数Xの取り得る最大値であり,Xの範囲は以下で与えられる.最小値および最大値は1およびN以外の任意の値にも設定できる.もしXの最小値をa,最大値をbとする場合は確率質量関数は f(x)=1/(b-a+1) となる.

\begin{eqnarray*}x=1,2,\cdots,N\tag{2}\end{eqnarray*}

モーメント母関数は以下で与えられる.

\begin{eqnarray*}M_X(t)=\frac{1}{N}\sum_{x=1}^{N}e^{tx}=\frac{e^t}{N}\frac{1-e^{Nt}}{1-e^t}\tag{3}\end{eqnarray*}

期待値は以下で与えられる値である.

\begin{eqnarray*}E(X)=\frac{N+1}{2}\tag{4}\end{eqnarray*}

分散は以下の式で与えられる.

\begin{eqnarray*}V(X)=\frac{N^2-1}{12}\tag{5}\end{eqnarray*}

モーメント母関数,期待値および分散の導出

モーメント母関数は以下のように求められる.

\begin{eqnarray*}M_X(t)&=&\sum_{x=1}^{N}e^{tx}\frac{1}{N}\\&=&\frac{1}{N}(e^t+e^{2t}+\cdots+e^{Nt})\\&=&\frac{e^t}{N}(1+e^{t}+\cdots+e^{(N-1)t})\\&=&\frac{e^t}{N}\frac{1-e^{Nt}}{1-e^t}\tag{6}\end{eqnarray*}

上の3番目の等式から4番目の等式への変換には以下の等比数列の和の公式を利用する.等比数列の和Snは初項をa,公比をr,項数をnとして以下で与えられる.ここで,上の3番目の等式においては初項は1,公比はet,項数はNとなる.

\begin{eqnarray*}S_n=\frac{a(1-r^n)}{1-r}\tag{7}\end{eqnarray*}

期待値は以下のように求める.

\begin{eqnarray*}E(X)&=&\sum_{x=1}^{N}xf(x)\\&=&\sum_{x=1}^{N}x\frac{1}{N}\\&=&\frac{1}{N}\sum_{x=1}^{N}x\\&=&\frac{1}{N}\frac{N(N+1)}{2}\\&=&\frac{N+1}{2}\tag{8}\end{eqnarray*}

分散は以下のように求める.分散と期待値の変換公式を利用する.

\begin{eqnarray*}V(X)&=&E(X^2)-[E(X)]^2\\&=&\sum_{x=1}^{N}x^2f(x)-\left(\frac{N+1}{2}\right)^2\\&=&\sum_{x=1}^{N}x^2\frac{1}{N}-\left(\frac{N+1}{2}\right)^2\\&=&\frac{1}{N}\sum_{x=1}^{N}x^2-\left(\frac{N+1}{2}\right)^2\\&=&\frac{1}{N}\frac{N(N+1)(2N+1)}{6}-\left(\frac{N+1}{2}\right)^2\\&=&\frac{(N+1)(2N+1)}{6}-\left(\frac{N+1}{2}\right)^2\\&=&\frac{2N^2+3N+1}{6}-\frac{N^2+2N+1}{4}\\&=&\frac{4N^2+6N+2-3N^2-6N-3}{12}\\&=&\frac{N^2-1}{12}\tag{9}\end{eqnarray*}
Hatena Google+