理論関連事項

統計学の基本事項,確率分布の詳細,各種データ解析法の理論的背景について.

十分な試行回数または観測数に対して事象の生起確率が極めて小さい場合において,その事象が生起する回数を確率変数Xで表したとき,その確率変数Xが従う確率分布をポアソン分布 (Poisson distribution) という.遺伝子の突然変異数,交通事故件数,火災件数等,日常生活においても本分布の現象例は多数ある.歴史的な適用事例として最も有名なもののひとつに,プロシア陸軍において馬に蹴られて亡くなった兵士数へのあてはめ事例がある.本分布は,18世紀のフランスの数学者 Simeon Denis Poisson によって導かれた.パラメーター (母数) は確率変数Xの範囲内で発生する事象の期待発生回数を意味するλであり,ポアソン分布は Po(λ) にて略記される.確率質量関数は以下で与えられる.

\begin{eqnarray*}f(x)=\frac{e^{-\lambda}\lambda^x}{x!}\tag{1}\end{eqnarray*}

確率変数Xの範囲は,0および正の整数である.

\begin{eqnarray*}x=0,1,2,\cdots,\infty\tag{2}\end{eqnarray*}

モーメント母関数は以下で与えられる.

\begin{eqnarray*}M_X(t)=e^{\lambda(e^t-1)}\tag{3}\end{eqnarray*}

期待値は以下で与えられる値である.本分布のパラメーターλは事象の期待発生回数を意味する値であり,これが期待値と一致することは理解し易い.二項分布においても事象の期待発生回数 np が期待値と等しく,これと一致している.

\begin{eqnarray*}E(X)=\lambda\tag{4}\end{eqnarray*}

分散は以下の式で与えられる.ポアソン分布は二項分布の極限である.二項分布において分散は np(1-p) で与えられるが,ポアソン分布においてはpが限りなく0に近いので (1-p) は1に近似され,分散は np=λ で与えられると考えると理解し易い.

\begin{eqnarray*}V(X)=\lambda\tag{5}\end{eqnarray*}

モーメント母関数,期待値および分散の導出

モーメント母関数は以下のように求められる.

\begin{eqnarray*}M_X(t)&=&\sum_{x=0}^{\infty}e^{tx}\frac{e^{-\lambda}\lambda^x}{x!}\\&=&e^{-\lambda}\sum_{x=0}^{\infty}\frac{(\lambda e^t)^x}{x!}\\&=&e^{-\lambda}e^{\lambda e^{t}}\\&=&e^{\lambda(e^t-1)}\tag{6}\end{eqnarray*}

ここで上の等式の2行目から3行目の変換には以下で与えられる,ネイピア数を底にもつ指数関数のテイラー展開の式を利用する.

\begin{eqnarray*}e^x=\sum_{n=0}^{\infty}\frac{x^n}{n!}\tag{7}\end{eqnarray*}

期待値および分散はモーメントを利用して求める.モーメント母関数の1階微分および2階微分は以下のようになる.

\begin{eqnarray*}M_X'(t)=\lambda e^{\lambda(e^t-1)+t}\tag{8}\end{eqnarray*}
\begin{eqnarray*}M_X''(t)=\lambda e^{\lambda(e^t-1)}(\lambda e^t+1)\tag{9}\end{eqnarray*}

したがって,原点まわりの1次および2次モーメントは以下のようになる.

\begin{eqnarray*}M_X'(0)=\lambda\tag{10}\end{eqnarray*}
\begin{eqnarray*}M_X''(0)=\lambda^2+\lambda\tag{11}\end{eqnarray*}

以上より,原点まわりの1次モーメントを用いて期待値は以下のように求まる.

\begin{eqnarray*}E(X)=M_X'(0)=\lambda\tag{12}\end{eqnarray*}

分散は原点まわりの1次モーメントおよび2次モーメントを用いて以下のように求める.

\begin{eqnarray*}V(X)&=&E(X^2)-[E(X)]^2\\&=&M_X''(0)-[M_X'(0)]^2\\&=&\lambda^2+\lambda-\lambda^2\\&=&\lambda\tag{13}\end{eqnarray*}

ポアソン分布の再生性

ポアソン分布も二項分布や正規分布同様に再生性を持つ.確率変数XとYが互いに独立で,それぞれパラメーターがλXおよびλYのポアソン分布に従っているとする.

\begin{eqnarray*}X\sim Po(\lambda_X),\ Y\sim Po(\lambda_Y)\tag{14}\end{eqnarray*}

このとき,確率変数XとYの和 X+Y は以下のようにパラメーター λXY のポアソン分布に従う.

\begin{eqnarray*}X+Y\sim Po(\lambda_X+\lambda_Y)\tag{15}\end{eqnarray*}

ポアソン分布の二項分布からの導出

ポアソン分布は二項分布の極限のひとつであり,二項分布から導くことが出来る.二項分布における試行回数nが十分に大きく,かつ1回の試行における生起確率pが小さいときが二項分布からポアソン分布が導かれる条件であり,以下のように導かれる.まず,二項分布における試行回数nと生起確率pの積をλにて置換する.その結果,二項分布の確率質量関数は以下のように変形される.

\begin{eqnarray*}f(x)&=&{}_n\mathrm{C}_xp^x(1-p)^{n-x}\\&=&\frac{n(n-1)\cdots(n-x+1)}{x!}\left(\frac{\lambda}{n}\right)^x\left(1-\frac{\lambda}{n}\right)^{n-x}\\&=&\frac{\lambda^x}{x!}\left(1-\frac{1}{n}\right)\cdots\left(1-\frac{\lambda}{n}\right)^{-k}\left(1-\frac{\lambda}{n}\right)^n\tag{16}\end{eqnarray*}

ここで,試行回数nが十分に大きいときは上式の最後の行における括弧はすべて1に近似されるため,上式は以下のように変形される.

\begin{eqnarray*}f(x)={}_n\mathrm{C}_xp^x(1-p)^{n-x}\approx \frac{\lambda^x}{x!}\left(1-\frac{\lambda}{n}\right)^n\tag{17}\end{eqnarray*}

さらに,この式の括弧内は以下のように展開される.

\begin{eqnarray*}\frac{\lambda^x}{x!}\left(1-\frac{\lambda}{n}\right)^n&=&\frac{\lambda^x}{x!}\left(1-\frac{\lambda}{n}\right)\left(1-\frac{\lambda}{n}\right)\cdots\left(1-\frac{\lambda}{n}\right)\\&=&\frac{\lambda^x}{x!}\left(1-{}_n\mathrm{C}{}_1\cdot\frac{\lambda}{n}+{}_n\mathrm{C}{}_2\cdot\left(\frac{\lambda}{n}\right)^2-{}_n\mathrm{C}{}_3\cdot\left(\frac{\lambda}{n}\right)^3+\cdots\right)\\&=&\frac{\lambda^x}{x!}\left(1-\lambda+\frac{1}{2}\frac{n-1}{n}\lambda^2-\frac{1}{6}\frac{n-1}{n}\frac{n-2}{n}\lambda^3+\cdots\right)\tag{18}\end{eqnarray*}

ここで,括弧内のnを含む箇所はnが十分に大きいときは1に近似されるので,二項分布の確率質量関数は以下のように変形される.

\begin{eqnarray*}f(x)\approx \frac{\lambda^x}{x!}\left(1-\lambda+\frac{1}{2}\lambda^2-\frac{1}{6}\lambda^3+\cdots\right)\tag{19}\end{eqnarray*}

上式の括弧内はまさにeをテイラー展開したものである.すなわち,二項分布の確率質量関数は以下のように変形される.

\begin{eqnarray*}f(x)={}_n\mathrm{C}_xp^x(1-p)^{n-x}\approx \frac{e^{-\lambda} \lambda^x}{x!}\tag{20}\end{eqnarray*}

これは,まさにパラメーターλのポアソン分布を示している.以上の二項分布からポアソン分布への変形はポアソンの小数の法則とよばれる.

Hatena Google+