理論関連事項

統計学の基本事項,確率分布の詳細,各種データ解析法の理論的背景について.

成功または失敗という2種類の結果が生起する独立したベルヌーイ試行の繰り返しの結果として,初めての成功が得られたときまでの試行の繰り返し回数xの分布が従う確率分布を幾何分布というが,これに対して,負の二項分布 (negative binomial distribution) とは,k回目の成功が得られるまでの失敗回数xの分布が従う確率分布である.それゆえ,k=1 であるときの負の二項分布は幾何分布と等しく,すなわち,負の二項分布は幾何分布の一般形であるといえる.本分布はkが正の整数であるときはパスカル分布とよばれ,また,kが実数値であるときはポーヤ分布とよばれることがある.それぞれ,フランスの数学者 Blaise Pascal とハンガリーの数学者 George Pólya に由来する.パラメーター (母数) は成功数kおよび成功の生起確率pであり,負の二項分布は NB(k, p) にて略記される.確率質量関数は以下で与えられる.

\begin{eqnarray*}f(x)={}_{k+x-1}\mathrm{C}{}_{x}p^kq^x={}_{k+x-1}\mathrm{C}{}_{k-1}p^kq^x\tag{1}\end{eqnarray*}

確率変数Xの範囲は以下で与えられる範囲である.

\begin{eqnarray*}0\leq x<\infty\tag{2}\end{eqnarray*}

モーメント母関数は以下で与えられる.

\begin{eqnarray*}M_X(t)=\frac{p^k}{(1-qe^t)^k}\tag{3}\end{eqnarray*}

期待値は以下で与えられる値である

\begin{eqnarray*}E(X)=\frac{kq}{p}\tag{4}\end{eqnarray*}

分散は以下の式で与えられる.

\begin{eqnarray*}V(X)=\frac{kq}{p^2}\tag{5}\end{eqnarray*}

モーメント母関数,期待値および分散の導出

モーメント母関数は以下のように求める.まず,二項係数の計算を負の値に拡張した以下の計算をする.

\begin{eqnarray*}{}_{-k}\mathrm{C}{}_{x}&=&\frac{(-k)(-k-1)\cdots(-k-(x-1))}{x!}\\&=&(-1)^x\frac{k(k+1)\cdots(k+x-1)}{x!}\\&=&(-1)^x{}_{k+x-1}\mathrm{C}{}_{x}\tag{6}\end{eqnarray*}

ここで,最終行に確率質量関数中にあるものと同様の二項係数が出てくるが,これは二項係数を負の値まで拡張したときのまさに負の二項係数であり,これが分布の名前,負の二項分布の由来となった.モーメント母関数は以上の関係を利用して以下のように計算する.上の関係は下の式における3行目から4行目の変換時に用いる.

\begin{eqnarray*}M_X(t)&=&E(e^{tx})\\&=&\sum_{x=0}^{\infty}e^{tx}f(x)\\&=&\sum_{x=0}^{\infty}e^{tx}{}_{k+x-1}\mathrm{C}{}_{x}p^kq^x\\&=&\sum_{x=0}^{\infty}e^{tx}(-1)^x{}_{-k}\mathrm{C}{}_{x}p^kq^x\\&=&p^k\sum_{x=0}^{\infty}{}_{-k}\mathrm{C}{}_{x}(-qe^t)^x\\&=&p^k\sum_{x=0}^{\infty}{}_{-k}\mathrm{C}{}_{x}(-qe^t)^x(1)^{-k-x}\\&=&\frac{p^k}{(1-qe^t)^k}\tag{7}\end{eqnarray*}

上式において,6行目から最後の行への式変形には以下の二項定理を利用する.

\begin{eqnarray*}\sum_{k=0}^{n}{}_n\mathrm{C}{}_kx^ky^{n-k}=(x+y)^n\tag{8}\end{eqnarray*}

期待値および分散はモーメントを利用して求める.モーメント母関数の1階微分および2階微分は以下のようになる.

\begin{eqnarray*}M_X'(t)=kqp^ke^t(1-qe^t)^{-(k+1)}\tag{9}\end{eqnarray*}
\begin{eqnarray*}M_X''(t)=M_X'(t)+k(k+1)p^kq^2e^{2t}(1-qe^t)^{-(k+2)}\tag{10}\end{eqnarray*}

以上より,原点まわりの1次モーメントを用いて期待値は以下のように求まる.

\begin{eqnarray*}E(X)=M_X'(0)=\frac{kq}{p}\tag{11}\end{eqnarray*}

分散は原点まわりの1次モーメントおよび2次モーメントを用いて以下のように求める.

\begin{eqnarray*}V(X)&=&E(X^2)-[E(X)]^2\\&=&M_X''(0)-[M_X'(0)]^2\\&=&\frac{k^2q^2+k(k+1)q^2}{p^2}-\left(\frac{kq}{p}\right)^2\\&=&\frac{kq}{p^2}\tag{12}\end{eqnarray*}

負の二項分布の再生性

負の二項分布も二項分布正規分布同様に再生性を持つ.確率変数XとYが互いに独立で,それぞれパラメーターが (kX, p) および (kY, p) の負の二項分布に従っているとする.

\begin{eqnarray*}X\sim NB(k_X,\ p),\ Y\sim NB(k_Y,\ p)\tag{13}\end{eqnarray*}

このとき,確率変数XとYの和 X+Y は以下のようにパラメーター (kX+kY, p) の負の二項分布に従う.

\begin{eqnarray*}X+Y\sim NB(k_X+k_Y,\ p)\tag{14}\end{eqnarray*}
Hatena Google+