理論関連事項

統計学の基本事項,確率分布の詳細,各種データ解析法の理論的背景について.

確率変数X が連続的な値をとる連続確率変数であるときに X がある範囲 [a, b] をとる確率を P とした場合,その確率を与える以下の関数 f(x) を確率密度関数という.確率密度関数は,累積分布関数を意味する CDF に対して PDF と略記されることがある.

\begin{eqnarray*}P(a\leq x \leq b)=\int_{a}^{b}f(x)dx\tag{1}\end{eqnarray*}

確率密度関数 f(x) は以下の性質を持つ.

\begin{eqnarray*}f(x)\geq 0\tag{2}\end{eqnarray*}
\begin{eqnarray*}\int_{-\infty}^{\infty}f(x)dx=1\tag{3}\end{eqnarray*}

一方で,確率変数X が離散的な値をとる離散確率変数であるときに X が x をとる確率を P とする場合,その確率を与える以下の関数 f(x) を確率質量関数という.単に,確率関数という場合もある.

\begin{eqnarray*}P(X=x)=f(x)\tag{4}\end{eqnarray*}

確率質量関数 f(x) は以下の性質を持つ.

\begin{eqnarray*}f(x)\geq 0\tag{5}\end{eqnarray*}
\begin{eqnarray*}\sum_{x}^{}f(x)=1\tag{6}\end{eqnarray*}

すなわち,連続確率変数の確率分布を規定する関数を確率密度関数,離散確率変数の確率分布を規定する関数を確率質量関数という.

Hatena Google+