連続型確率分布 - 趣味で学問

連続型確率分布

二項分布のところで離散型確率分布の言葉を出しました。確率変数の値が飛び飛びの場合に離散型で、連続している場合が連続型です。確率変数が連続しているというのはよく考えると不思議なことなんですが(取れるデータは有限)、実のところ私にはよくわからないので、ひとまずそんなものだとさせてください。具体例を挙げた方がわかりやすいですので、図1に連続型確率分布の一例を示します。

横軸が確率変数の値で縦軸が関数f(x)の値です。確率なので全ての場合を足せば1になるのですが、連続型確率分布の場合で全ての場合に当たるのはそのグラフと横軸で囲まれた面積です。図1では確率分布が変数Xのαからβの範囲に収まっているので、この範囲の面積が1になります。式で表現すると下のようになります。

\begin{align} \int_{\alpha}^{\beta} f(x) dx = 1 \end{align}

f(x)は確率密度関数と呼ばれ、f(x)≧0の条件があります。f(x)は確率値のように見えて確率値そのものではないです。じゃあf(x)はなんなんだという話ですが、これも私の手には負えないのでそんなものだとさせてください。連続型確率分布では全体の面積が1で、部分的な確率はやはり積分により面積を得ることで求めることができます。これは確率変数の値が連続しているので、確率はある値からある値までの範囲として考える必要があるためです。図2のa≦X≦bの確率は下の定積分で求めればよいです。

\begin{align} \int_{a}^{b} f(x) dx \end{align}

定積分すればよいと簡単に言いましたが、積分の計算は大変な場合が多いです。高校数学では知識として積分で求められることを知っておけば十分でしょう。

上で確率密度関数の範囲がαとβで区切られていると書きましたが、この範囲が無限に大きい場合なんかでも対象に含まれます。連続型確率分布で最も重要な正規分布がこれにあたります。正規分布については次回に説明します。

離散型確率分布では表を書いて、次の式で平均と分散を求めることができました。

\begin{align} E(X)=\sum_{i=1}^nx_ip_i\\ V(x)=\sum_{i=1}^n (x_i-\bar{x})^2 p_i=\sum_{i=1}^n (x_i)^2 p_i – \bar{x}^2\\ \end{align}

連続型確率分布の場合は次の式で平均と分散を計算することができます。

\begin{align} E(X)=\int_{\alpha}^{\beta} xf(x) dx\\ V(x)=\int_{\alpha}^{\beta} (x-\bar{x})^2f(x) dx = \int_{\alpha}^{\beta} x^2f(x) dx-\bar{x}^2\\ \end{align}

離散型と連続型の式を見比べると似た形になっています。実際のところ式の意味はほとんど同じです。定積分の意味から、連続型の場合は無限に分割した確率ヒストグラムで離散型の平均と分散の計算をした、と解釈することも可能です。こちらも高校数学においては知識としてなんとなく知っておけば問題ありません。
<< 二項分布 正規分布 >>

ホーム » 高校数学を理解する » 数2B » 連続型確率分布

むつきさっち

物理と数学が苦手な工学博士。 機械翻訳で博士を取ったので一応人工知能研究者。研究過程で蒐集した知識をまとめていきます。紹介するのはたぶんほとんど文系分野。 でも物理と数学も入門を書く予定。いつの日か。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA