正規分布 - 趣味で学問

正規分布

統計学で最も利用されているのは正規分布でしょう。正規分布は図1のような左右均等な山型の分布です。

山の頂点のところの横軸の値が平均値で、分散が大きいとなだらかな形の山、小さいと尖った形の山となります。自然界でデータをとって、各値(値の範囲)とその頻度の関係をグラフにしてみると、正規分布になることはよくあります。一般的によく見られることは重要で、これもよく利用される理由の一つですが、その他にも平均0、分散1の標準正規分布への変換が容易なことも重要な性質です。この性質により、ある範囲のグラフの面積を、正規分布表を使って簡単に求めることができます。

ここである確率分布が正規分布であることがわかったとします。確率分布において、その曲線と横軸に囲まれた面積全体で1の値になります。とすると、ある値からある値の範囲に入っている割合は、その面積を計算することで求めることができます(図2)。これは積分計算をすればよいのですが、正規分布の式は下の形で、この複雑な形で微積の計算はやりやすいという性質があったりするのですが、これを毎回計算するのは大変です。

\begin{align} f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{{x-m}^2}{2\sigma^2}} \end{align}

そこで標準正規分布において、各範囲における面積をあらかじめ細かく計算して表(正規分布表)にしておいて、正規分布の確率分布を標準正規分布に変換し、正規分布表を使うことで確率値を求める、ということをよく行います。

平均をm、標準偏差をσ(分散はσ2)とする正規分布をN(m,σ2)で表すのが一般的です。これを下の式で標準化すると、新たな変数Zが標準正規分布に従います。

\begin{align} Z=\frac{X-m}{\sigma} \end{align}

この式を少し変形するとZ=(1/σ)X-m/σ(Z=aX+bの形)になって、これは確率変数の変換の式の形をしています。

関連ページ:確率変数の変換

この変換式をどうやって見つけたか、専門外の私は知らないですが、ここは過去の偉大な発見を利用させてもらうとしましょう。正規分布の式は、平均と標準偏差、エクスポーネンシャルeを使って表現されたとても重要な式ですが、高校数学の範囲ではこれを覚えておく必要はないでしょう。覚える必要があるとすれば標準正規分布への変換式の方ですが、定期テストなどではあらかじめ与えてくれるかもしれないので、その都度、教員の指示に従っておいてください。

長くなったので、具体的な利用の仕方については次のページで示したいと思います。
<< 連続型確率分布 正規分布の利用 >>

むつきさっち

物理と数学が苦手な工学博士。 機械翻訳で博士を取ったので一応人工知能研究者。研究過程で蒐集した知識をまとめていきます。紹介するのはたぶんほとんど文系分野。 でも物理と数学も入門を書く予定。いつの日か。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA