標本の平均と分散 - 趣味で学問

標本の平均と分散

正規分布の利用例の一つである母平均と母比率の推定の前に、母集団から取り出した標本に関する性質の説明をしておこうと思います。生物とか製品とかのある集団があって、そこから集団の性質を調べるためにいくつか取り出したとします。このとき元の集団を母集団、取り出したものを標本と呼びます。標本の平均値や分散には、ある重要な特徴があります。

まず前提として、復元抽出(一度ずつ取り出して元に戻す)の場合の性質なのですが、母集団の大きさが標本の数より十分大きいときは、非復元抽出の場合でも復元抽出に近似することができます。そうでないと統計推定にほぼ利用できなくなってしまいますしね。話を戻して、母集団から大きさn(n個取り出すこと)の標本を無作為抽出したとき、次のような性質があることがわかっています。

\begin{align} 母平均をm、母集団の標準偏差を\sigmaとする\\ \bar{X}=\frac{x_1 + x_2 + \cdots x_n}{n}\\ E(\bar{X})=m \cdots ①\\ \sigma(\bar{X})=\frac{\sigma}{\sqrt{n}} \cdots ② \end{align}

①と②の式でXバーの平均と標準偏差であることに注意してください。これは標本を取り出して平均と標準偏差を求めることを、何回も繰り返してその平均と標準偏差をとったときの性質です。標本平均の平均は母集団の平均と一致し、標準偏差は母集団よりも小さくなります。

とりあえず分散に関しては、そうなることが確認されていると思ってください。平均の方は、確かに母集団と標本で一致するように思えますが、取り出した標本の平均が母平均に完全に一致したりはしないであろうことは、経験からわかります。一致するのはあくまで標本平均の平均です。一回の調査で得られた標本平均は確率分布に従うのであって、一つの標本平均は母平均に近い値になる確率は高いのですが、場合によってはかなり異なる値となることもあり得ます。標本平均の平均が母集団の平均と一致することを示すには、「各標本を変数として考える」こととかかなり抽象的な思考が必要で、ここでは省略させてください。

さらに標本平均の確率分布にはある大きな特徴があります。母集団がどのような確率分布をしていたとしても、標本数nが十分大きければ標本平均の分布は正規分布N(m, σ2/n)に近似可能です。例えば母集団の分布が図1だとして、取り出した標本の平均の分布は図2のような正規分布になります。

これはなんだか不思議な事態なんですが、今はこのありがたい性質を利用させてもらいましょう。標本平均の分布が正規分布に従うということは、標準正規分布に変換して正規分布表を利用することができるということです。その利用方法である母平均の推定と母比率の推定は次のページで説明します。

<< 正規分布の利用 母平均と母比率の推定 >>

ホーム » 高校数学を理解する » 数2B » 標本の平均と分散

むつきさっち

物理と数学が苦手な工学博士。 機械翻訳で博士を取ったので一応人工知能研究者。研究過程で蒐集した知識をまとめていきます。紹介するのはたぶんほとんど文系分野。 でも物理と数学も入門を書く予定。いつの日か。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA