母平均と母比率の推定 - 趣味で学問

母平均と母比率の推定

前回、標本数nの標本を取ると、標本平均の分布は母平均mと母分散σを使って正規分布N(m, σ2/n)に近似できることを紹介しました。正規分布に従うということは標準正規分布に変換できるということです。そして今度は、標準正規分布を使ってある範囲に入る確率を求めるのではなく、ある確率の範囲に入る変数の値を推定することができます。例えば標本平均の値から、95%の確率で母平均があるであろう値の範囲を推定する、といったことが可能です。

まずは標本平均Xバーの分布を標準正規分布に変換すると下の形になります。

\begin{align} Z=\frac{\bar{X}-m}{\frac{\sigma}{\sqrt{n}}}\cdots① \end{align}

正規分布を利用した確率の推定とは逆に、平均値を中心にして確率95%の範囲を考えます。95%の半分の確率0.475を与えるZの範囲は、正規分布表よりZ=1.96とわかります(図1)。図2のように-1.96≦Z≦1.96のとき、斜線部の面積は全体の95%となります。

次に、-1.96≦Z≦1.96に①式を代入して式変形すると下のようになります。

\begin{align} -1.96≦Z≦1.96\\ -1.96≦\frac{\bar{X}-m}{\frac{\sigma}{\sqrt{n}}}≦1.96\\ -1.96\frac{\sigma}{\sqrt{n}}≦\bar{X}-m≦1.96\frac{\sigma}{\sqrt{n}}\cdots②\\ m-1.96\frac{\sigma}{\sqrt{n}}≦\bar{X}≦m+1.96\frac{\sigma}{\sqrt{n}}\cdots③\\ ②より-\bar{X}-1.96\frac{\sigma}{\sqrt{n}}≦-m≦-\bar{X}+1.96\frac{\sigma}{\sqrt{n}}\\ \bar{X}-1.96\frac{\sigma}{\sqrt{n}}≦m≦\bar{X}+1.96\frac{\sigma}{\sqrt{n}}\cdots④\\ \end{align}

②の式から③と④の形に変形できます。上の式変形で得られた③の式は、標本平均が95%の確率で現れる範囲はこの範囲、ということを示していると解釈できます。ほとんど同じ形の式④は、母平均が95%の確率でそこに含まれているであろう範囲を示しています。というわけで実際に使用するのは④の式の方です。④の式を見返してみると、左辺は標本平均Xバーから、先ほど見つけた1.96の値をσ/√nにかけたものを引いてます。右辺はほぼ同じ形でXバーに足してます。この式より、標本平均Xバーと標本数nを使って母平均の範囲を推定することができます。

ちょっと注意しないといけないのが母標準偏差σで、母平均を推定するのに母標準偏差を使用してます。母平均がわからないのに母標準偏差がわかるの?というのは妥当な疑問で、経験則から母標準偏差はだいたいわかる場合があったりするので、そういうときにはこの式で推定できます。そうでないときは不偏分散を用いたt検定が必要だったりするのですが、こちらはもう高校数学の範囲外なので、ひとまずそのときのための方法が別にあることだけ覚えておいてください。

では一題、問題を解いてみましょう。問題は次のものです。

「ある池からある魚の成魚10匹を採取しました。その魚10匹のサイズを測ると9.0、12.5、9.5、8.5、14.0、11.0、8.0、10.0、12.5、10.0cmで、平均をとると10.5cmでした。信頼区間95%で少数第一位までで、母平均の区間推定をしてください。なおこの魚の成魚全体で、全長の標準偏差は2.5(cm)だとわかっています。」

\begin{align} 10.5-1.96\frac{2.5}{\sqrt{10}}≦m≦10.5+1.96\frac{2.5}{\sqrt{10}}\\ 10.5-1.5≦m≦10.5+1.5\\ 9.0≦m≦12.0 \end{align}

区間推定の結果は上のようになり、母平均は95%の確率で9cm以上12cm以下の間にある、という推定結果が得られました。

次に母比率の推定についてです。例えば1000個の製品を作ってそのうち不良品が5個なら、不良品率は5/1000で0.5%です。この抽出した標本での比率から、母集団での比率を推定しよう、というのが母比率の推定です。母比率の推定も考え方は同じで、標本比率をp0として、標本比率の標準偏差がp0(1-p0)/nとなるところだけが違うと考えてよいです。よって母比率pの推定は④の式とよく似た下の式になります。

\begin{align} p_0-1.96\sqrt{\frac{p_0(1-p_0)}{n}}≦p≦p_0+1.96\sqrt{\frac{p_0(1-p_0)}{n}}\\ \end{align}

こちらの問題は母平均の推定が理解できれば比較的容易に理解できると思うので、ここでは省略させてもらいます。

<< 標本の平均と分散 統計的仮説検定 >>

ホーム » 高校数学を理解する » 数2B » 母平均と母比率の推定

むつきさっち

物理と数学が苦手な工学博士。 機械翻訳で博士を取ったので一応人工知能研究者。研究過程で蒐集した知識をまとめていきます。紹介するのはたぶんほとんど文系分野。 でも物理と数学も入門を書く予定。いつの日か。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA