標本調査
中学数学の最後に、申し訳程度に標本調査という単元があります。ここでの「標本」は集団から抽出したデータのことだと思ってください。ある集団から一定数ランダムに抽出できれば、抽出された標本は元の集団(母集団)の性質を受け継いでいるはずだ、というのが基本的な考え方です(図1)。
標本調査を行うのは全部を調べられない場合です。中学生の体重と身長の関係とかなら、全員調べる必要があって学校ごとに行われているので、わざわざ標本調査を行う必要はありません。全部調べ上げて性質を取り出す方は全数調査といいます。それに対し工場で生産された製品などは、調査で故障してしまうかもしれませんし、実際のところ全部調査するなどとてもやってられません。そこで標本を取り出して、その標本の性質を商品全体の性質とみなします。標本の不良品率が1%なら、商品全体の不良品率も、誤差はあるだろうけど1%の近くだろうと考えられます。
標本調査を行うには条件があって、まずランダムに片寄りなく標本を取り出せることが必要です。また取り出す標本の数は多いほど誤差が少なくなるので、できることならたくさん取り出して調べた方がよいです。といっても標本の取り出しや調査には手間がかかることも多いので、標本の数は、現実的にできるだけ適度な値になるように、その都度設定されています。
具体例で考えてみます。工場の製品を検品するとします。製作された製品10000個の中から100取り出して不良品の数を数えたら2個であったとします。標本の不良品率は2/100(2%)です。母集団(元の一万個)の中の不良品率は約2%と考えられるので、製品全体の中の不良品の数は10000×(2/100)で約200個あると推測されます。
次にちょっと違う考え方なんですが、生物学で使われる標識再捕法を例にとります。実は高校入試で出たことがあります。標識再捕法の手順は次の通りです。
- ある生物種の一部を捕獲する。
- その個体に何かしらの標識をつけてもとの場所に放す。
- 一定期間おいて散らばるのを待つ。
- 再びその生物種の一部を捕獲する。
- そのなかに標識がつけられた個体が何匹いるか数えて推定を行う。
具体例は次の通りです。
- 川辺でカワニナを100匹つかまえたとします。
- 印をつけて放します。
- 次の日まで待ちます。
- 今度は80匹とれたとします。
- 標識がついているのは10匹です。次のように全体の個体数を推測します。
考え方は最初にとれた100匹の全体に対する割合は、次に捕獲したときの個体数に対する再捕獲した個体の割合と同じはずだ、というものです。再捕獲で標識つきは10匹なので、再捕獲した個体に対する割合は10:80です。この割合はおそらく、最初捕獲した100個体と全体の個体の割合と同じはずです。全体の数をxとおくと10:80=100:xになっているはずです。この式は10x=80×100に変換できてx=800です。つまりこの川辺には約800匹のカワニナがいると推測できます。
この方法にはランダムにとれるかという上の条件があります。捕るのがカワニナじゃなくてウグイのような群れをつくる魚だったりしたときは、偶然ほとんどがとれたり、逆にほとんどとれなかったりするので、この方法では推測できないでしょう。他にも標識再捕法が使えるための条件がありますが(カワニナに使えるか実はあやしい)、数学の範囲を超えるので省略します。こんなふうに標本調査には使えるための条件があるのですが、実際に利用されていて有効な方法です。数学の問題では使える前提で問題が出るので、上のような心配はしなくて大丈夫です。
<< 三平方の定理