2012年6月19日火曜日

母数とはなにか

はじめに


「母数とは」で検索すると以下のような記事が出てきます。

母数の意味 - 数学 - 教えて!goo (現時点では google 検索で上から3番目)
分母と母数の違いを教えてください。 - livedoor ナレッジ (4 番目)

これらの「ベストアンサー」にはまちがいが書いてあります。

どうやら「『母数と分母はちがう!』という話はどこかで聞いたことがあるけど、けっきょく『母数ってなんなのか』がよくわからないので、やはり微妙に間違った知識だけが頭に残ってしまった」という人がけっこういるようです。

そうなってくると、単に 「母数」を「分母」の意味で使うのはやめろ と言っただけでは無責任なのかもしれません。

そこでちょっとぼくなりに「母数」を説明してみます。


とりあえず


  • 「母数」は「分母の数」や「全数」とは、まったく別ものと思ってください。
  • 母数はパラメーターparametor)の訳語です。「母数」というより「パラメーター」といった方がわかりやすいかもしれません。
  • 統計学の重要な目的の一つは、母数推定することです。
  • 統計学においては、母数推定されるものなのです。


母数を推定してみる


例えばコインを4回投げて、

裏、表、表、裏

というデータが得られたとします。
「表が出る確率」を p で表すことにします。さて、p はいくつでしょうか?
こう質問されたら多くの人が、「4回中2回が表になってるから、『表が出る確率』は半々、p =1/2 じゃない?」と推測すると思います。

しかし、同じコインをさらに4回投げて、

裏、表、表、裏、裏、裏、裏、裏

というデータが得られたとします。

このとき「表が出る確率」p はいくつでしょうか?
「このコインは裏が出やすいようだ。8回中2回しか表がないから、p2/8 = 1/4 だ」
と考える人もいるでしょうし、
「裏が続けてでたのは偶然だろう。いくらなんでも p1/4 ってことはないだろう
と考える人もいるでしょう。

では、正解は? 本当の p はいくつなのでしょうか?
それはわかりません。神のみぞ知る世界です。我々はデータから p を推測するしかないのです。
この「本当の p 」のことを母数というのです。

この例では母数は p だけでしたが、母数が何種類もある場合もあります。
例えば、コインの裏表でなく、ルーレットのデータだったら? あるいは複雑なアンケートのデータだったら? 母数が何種類もないと困りそうです。


統計学の世界観



統計学のわかりにくさは、データ(標本)から推定した p = 1/2 や p1/4 が、母数の p そのものではないというところにあるような気がします。
統計学では、例えばデータの平均をとっても、それが平均そのものであるとは考えません。データの平均は真の平均の推定値であると考えるのです。「真の平均」というのも場合によっては母数の一種だったりします。

統計学の世界観

プラトンは「我々が見ているこの現実は、洞窟に映る影のようのものだ。我々は真の実体(イデア)そのものではなく、イデアの影を見ているにすぎない」と考えました。

プラトンの世界観

この考え方は統計学に近いかもしれません。統計学では、影のような現実からデータを集めて真実に近づくための方法を探しているのです。

またオタク諸氏はフィギュアを眺めたり、プラモデルを組み立てたりしながら、二次元の美少女を夢想します。

オタクの世界観

この考え方も統計学に近いかもしれません。統計学では、プラモデルの代わりに「統計モデル」を組み立てたり眺めたりして、本質を理解しようとするのです。
先ほどの「表が出る確率は1/4」とかいうのも、「統計モデル」の一種です。


最後に


母数というのは、wikipedia にある通り「確率分布を特徴付ける数」のことです。なので「確率分布」のことを勉強すれば「母数」のことは自然と理解できます。逆に「確率分布」の勉強をしないで一足飛びに「母数」だけを理解しようとしてもあまり意味がありません、ながながと書いておいて最後にこんなことをいうのもアレですが。
先ほどの「表が出る確率は1/4」とかいうのも、「確率分布」の一種で「ベルヌーイ分布」という立派な名前がついています。


参考文献:
森 博嗣『数奇にして模型』(講談社ノベルス)
本田 透『喪男(モダン)の哲学史』(講談社)

4 件のコメント:

  1. >またオタク諸氏はフィギュアを眺めたり、プラモデルを組み立てたりしながら、二次元の美少女を夢想します。
    わかりやすすぎて鳥肌が立ちました。

    「母数」をネタにして「統計学の世界観」という本質を解説しているのが素晴らしいです。

    統計学にとても興味が湧きました。

    返信削除
    返信
    1. ありがとうございます(*^^*)

      削除
  2. >けっきょく『母数ってなんなのか』
    言葉の意味の違いについて探っていてこの状態に陥りこちらへ辿りつきました。

    あちこち徘徊しても何がどう違うのかさっぱりわからず「とにかく違うらしい」と理解することを放棄しかけていましたが、おかげ様で「なるほど違うらしい」ぐらいになれました。
    筆者さまが仰るように確率分布というものを理解できれば「なるほど違う」までいけるような気がして参りました。
    統計学そのものがちんぷんかんぷんな私にも、例や図解、とてもわかりやすかったです。ありがとうございました。

    返信削除
    返信
    1. コメントありがとうございます(^^)

      削除