2012年6月28日木曜日

普通の日記:Chrome no longer supports Mac OS X 10.5

追記(8/18):その後、けっきょく Firefox にのりかえた。


chrome の「よくみるページ」が突然表示されなくなった。


そしてこんなメッセージが
詳しく見る を押すと


"Chrome no longer supports Mac OS X 10.5"


"Upgrading your Mac to 10.6 (Snow Leopard) or 10.7 (Lion)"

だそうです。 はい。けどおれはとりあえずこの黄色いメッセージが消えてくれればいい。

カチカチやっても消えない


どうすればこのメッセージなくなるの……。

解決策:New Tab Redirect! という拡張機能を入れて My new tab page を about:blank にする。


これですっきりしました。ぺんぺん草いっぽん生えない快適な画面。これで明日からまたらくらくインターネット生活だ!

2012年6月19日火曜日

母数とはなにか

はじめに


「母数とは」で検索すると以下のような記事が出てきます。

母数の意味 - 数学 - 教えて!goo (現時点では google 検索で上から3番目)
分母と母数の違いを教えてください。 - livedoor ナレッジ (4 番目)

これらの「ベストアンサー」にはまちがいが書いてあります。

どうやら「『母数と分母はちがう!』という話はどこかで聞いたことがあるけど、けっきょく『母数ってなんなのか』がよくわからないので、やはり微妙に間違った知識だけが頭に残ってしまった」という人がけっこういるようです。

そうなってくると、単に 「母数」を「分母」の意味で使うのはやめろ と言っただけでは無責任なのかもしれません。

そこでちょっとぼくなりに「母数」を説明してみます。


とりあえず


  • 「母数」は「分母の数」や「全数」とは、まったく別ものと思ってください。
  • 母数はパラメーターparametor)の訳語です。「母数」というより「パラメーター」といった方がわかりやすいかもしれません。
  • 統計学の重要な目的の一つは、母数推定することです。
  • 統計学においては、母数推定されるものなのです。


母数を推定してみる


例えばコインを4回投げて、

裏、表、表、裏

というデータが得られたとします。
「表が出る確率」を p で表すことにします。さて、p はいくつでしょうか?
こう質問されたら多くの人が、「4回中2回が表になってるから、『表が出る確率』は半々、p =1/2 じゃない?」と推測すると思います。

しかし、同じコインをさらに4回投げて、

裏、表、表、裏、裏、裏、裏、裏

というデータが得られたとします。

このとき「表が出る確率」p はいくつでしょうか?
「このコインは裏が出やすいようだ。8回中2回しか表がないから、p2/8 = 1/4 だ」
と考える人もいるでしょうし、
「裏が続けてでたのは偶然だろう。いくらなんでも p1/4 ってことはないだろう
と考える人もいるでしょう。

では、正解は? 本当の p はいくつなのでしょうか?
それはわかりません。神のみぞ知る世界です。我々はデータから p を推測するしかないのです。
この「本当の p 」のことを母数というのです。

この例では母数は p だけでしたが、母数が何種類もある場合もあります。
例えば、コインの裏表でなく、ルーレットのデータだったら? あるいは複雑なアンケートのデータだったら? 母数が何種類もないと困りそうです。


統計学の世界観



統計学のわかりにくさは、データ(標本)から推定した p = 1/2 や p1/4 が、母数の p そのものではないというところにあるような気がします。
統計学では、例えばデータの平均をとっても、それが平均そのものであるとは考えません。データの平均は真の平均の推定値であると考えるのです。「真の平均」というのも場合によっては母数の一種だったりします。

統計学の世界観

プラトンは「我々が見ているこの現実は、洞窟に映る影のようのものだ。我々は真の実体(イデア)そのものではなく、イデアの影を見ているにすぎない」と考えました。

プラトンの世界観

この考え方は統計学に近いかもしれません。統計学では、影のような現実からデータを集めて真実に近づくための方法を探しているのです。

またオタク諸氏はフィギュアを眺めたり、プラモデルを組み立てたりしながら、二次元の美少女を夢想します。

オタクの世界観

この考え方も統計学に近いかもしれません。統計学では、プラモデルの代わりに「統計モデル」を組み立てたり眺めたりして、本質を理解しようとするのです。
先ほどの「表が出る確率は1/4」とかいうのも、「統計モデル」の一種です。


最後に


母数というのは、wikipedia にある通り「確率分布を特徴付ける数」のことです。なので「確率分布」のことを勉強すれば「母数」のことは自然と理解できます。逆に「確率分布」の勉強をしないで一足飛びに「母数」だけを理解しようとしてもあまり意味がありません、ながながと書いておいて最後にこんなことをいうのもアレですが。
先ほどの「表が出る確率は1/4」とかいうのも、「確率分布」の一種で「ベルヌーイ分布」という立派な名前がついています。


参考文献:
森 博嗣『数奇にして模型』(講談社ノベルス)
本田 透『喪男(モダン)の哲学史』(講談社)

2012年6月17日日曜日

R: 不完全ガンマ関数の計算

pgamma(x, a) で \[ \frac{\gamma(x, a)}{\Gamma(a)}, \] gamma(a) で Γ(a) が求められるので,

  • 第1種不完全ガンマ関数(下側) \[ \gamma(x, a) = \int_0^x t^{a-1}\,e^{-t}\,dt \] は,pgamma(x, a) * gamma(a)

  • 第2種不完全ガンマ関数(上側) \[ \Gamma(x, a) = \int_x^{\infty} t^{a-1}\,e^{-t}\,dt \] は,pgamma(x, a, lower=FALSE) * gamma(a)
とやれば計算できる.

参考リンク;
ガンマ分布(Wikipedia)
不完全ガンマ関数(Wikipedia)
R: The Gamma Distribution
不完全ガンマ関数 - 高精度計算サイト
オーバーフロー、アンダーフロー - さかもとたつお

2012年6月5日火曜日

計算メモ: 生存関数と平均の関係

\begin{align} \mu = \int^{\infty}_{0}x f(x) \, dx \end{align} とし(もう少していねいに言うと,確率密度関数が $f(x)$, support が $[0,\infty)$, 平均が $\mu < \infty$ の分布を仮定している), かつ $\displaystyle \lim _{x \to \infty} f(x) = 0$ とする.
このとき, \begin{align} \int^{\infty}_{0} [1 - F(x) ]\, dx = \mu. \end{align}

なぜなら, 部分積分により, \begin{align} \mu &= \int^{\infty}_{0}x f(x) \, dx \\ &= \int^{\infty}_{0}x \{-[1 - F(x)] \}' \, dx \\ &= \biggl[ x \{-[1 - F(x)] \}\biggr]^{\infty}_{0} - \int^{\infty}_{0} \{-[1 - F(x)] \} \, dx \\ &= \int^{\infty}_{0} [1 - F(x) ]\, dx \end{align} だから.
ここで 3 行目の第一項が 0 になるのは, ロピタルの定理を用いて, \begin{align} & \lim _{x \to \infty} \left[ x \{-[1 - F(x)] \} \right] \\ &= \lim _{x \to \infty} \left[ - \frac{x}{\{1-F(x)\}^{-1}} \right] \\ &= \lim _{x \to \infty} \left[- \frac{1}{\{-f(x)\}^{-2}} \right] \\ &= \lim _{x \to \infty} \left[ -\{f(x)\}^{2} \right] \\ &= 0 \end{align} のように計算した.

この性質はときどき当たり前のように使われている.
たとえばこの本↓ の 235 ページに出てくる.