2011年11月11日金曜日

リンク:GLM

「指数型分布族のナチュラルパラメータは一般化線形モデル(R の glm)の自然リンク関数である」
という話をメモっておこうかと思ったのですが,このページが分かりやすかったのでリンクを貼っておくことにしました(そしてこのページはおそらく下記の本を参照していると思われます).


これはたとえば,二項分布の確率関数が
\begin{align}
f(y;n,p) &= \left( \begin{array}{l}
n \\
y \\
\end{array}\right) p^n(1-p)^{n-y} \\
&= \exp( \log( \left( \begin{array}{l}
n \\
y \\
\end{array}\right) p^n(1-p)^{n-y} ))\\
&= \exp (y \log \frac{p}{1-p} + n \log(1-p) + \log\left( \begin{array}{l}
n \\
y \\
\end{array}\right) )
\end{align}
と表わせ,これの $y$ とかかっている部分( $\log \frac{p}{1-p}$ )がロジットになっているということが,二値の説明変数のモデリングにロジスティック回帰がよく使われることの,一つの理論的根拠になっているということのようです.なんか不思議な感じがする…….

0 件のコメント:

コメントを投稿