2011年8月12日金曜日

カリエラ型の婚姻規則とクラインの四元群(橋爪大三郎『はじめての構造主義』への部分的批判)

なんと! ここに書かれている話題については、ぼくよりちゃんとした人がちゃんとした記事をかいてくれました!
犬Q日記
しかもぼくの群の説明はまるっきりまちがっていたので訂正しました。知らないで勝手なこと書いてすみませんでした!
(9/25)

準備(置換)

置換というものがある.たとえば,

\[
\alpha=\left(
\begin{array}{cccc}
a & b & c & d \\
b & a & d & c
\end{array}
\right)
\]

と書いてあったら,αは a b c d を b a d c と並び替えるような操作ですよ,という意味になる.この操作αのことを置換という.
置換はあみだくじで表せる.αという置換をあみだくじで表すと図1のようになる.


あみだくじを通すと a b c d が b a d c に入れ替わる. また,

\[
\beta=\left(
\begin{array}{cccc}
a & b & c & d \\
c & d & a & b
\end{array}
\right)
\]

このように書いてあったらβは a b c d を c d a b と並び替える置換だ.あみだくじで表すと図2のようになる.


置換にはかけ算(かけ算は・で表す.×はあまり使わない)が定義できる.α・αはαの操作を2回繰り返すこと,α・βはαをしてからさらにβをすることだ.あみだくじでやってみる.


αを2回繰り返すと元の a b c d に戻った.このことをα・α=Iと書いたりする.Iは何もしないという置換だ(図4).

\[
I=\left(
\begin{array}{cccc}
a & b & c & d \\
a & b & c & d
\end{array}
\right)
\]


さて,α・β,ついでにβ・αは図5のようになる.



α・βもβ・αも結果は同じ d c b a になった.α・βをあらためてγと書くことにすると,


\[
 \gamma= \left(
\begin{array}{cccc}
a & b & c & d \\
d & c & b & a
\end{array}
\right)
\]
\[\alpha \cdot \beta =\gamma=\beta \cdot \alpha\]

である.
勘のいい人は気づいているかもしれない.βもγも2回繰り返すともとのa b c d に戻る.


α,β,γの関係をまとめると図8のようになる.


または,こんな表でまとめることもできる.

・ I α β γ 
II α β γ 
αα I γ β 
ββ γ I α 
γγ β α I 

(γ・βとかγ・αはあみだくじで確かめてはいないけれども,γ・β=(α・β)・β=α・(β・β)=α・I =αという具合に計算してやればこの表が完成する.)
この表みたいな構造を持ったものを『クラインの四元群』という(らしい).


本題


さて(やっと),本題に入る.
オーストラリア大陸の北部砂漠にもともと住んでいた人たちには,結婚に関して複雑な規則があった.
その内の一つ『カリエラ型』というのはこんなふうだ.
「この社会の人びとは、運動会かなにかのときみたいに、全員が四つの、だいたい人数の等しいグループ(婚姻クラス)に分かれている。(中略)父親がA1で母親がB2なら、あなたはB1。(中略)そしてあなたは、A2の異性としか、結婚できない。」(橋爪大三郎『はじめての構造主義』(講談社現代新書) p.81より)
図で書くと以下のようになる.何回か図をなぞってみると意味がわかります.



例)父親がA2で母親がB1なら? あなたはB2.結婚できるのは,A1の異性だけ.
例2)父親がB2で母親がA1なら? あなたはA2.結婚できるのは,B1の異性だけ.

図9は図8と同じ形をしている.同じ構造を持っていると言ってもいい.『カリエラ型』の婚姻規則は『クラインの四元群』と同型である,という言いかたもできるだろう.
しかし,
要するに、オーストラリアの原住民の結婚のルールは、抽象代数学の、群の構造とまったく同じものなのだ!

これは、なかなかのことではないだろうか。
ヨーロッパ世界が、えっちらおっちら数学をやって、「クラインの四元群」にたどりつくまでに、短くみても二千年はかかった。つい最近まで、だれもそんなもの、知らなかったのである。(中略)先端的な現代数学の成果とみえたものが、なんのことはない、「未開」と見下していた人びとの思考に、先回りされていたのだ。
(同 p.181より)
と言われると,うーん,そうかなー?
自分で長々と説明しておいて言うのもなんだけど,この婚姻規則を理解するのに,『クラインの四元群』や置換の話を理解する必要はまったくない.図9だけをいきなり見れば十分だ.
そして「代数学の群」というのは群の公理を満たすものを言う.
先の「置換」と「置換のかけ算」の世界はこれらが全部成り立っていた(単位元はI,αの逆元はαそのもの)から,群だけれども,ほかにも群はたくさんある.「分数」と「分数のかけ算」の世界も群だ.
「ヨーロッパ世界の数学」の成果は,「群という考え方によって,置換などの操作も,数字を扱うのと同じように数学で扱えるようにしたこと」だと思う.『クラインの四元群』は群のなかでも基本的なものだからわざわざ名前が付けられているだけで,ものを入れ替えたり対応させたり……っていうこと自体はヨーロッパでもどこでも昔からやっていた.日本でもあみだくじは昔からあった.数学の成果は置換そのもののことではない.

橋爪先生はぜんぜん水準のちがうものどうしを比較していると思う.
「二足歩行ロボットを作れるようになったのは最近だ.しかし,オーストラリア人は昔から二足歩行している.先端的な科学の成果が,「未開」と見下していた人びとに,先回りされていた.」
と言っているのに近いと思う.

この規則を発見した人はすごいと思うし,この規則が『クラインの四元群』だという指摘もおもしろいとは思う.しかし,この規則を説明するのに『クラインの四元群』を持ち出す必要があるかというと……ない.
もっと言うと,なんでわざわざ『クラインの四元群』なんて難しい言葉を使う必要があるんだ! 『知の欺瞞』じゃないか!


しかし,一方で,

ぼくは「群」とかそういう言葉を使いたくなる気持ちも分かる気がする.
神話とか婚姻規則とかを,なんというか,そのー,博物学的に羅列するだけじゃなくて,もっとこう,神話とか婚姻規則とかの構成要素の空間みたいなものを定義して,規則や神話の実際の表れ方と,その変化の仕方みたいなものを整理していったら,人間の思考パターンの本質みたいなものが,群だか環だか体だか分からないけど,そういう集合として表現できそうな気がするじゃないか! それができたらすごくおもしろいじゃないか!
たぶん,「構造主義」が目指していたのはそういうことだったんじゃないだろうか.
けれども……(参考リンク

参考文献:橋爪大三郎『はじめての構造主義』(講談社現代新書)
合わせておすすめ:内田樹『寝ながら学べる構造主義』(文春新書)

2011年8月4日木曜日

発表資料などのフォント

  • プログラムのコードなど:“Courier New”(等幅なのでインデントがずれない)
  • 数式中のアルファベット:“Times New Roman” の斜字
  • ギリシャ文字:“Symbol”

を使うとよい.

あまり関連はないがおもしろかったので
参考リンク:日本語 LaTeX を使うときに注意するべきこと(黒木玄さん)
(初学者がいきなりこれを見てしまったら「うわ、TeXってめんどくせー」って思いそうだ……)

2011年8月2日火曜日

R による生存時間分析(指数分布を仮定したパラメトリックモデル)

(あきらかに間違ったこと書いてたので訂正;8月2日)

参考リンク
[連載]フリーソフトによるデータ解析・マイニング第37回 Rと生存時間分析(2)
たとえば R で以下のようにするとき
> library(survival);library(MASS)
> ge.pasf <- survreg(Surv(time, cens)~treat,data=gehan,dist="exponential")
> ge.pasf
Call:
survreg(formula = Surv(time, cens) ~ treat, data = gehan, dist = "exponential")

Coefficients:
 (Intercept) treatcontrol 
    3.686098    -1.526614 

Scale fixed at 1 

Loglik(model)= -108.5   Loglik(intercept only)= -116.8
 Chisq= 16.49 on 1 degrees of freedom, p= 4.9e-05 
n= 42 
Coefficients がなにを意味しているのか,最初よく分からなかったが,生存曲線が \[S(t)= e^{-\lambda t} \] ただし \[ \lambda = 1/(\exp(3.686098 + (-1.526614)x)) \] ここで x は treat が control のとき1,その他は0をとる変数,
であるという意味のようだ.
(つまり,
“6-MP”のとき,$1/\exp(3.686098)=0.02506963$
“control”のとき,$1/\exp(3.686098 + (-1.526614))=0.1153846$)

ノンパラメトリックモデルと重ねてグラフを書いてみる.
(グラフのコマンド)
library(survival);library(MASS)
ge.pasf <- survreg(Surv(time, cens)~treat,data=gehan,dist="exponential")
plot(survfit(Surv(time,cens)~treat, data=gehan),lty=1:2)
curve(1-pexp(x,1/exp(coef(ge.pasf)[1])),lty=1,add=TRUE) 
curve(1-pexp( x,1/exp(sum(coef(ge.pasf))) ),lty=2,add=TRUE)
確かめるために,自分でパラメータλを推定してみる.
ある一つの生存時間の観測値が得られる確率(尤度)は \[(f(t)dt)^{d_i} (1-F(t))^{1-d_i}\] $t$は生存時間(本当は$t_i$だがしばらく$i$を省略), $d_i$は打ち切りのとき 0,打ち切りでないとき 1.
データの件数を$n$とすると,尤度関数は \[L=\prod^{n}_{i=1}(f(t)dt)^{d_i} (1-F(t))^{1-d_i}\] \[\log L = \sum^{n}_{i=1}(d_i \log(f(t)dt) + (1-d_i)\log(1-F(t)) \] いま,指数分布を仮定しているので \[F(t) = 1-e^{-\lambda t} \] \[f(t) =\lambda e^{-\lambda t} \] を代入して, \[ \frac{\partial}{\partial \lambda }\log L =0 \] を解くと \[ \hat \lambda= \left(\sum^{n}_{i=1} d_i \right)/ \left(\sum^{n}_{i=1} t_i\right)\] これをR のコードで書くと
>  sum(gehan[gehan$treat=="6-MP",3])/sum(gehan[gehan$treat=="6-MP",2]) 
[1] 0.02506964
> sum(gehan[gehan$treat=="control",3])/sum(gehan[gehan$treat=="control",2]) 
[1] 0.1153846
上と一致していることがわかる.
(補1) R の関数が \[ \lambda = 1/\exp(\mathbf{\beta x}) \] と指数をとっているのは,制約$\beta > 0$をなくして数値計算をしやすくするためと思われます.
(補2) グラフのコマンドはこれでも良い
lower.tail=FALSE
とすると上側確率を求めてくれる.
ge.pasf <- survreg(Surv(time, cens)~treat,data=gehan,dist="exponential")
plot(survfit(Surv(time,cens)~treat, data=gehan),lty=1:2)
curve(pexp(x, 1/exp(coef(ge.pasf)[1]),lower.tail=FALSE),from=0, to=max(gehan$time),lty=1,add=TRUE) 
curve(pexp(x, 1/exp(sum(coef(ge.pasf))),lower.tail=FALSE),from=0, to=max(gehan$time),lty=2,add=TRUE)