ブログ

2016年7月の記事一覧

今年の数学月間懇話会の様子

━━━━━━━━━━━━━━━━━━━━
数学月間SGK通信 [2016.07.26] No.125
<<数学と社会の架け橋=数学月間>>
━━━━━━━━━━━━━━━━━━━━
皆様のところは梅雨が明けましたでしょうか.お変わりありませんか.
私は,この日曜日(都知事選投票日)に米子で,サイエンスワールドに参加するために
万華鏡の材料の準備であたふたしています.
7月22日の数学月間懇話会は,無事実施できました.ご参加の皆さま有難うございます.

1.数学者って,どんな顔をしている?
  亀井哲治郎・河野裕昭(亀書房・写真家)
2.世論調査は正しいか
  松原望(東京大学名誉教授,聖学院大学)
3.がん登録の可能性
  田渕 健(都立駒込病院・東京都がん登録室)
■今年の数学月間懇話会は,数式の出てこない一風変わった講演会になりました.
数学月間は数学同好者のためでもないし数学の講習会でもありません.
数学と社会の架け橋を目指しているのですから,今回の数学月間のテーマは,
数学月間の原点の姿であると言えるでしょう.今年の数学月間懇話会参加賞は35人を数えました.
以下,講演の要点をまとめました.それぞれの講演は1時間弱ありますから,
講演の要旨を数行にまとめるのは私の偏見によります(分責.谷).
(1)
お二人が掛け合いで写真の説明をされ,撮影時の様子やエピソードをお聞きしました.
まず,色々な講義風景がありました.200人入る教室に4人の学生の贅沢な風景や,
無意識のオーケストラの指揮者よろしいポーズなどがりました.写真に切り取ってみると案外面白いものです.
一方では,数学者の教室外の生活感のあふれる写真-耕運機を運転している姿など-もありました.
(2)
議席事前予想(いわゆる世論調査)と開票実況中継(いわゆる「当確」打ち)の話がありました.
世論調査では,ランダムサンプリングによるサンプル集合が必要ですが,これが難しい.
性質(人口規模,地方性,産業構成)などが似ている範囲を1つの層として,全国を180層別し,
これをもとに3600人をサンプリングする方法が実施された(1963年の例).ビッグデータによる解析も最近行われ,
当たったことも記憶に新しい.データ保護,調査の倫理,政治への従属,操作誘導が心配な問題点である.
開票は田舎から開いて都市部が遅い.開票の結果が出るの待てば良いのだが,各社一刻も早く当確を打ちたがる.
自分の投票が開票されていないのに,当確が決まるとは私は許せない気がする.
過去には,当確が取り消しになった事例もあるそうだ.少なくとも開票50%,あるいは,60%当たりで,
当確を打てば大体間違いはない.実際に当確判定に携わった1983年総選挙の新潟3区の田中角栄に得票率推移が例に出た.
(3)
駒込ピペットは,感染症の避病院であったこの病院(140年前)の発明である.
ガンの今年の患者が102万人を超えたという.2014年から,多いガンのランキングや死亡率ばどが語られ,
ガン検診も叫ばれているが.ガン検診をすることがどれほど有効かはわからない.ガン罹患率の統計はまだない.
統計解析は,良いソフトツールがあり実施に問題はないが,ガン登録を行うところがドロドロしていてとても難しい.
これは数学者の仕事なのだが,数学者が参入していないのが問題である.
ガン登録の届け出がされていない.複数病院からダブっている.一人で多重ガン.などがあり,同一性の判定が必要だ.
死亡状況から届け出がなかったのを判定する.例えば,病院は電子カルテになって,医者は患者の顔を見なくなった上に.
情報が構造化されていないので,あまり役に立たない.
発生場所と下水処理の相関を見つけた疫学調査がロンドンのコレラを鎮圧したそうである.
ガン登録推進法今年スタートした(人口統計は,明治に確立しているのだが).
ガンの定義.病気を分類しガンの定義を満たすリストを作る.
届にもいろいろな言葉が使われる.色々な病名がある.肺炎には肺ガンが含まれているかもしれない.
心不全というのは死因ではない.第1次原因,第2次原因,第5次まで記入するそうだ.
いずれにしろ,生のデータは意味がダブったり混沌としている.同値関係を定義したり,
同値分類したりしてデータの構造化が必要であり数学者の仕事である.

0

地震の発生確率

━━━━━━━━━━━━━━━━━━━━
数学月間SGK通信 [2016.07.19] No.124
<<数学と社会の架け橋=数学月間>>
━━━━━━━━━━━━━━━━━━━━
■「30年以内に震度6弱以上の地震が起こる確率は,横浜市が78%で最も高く,九州では大分市が54%」などと言われていました.
あくまでも確率ですから,いつ地震が起きるかはわかりません.熊本の方が先に大地震が起きてしまいましたね.
このような確率はどのようにして出たものでしょうか?
震度(揺れ方)6弱といっても,震源が浅い場合もありますから,
震度が大きいものが必ずしも巨大地震(マグニチュードMが大きい)とは限りません.

■地上の被害は震度(揺れの程度)に比例します.
地下の岩盤には色々な原因で歪が蓄積していき,岩盤の耐えられる歪の限界を超えると,
岩盤がポッキリ折れて地震が発生するというイメージです.
岩盤が強靭なほど溜め込める歪エネルギーの限界は大きく,限界まで溜め込んだ岩盤が地震で放出するエネルギーは大きい
(地震のエネルギーの対数がマグニチュードM).
地震は破壊現象なので,限度まで歪を蓄えた岩盤がいつどこで破壊するかを予知することは不可能だが,
破壊が始まってからの前駆現象を少しでも早く観測することは可能です.

■日本の地震の発生メカニズムを調べると,大雑把に言って2つのタイプがあります.
1.海溝型(海洋プレート沈み込み境界)
Mは大きい巨大地震で,頻度分布は数十年~100年.
2.内陸型(陸側プレート内)
震源は地下5~20kmと浅い.Mは小さいが震源が浅いので,直上の被害は大きい.頻度分布は数百年ー数十万年.
日本で起きた最近の大地震は,内陸型です.
海溝型の地震は,1923年の関東地震以降起きていません.心配されている東海地震や南海トラフ地震は海溝型です.

■地層に残る地震の記録や,古文書の記録を調べると,日本の各地で,数多くの地震が繰り返し起こっていることがわかります.
この地震発生の繰り返し周期はどうなのか,地震発生の予測のために,経過年に対する地震頻度の分布を作ります.
過去の地震記録はどのような分布と合うでしょうか.地震は破壊現象なので発生確率はランダム(その時はポアソン分布)
が予想されます.沈み込むプレートに引き込まれた陸地が時折り弾性反発するモデルは,Brown酔歩時間の分布(BPT)が予想されます.

全国を250kmのメッシュに切り,その地に影響を与える活断層起因の地震やプレート境界起因の地震で,
地表の震度が6弱以上となる地震について発生確率を算出します.
メッシュに切った各地の30年以内の震度6弱以上の地震発生確率を着色した地図が以下のサイトにあります:
http://www.j-shis.bosai.go.jp/map/

■ここで用いられる地震の発生確率の定義では,分布密度関数を積分した全面積が確率1とします.
現時点は分布密度関数内のどこかですが,現時点から分布密度関数の0となる将来時点までの積分値に対する,
現時点から30年先の時点までの積分値の比の値が30年以内にその地震が発生する確率となります.
現時点がどこか(過去の最新活動時期が不明)わからない場合には,地震の発生が「ポアソン過程」に従うとします.

地震は繰り返し発生しますが,正確な周期があるわけではありません.
今日地震が起こらなければ,明日地震が起こる確率は、今日より高くなる
今日より明日,明日より明後日と大地震がやってくる確率はどんどん高まって行きます.

(注)地震のマグニチュードMとその発生確率は,べき乗測が成り立つことが知られています.
被害の大きい巨大地震(Mの大きいもの)も,発生数は少ないですが必ず起こり,その時の被害は甚大です.
上で,議論して来たのは,時間(年)の経過に対するある大きさ(震度8弱)をもたらす地震の発生確率に関するもので,
べき乗測と混乱しないでください.

■さて,地図にある日本の活断層の話に移りましょう.
赤い線は活断層です.関東地方では,高崎-熊谷-深谷の西側を流れる荒川に沿いに走り,荒川は江戸区で東京湾に注ぐ.
断層地帯の荒川上流は長瀞など風光明美な処です.富士山側の活断層は,諏訪-甲府-富士山の西側を富士川沿いに走り,
駿河湾に至ります.活断層は繰り返し地震を起こしており注意が必要です.

ーーーーーーーーーー
7月22日から数学月間が始まります.暑い日が予想されますが皆さまお変わりなくお過ごしでしょうか
お近くの数学イベントにご参加ください.
◆数学月間懇話会(第12回)
日時:7月22日,14:00~17;00(開場13:30)
場所:東大駒場キャンバス,数理科学研究科・002号教室
1.数学者って,どんな顔をしてる?
  亀井哲治郎・河野裕昭(亀書房・写真家)
2.世論調査は正しいか
  松原望(東京大学名誉教授,聖学院大学)
3.がん登録の可能性
  田渕 健(都立駒込病院・東京都がん登録室)
参加費無料.直接会場にお出で下さい.
例年,暑い最中です,教室には冷房がありますが,
近くに水飲み場や販売機はありません.水筒を持参されることをお勧めします.
17:30より構内カフェテリア(イタリアントマト)にて懇親会(めいめい払い)
問い合わせ先:sgktani@gmail.com(日本数学協会,数学月間の会)
◆三鷹ネットワーク大学 国際基督教大学寄付講座
題目:数学の夕べ 「関係性の数学 - カテゴリー(圏)論入門」
日時:7月22日(金)19:00?20:30  
https://www.kouza.mitaka-univ.org/kouza/B1651000
場所:三鷹ネットワーク大学    (東京都三鷹市下連雀3-24-3 三鷹駅前協同ビル3階)
◆ICUオープンキャンパスでのモデル授業
題目:シンメトリー ? 多項式で楽しむ
講師:清水勇二
日時:8月13日(土) 12:05?12:50 および 15:05?15:50
  (同じ講義を2回します。)
場所:国際基督教大学 理学館2F 220 教室
(東京都三鷹市大沢 3-10-2)
◆とっとりサイエンスワールド
7/31(米子),8/21(鳥取),9/11(倉吉)

0

参院選に思う

━━━━━━━━━━━━━━━━━━━━
数学月間SGK通信 [2016.07.12] No.123
<<数学と社会の架け橋=数学月間>>
━━━━━━━━━━━━━━━━━━━━
昨日参院選が終わりました.改憲勢力が2/3になりました.
RDDによる世論調査やビッグデータによる選挙予測通りの状況になってしまいました.
RDDによる今回の世論調査では,母集団の性質を代表する正しいサンプル集合であったことになります.
特に,ビッグデータによる予測では,今回さらに実証データが増えましたから,
モデルの精度はますます向上することが期待できます.

デッドヒート状態にある選挙区では,結果予測のアナウンス効果で,正あるいは負のフィードバックが
最後の一揺れを起こす場合があるのですが,今回は予測をひっくり返すほどのものではなかったようです.
そもそも投票率が低い54.4%(世論調査ではこれより高い予測).
「改憲勢力が2/3になるのが良くない」が世論調査では47%でしたが,
結果は,改憲勢力が追加公認も入れ77人で64%でした.世論調査では「まだ決めていない」が35%もあったので,
これが棄権につながったように思います.比例区の支持政党なしの党に1.2%の得票がありなんたることだ.

選挙予測は当てなければならないが,別の見方をすると,結果が予測できるような安定な選挙ではだめだ.
この安定さは,NHKを始めとする大手TV・メディアが選挙の様子を報じないために作られたものだ.
私はインタネットの中継で,各政党候補の街宣演説を聞いているが,特に自民党候補の質は低い.
名前だけを連呼する内容のないものが多い.安倍総理の演説も低俗なものであった.
TVの報道だけではこの差はわからない.各党の街宣演説に出会うこともなかった人には,
今回の選挙は行く気にもなれない盛り上がらないと感じただろう.争点を隠し投票日を迎え,
無風状態で予測通りの安定な結果となったわけだが,これを予測が正しいと喜ぶわけにはいかない.
メディアは予測よりも現場と政策内容に切り込んでもらいたいし,市民はアナウンス効果に鋭敏に反応するようでありたい.
社会は複雑系なのだから,バタフライ効果はいつ起こっても良いはずだ.
このような選挙結果の鈍感安定さは,選挙制度(小選挙区)にあることは間違いない.

■次回取り上げるテーマ:地震の発生確率.
今日地震が起こらなかった.明日は今日より地震発生確率は高いのだが?

------記----
数学月間懇話会(第12回)
主催●日本数学協会,数学月間の会(SGK)
日時●7月22日,14:00-17:10
----
1.数学者って,どんな顔をしてる?
  亀井哲治郎・河野裕昭(亀書房・写真家)
2.世論調査は正しいか
  松原望(東京大学名誉教授,聖学院大学)
3.がん登録の可能性
  田渕 健(都立駒込病院・東京都がん登録室)
ーーーー
会場●東京大学(駒場)数理科学研究科棟002号室
最寄り駅●京王井の頭線「駒場東大前」
参加費●無料
問合せ先●数学月間の会(SGK)
sgktani@gmail.com,谷克彦(SGK世話人)
直接会場においでください(開場13:30)
17:30より構内カフェテリアにて懇親会(各自払い)
*********************

0

ビッグデータによる参院選予測

━━━━━━━━━━━━━━━━━━━━
数学月間SGK通信 [2016.07.05] No.122
<<数学と社会の架け橋=数学月間>>
━━━━━━━━━━━━━━━━━━━━
■現代は,衛星からスマートフォンまで大小のソースから,さまざまなデータが絶えまなく集められています.
検索サイトのgoogleやyahooにはビッグデータが蓄積しています.
ビッグデータの様々な利用法やそのための解析法も急速に発展しつつあります.
世論調査は従来から,RDD(無作為抽出)の電話によるアンケート形式で実施されているのだが,
先日,yahooのビッグデータを用いた参院選挙当選予測が発表された.
http://docs.yahoo.co.jp/info/bigdata/election/2016/01/
それによると改憲勢力が2/3に達しそうな情勢という.

■webサイトを渡り歩き,あるサイトで買い物をしたとする.そこに導いた各webサイトの貢献率は如何様なものだろうか?
googleの各webサイトのレイティングはどのように計算しているのだろうか?
サイト間の遷移確率を成分とする遷移行列*)を作り,この行列を各サイトの状態に作用させた結果,
各サイトの状態は新しい状態になる.何度も遷移が繰り返されると,状態が収束するとして,
各webサイトの状態(貢献度,ランキング)を求めることができる.
*)各webサイトを頂点とし,頂点間の遷移を矢印で表すと,有向グラフができる.
サイト間の遷移確率をこれに書き込むと遷移行列になる.

■さて,選挙の当選予想に戻るが,Amazonの「これを買った顧客はこれも買う」のような推薦システムや,
企業が集めたデータから,顧客の行動を予測をしている.これにはクラスタリングと最隣接クラス分けのツールが用いられる.
投票行動の予測もこれに類似したものであろう.
ビッグデータをどのように解析したのかわからないので,何とも言えないが,
過去に実績のある推測法らしいので当たるかもしれない.
http://searchblog.yahoo.co.jp/2012/12/yahoobigdata_senkyo.html
例えば,ある本の購入数,あるワードの検索数など,関係のなさそうな事柄と各政党の得票との相関を重ね合わせ予測がなされる
(投影法という).定義した注目度という量を各候補の当落の評価関数に用いている.
なぜ各事柄と得票に相関があるのか,各相関を重ね合わせる時のウエイト付の意味など説明できないことだらけだが,
予測結果が実際と合うように決める.因果関係の筋が通っていないものは,私には信用できないが,
絡み合った因果関係の“複雑系の世界”とはそういうものなのでしょう.
地球のどこかで起きた蝶の羽ばたきが,後日離れた地でハリケーンの進路を変える原因になる
かもしれないという“バタフライ・エフェクト”の世界ですから.

そして,思いもよらぬ事柄の些細な変化で結果の逆転も起こり得ます.
予測は不安定ですので信じるのはほどほどにしないと誘導され易い運命論者になってしまいます.

0