数学月間の会SGKのURLは,https://sgk2005.org/
数学月間の会SGKのURLは,https://sgk2005.org/
━━━━━━━━━━━━━━━━━━━━
数学月間SGK通信 [2016.04.26] No.112
<<数学と社会の架け橋=数学月間>>
━━━━━━━━━━━━━━━━━━━━
レイティング(評価)とランキングの数理
Amy Langville(ラングビル)
Professor, Mathematics Department, Operations Research Analyst,
College of Charleston
2012年にCarl Meyerとの共著 “No.1は誰か:レイティング(評価)とランキングの数理” が出版
[訳註:共立出版より同名の訳書あり]されると,企業,法律事務所,同僚,学生などから,
彼らのデータを解析支援する要棲を定期的に受けるようになった.
最近の興味深いプロジェクトのいくつかと,今年の数学月間のテーマ”予測の未来”
にふさわしいツールを説明しようと思う.
まず,タイムリーな応用[MAMは4月]は,3月の狂気(March Madness)です.
毎年恒例のNCAAカレッジ・バスケット・トーナメント.数百万人のファンが
この一月続くトーナメントの各試合の勝者を当てようとします.
[訳者より:ブラケット・チャレンジというのは,インターネットで行う
CBS sports serviceが提供する各試合の勝者を当てポイントを競うことらしいが,
よく知りません.米国事情に詳しい方,米国バスケットの3月の狂気と
ブラケット・チャレンジについて教えてください].
まず,同僚Tim Chartier(Davidson College)と一緒に,数学モデルのみに基づき
ブラケットを提出する方法を学生に教えます.
そのときの2つのモデル(Colley and Masseyモデル)は,チームの評価に線形システムを用い,
もう一つのモデル(Eloモデル)は,反復更新を使います.
長年にわたって,学生のモデルはよい結果を出し,ある年などは提出された
すべてのブラケットの99のパーセントを得点しました.
毎年,モデルに洗練を加えるために,学生たちは質問をしデータを集めます.
例えば,コーチ,チーム団結,トーナメント経験のような因子をどのように導入したら良いのか?
怪我は因子にどのように入れることができるか?
我々は、今年のシンデレラ・チームを予測することができるだろうか?
もう一つのスポーツ応用:オリンピック・アスリートのデータ分析で,
私の学生と私は米国オリンピック委員会を支援しました.資源の効率利用の観点から,
委員会はどのアスリートがメダルをとるか予測したい.この問題を解くためには,
回帰とシミュレーションを用います.他の問題は,国の資金がどうであれ,
アスリートにより多くのメダルを獲得する動機を与えなければならない.
この第2の問題に関する適切なデータを得ることは困難だった.
それで,英国を含む他国の促進プログラムがうまくいったかどうかに調査を広げました.
次に,Amazonの「これを買った顧客はこれも買う」のような推薦システムを議論します.
また,どの映画を顧客に推薦するべきか,どの歌が特定のリスナーのプレイリストを満たすか,
どのスポーツ用品を顧客に推薦するべきかなどを予測したい小規模の新興企業からの要請に答えるために,
私は同僚Tim Chartierとチームを組みました.共通のテーマは,企業が集めたデータを,
顧客の行動に影響する役立つ予測のために,どのように使用するかということです.
この問題を解くために,典型的にはクラスタリング(クラス分け)と最隣接クラス分けのツールを用います.
昨年,Rootmetricsから,携帯電話を評価する現在の彼らのシステムの改良の依頼がありました.
学生Tyler Periniは,うまく接続し伝達できる物理過程をエレガントにモデルしたマルコフ連鎖を立て,
現在の評価システムのもつ多くのタイがある曖昧さをなくすことができました.
Charleston大の同僚,哲学教授と心理学教授,からは,
彼らの謙譲プロジェクトで集めたテキストデータの解析の要請がありました.
ゴールは,書かれたサンプルを解析して謙譲の個人レベルを決定することです.
学生 Tyler Perini は,テキストを混合するツールを開発しました.
それは,与えられた短いテキストサンプル(ツイートやfacebook今何してるより長くない)で,
著者が謙譲か謙譲でないか予測する.
謙譲な著者は,"and”,”we”,”all”,”each other”を含み,
謙譲でない著者は,"they", "people","them", 排除的"or"などの距離を取る言葉を使う.
次のステップで,人文科学教授が研究するのは,自己抑制である.
スピーチに基づき自己抑制の低さを予測する我々のツールが,
子供たちの行動訓練を提供することを願っています.
もう一つのテキスト・マイニング・プロジェクトでは,Charleston大の大学院生は,
今年の大統領選挙戦で候補のテキストを分析しています.
彼らは,若干の面白い傾向を見つけました.
たとえば,Donald Trumpの辞書(彼の使う語彙)は,Hillary Clintonのおよそ3分の1です.
フィールドが狭くなって,有権者がどのように1人の候補から他方の候補者へ支持を移すかを予測するために,
彼らは測度の同一性とマルコフ連鎖を使います.
最後に,同僚の妻は私に非常に難しい問題ー卒業の後の医学実習生と病院との安定結合問題ーを提案しました.
データが至る所にあることは,上述の問題の多様性から明白です.
衛星からスマートフォンまで,大小のソースから,データは絶えまなく集められています.
将来は,指数関数的に多くの予測解析法を持つことになり容易に予測ができるようになります.
現在は,数学,コンピューター・サイエンス,データ科学,統計学を専攻するには素晴らしい時代です.
これらの組み合わせはさらにうまく行きます.
ここまでは,MAMのエッセイ http://www.mathaware.org/mam/2016/essay/ からの翻訳でした.
選挙の開票で,まだ開票率が35%なのに当確が出たりします.これはレイティングの予測で
トーナメントの勝ち数の推移から1番を予測するのと同じようなものです.
また,webサイトのページを渡り歩き,あるサイトで買い物をしたとすると,
それに導いたwebサイトの貢献率はどのようなものでしょうか.
googleのweb各ページのレイティングはどのように計算するのでしょうか.
サイト間の遷移行列を作り,この行列を作用させた結果新しい状態になると考えると
何度も遷移が繰り返された結果収束する状態が各ページのランキングになります.
つまり,遷移行列のn乗の固有ベクトルを求めることになります.
ここに線形代数が使われるし,現在の状態だけで次の状態が決まるというマルコフ連鎖にもとづき
遷移行列を決めることができます.
━━━━━━━━━━━━━━━━━━━━
数学月間SGK通信 [2016.04.19] No.111
<<数学と社会の架け橋=数学月間>>
━━━━━━━━━━━━━━━━━━━━
今月14日夜に,熊本県益城町で震度7の大きな地震が起きました.マグニチュードは6.5でした.
地震規模のスケールであるマグニチュードは,リヒターの発案当時は便宜的なものでしたが,
今日では,ずれの面積と変位,地面の剛性から計算できる地震の仕事エネルギーを対数で表示したものです.
14日の地震のマグニチュードは,巨大地震ほどではないが,震源が10kmと浅いため,
局地的に地表が激しい揺れとなり大きな被害がでました.
その上,この地域はフォッサマグナ(活断層が集まっているベルト地帯)の上にあり,
次々と余震が続きます.震源もフォッサマグナに沿って熊本県や大分県由布市に移ってきました.
心配ですね.被害お見舞い申し上げます.皆様のところは大丈夫でしょうか.
阿蘇の東側から佐伯,および,阿蘇の南側には,むかし行ったことがあります.
峡谷で囲まれた台地が島のようになった地形で,交通は大変だったそうですが,豊かな芸術文化が伝承されています.
通潤橋のある山都町では人形浄瑠璃が印象に残りました.怪我や避難やたいへんな日々と思います.
応援しております.はやく落ち着きますように.
■フォッサマグナは西日本では,佐田半島から大分,由布,九重,阿蘇を通り,天草,八代海に沿って走り,
川内原発の付近に至るようです.活断層の調査は露頭でできますが,川内原発の地下を通っていても見えません.
再稼働の根拠となった九電の調査は3つの断層延長上の1つのみの結果で,規制委は不十分のまま再稼働に踏み切りました.
フォッサマグナの走る佐田半島の付け根には伊方原発が,八代海側には稼働中の川内原発があります.
すべての原発は即時廃炉を進めるべきですが,特に地震の活動期にある九州で稼働させた川内原発は停止すべきです.
原発事故でどのような責任がとれるというのでしょうか.
川内原発は発電を続けています.それなのに送電先がなく被災地に電源車41台+81台を17日までに配るという.
役立たずの原発ですね.太陽光などの地域分散型の発電システムにすべきです.
■この機会に,手元にあった第4紀地図(1987年版で古いものです)を30年ぶりに開いてみました
(実は一時期,私は地学を教えていたことがあります).参考までに地図を引用掲載しました.
伊方原発,益城町,フォッサマグナの大体の位置は,私がこの地図に書き込んだものです.
阿蘇の周りなどに見られる黒い線が活断層です.
活断層とは,第4紀後期(数十万年前)以降に何度か動いた断層で,地震の原因になる可能性があります.
第4紀は258万年前(寒冷化に向いだした)からで,人類出現の時代.
古い原人が発見されるたび,第3紀と第4紀の境は遡っていき,
258万年前は,2009年に国際地質科学連合が定義したものです.
地球が生まれた45億年前を1月1日の0時とし,現在を新年が始まる0時と例える地球カレンダーなら,
第4紀後期は大晦日の夕方以降です.ごく最近動き,まだ動きそうな断層が活断層ということになります.
活断層であるかどうかは露頭で,断層のできた時期の鑑定になります.
■この地域の乗るユーラシアプレートの下には,フィリピン海プレートがもぐり込んでいます.
地殻と上部マントルの地殻と一緒に動く部分を合わせてプレートと呼び,厚さはおよそ100kmです.
地球の半径は6,500kmですから,半径65mmのボールに例えるなら,プレートの厚さは1mmです.
プレートは,マントル対流に乗ってふわふわ動きぶっつかりもぐり込む皮みたいなもの,
その上に我々は暮らしています.
以下に,第4紀地図を掲載:
http://blogs.c.yimg.jp/res/blog-09-2d/tanidr/folder/572283/62/17401362/img_1_m?1460875928
http://blogs.c.yimg.jp/res/blog-09-2d/tanidr/folder/572283/62/17401362/img_2_m?1460875928
━━━━━━━━━━━━━━━━━━━━
数学月間SGK通信 [2016.04.12] No.110
<<数学と社会の架け橋=数学月間>>
━━━━━━━━━━━━━━━━━━━━
数学と社会の架け橋=数学月間
数学月間は7/22~8/22(22/7=π,22/8=e)の期間です.
私たちは,この期間に数学への興味を惹き起こすイベントが
各地で盛んになるように応援しています.
数学月間の初日の7/22には毎年,懇話会を開催しています.
今年で数学月間懇話会は第12回になります.
計画中の懇話会情報:正式アナウンスに先立ちお知らせします.
無料です多くの方のご参加をお待ちしています.
日時:7月22日,14:00~17;00
場所:東大駒場キャンバス,数理科学研究科・002号教室
1.亀井哲治郎 数学の周辺
2.田渕健 統計と医学
3.松原望 統計と社会
(演題はいずれもまだ仮題です)
問い合わせ先:sgktani@gmail.com(日本数学協会,数学月間の会)
今年のテーマは,統計学です.
世の中は不確かなものやことばかりで確率で記述されます.確率の正しい理解が必要です.
従来,得られなかったようなデータも多量に収集できる時代になりました.
でも,データ収集が恣意的であったり,不合理な解析をしたりすると
どんな結論でも導くことができるので,だまされないように要注意です.
今年(4月に実施中)の米国MAM(Maths Awareness Month)のテーマは「予測の未来」.
・外れた世論調査ー予測の限界を知ろう
・あなたの健康のために
などの興味あるエッセイがあります.ちょっと紹介しましょう.
2015年5月の英国総選挙では,与党の保守党が過半数の326議席を獲得し,
労働党は232議席でした.スコットランド民族党は大躍進の56議席です.
選挙直前の世論調査では,保守党と労働党の差がこれほど広がる予測はありませんでした.
最後の世論調査と投票日の間に逆の一揺れがあったわけですが
なぜこれほど予測に誤差が出たのでしょうか?
調査委員会の報告書(2016年3月)によると,サンプリングが正しい代表値でなかった
ということですが,理想のランダム・サンプリングをすることはできるのでしょうか.
予測を頭から信じることは危ないことです.
今年は,日本も重要な選挙の年です.支持率調査などでも
現実が正しく反映されているのか怪しいところがあります.
2001年にフラミンガム心臓研究の研究者たちは,拡張期血圧,収縮期血圧,脈拍圧を,
冠動脈性心臓病リスク心の予測因子として使用できる結果を発表しました.
この研究により,冠動脈性心臓病の予測能力が向上しました.
異なる年齢層にたいする予測因子の強度を解析し,
それぞれの年齢層でどの予測因子が最も支配するか結論を得ました.
健康とウェルネスのための予測因子は,いろいろな理由で多くの分野で改善が進んでいます.
利用可能なデータは劇的に拡大し,モデリングや解析に用いる技術と手法は向上しています.
一つの分野での進歩は,別の分野の進歩につながり,また広がります.
研究者は以前よりも,より深くより洞察に満ちた結論に到達することができるようになりました.
フラミンガム心臓研究は1948年に始まったが,その後数回の拡大があり,
続く世代集団だけでなく,人口の多様性の増加を反映している集団を追加しました.
これにより,研究者達は,人口の幅,および,多様な健康問題の側面の両方を
表すデータの使用ができるようになった.
この研究のために,研究者達は,原初の集団に20才から79才の集団を統合した.
さらに,研究者達は,数年前には不可能だった場所でのデータ収集をしています.
フィットネスの追跡者は,活動レベルや睡眠パターンのような個人生活の情報を
容易に定量化できる恩恵を受けている.
━━━━━━━━━━━━━━━━━━━━
数学月間SGK通信 [2016.04.05] No.109
<<数学と社会の架け橋=数学月間>>
━━━━━━━━━━━━━━━━━━━━
前号(108号)に,色置換の性質の項で誤りがありました.お詫びして訂正します.
今号は,訂正した全文と,新たな話題の両方を載せますので,長くなります.
12枚のユニットで作るユニット折り紙の立体は下図のようなものです.
この立体は,正8面体の面(正3角形)の上に,
頂角が直角の三角形ピラミッドが乗っている形です.
これから作る展開図では,ピラミッドは正8面体の面(正3角形)に
射影されているので,ぺちゃんこになっています.
正8面体の展開図の各面を,このように塗り分けるようにユニット折り紙を組み立てると,正8面体の各頂点のある4回回転軸(x,y,z軸の方向に3本ある)で4色置換が起こり,正8面体の面の真ん中を通る3回軸(4本ある)は,1色は保存し,残る3色を置換する3回軸だということがわかるでしょう.もちろん辺の真ん中を通る6本の2回軸の色置換も完璧です.
このような色の配置は実際にユニット折り紙で実現可能です.作ってみてください.
ユニット折り紙の規則では2つの直角3角形ピラミッドをつなぐユニットは1つのみですから,展開図の三角形の辺を越えて,対角上に同色の配置を作ります.展開図では,もう一つの対角上にも同色がある(辺を挟んで×になる配置)ように思うかもしれませんが,そちらは1つのユニットではありません.辺の両側で分かれる別々のユニット(同色だが)です.4色のバリエーションはいくらでもできますが,
配置に関しての解はただ一つのようです.
ただし,ユニットの作り方で右回りと左回りのものがあります.
この立体を眺めると4回軸の周りに,4つの色の帯の大円(緑,黄,青,ピンク)が見えます.
各色の帯の大円は,各3回軸を地球の地軸と見立てたとき赤道に相当します.
そして,その3回軸が保存する色が,帯状に現れるのです.
この立体には4色置換が行われる4回回転軸(3本)があり,外から(x,y,z軸の正方向)見て右回りに以下の順です:
x軸:黄→ピンク→青→緑,
y軸:黄→ピンク→緑→青,
z軸:黄→青→ピンク→緑
3色置換が行われる3回回転軸(4本)があります.
z軸(z>0方向)の外から見て右回りに以下の順に置換が起こります:
黄→緑→青(保存:ピンク),黄→緑→ピンク(保存:青),
ピンク→青→緑(保存:黄),黄→ピンク→青(保存:緑)
ーーーーー
新たな話題
■正20面体(あるいは双対な正12面体)
60ユニット(正20面体の面の上にピラミッドが乗っている)の立体の塗り分けを考えます.
以下は展開図
6色を使って塗り分けます.
5回回転軸は6本ありますが,それぞれを地球の地軸とすると
それぞれの赤道に相当する大円に配置される1色が保存され,残りの5色が順番に置換されます.
3回回転軸は10本ありますが,それぞれ2組の3色置換になります.
ーーーーー
■平面
「大川組子」(さなさんブログから教えていただきました)という伝統工芸があります.
シンプルで精緻な組子で感動します.ななつ星の写真をご参照ください.
これらの組子はどちらも三角の格子でできています.ただし,どちらの組子も
格子の中身に,対称性は同じだが異なるモチーフが2種類(あるいは3種類)あり,
単純ではない面白い図案になっています.
さて今日は,この組子とユニット折り紙の関係についてです.
ユニット折り紙で作る多面体の場合と異なり,平面ですので正三角形が頂点で6つ集まっています.
そして正三角形の格子の上にピラミッドが乗っています.
図はユニット折り紙でこれを作り真上から見たものです.
6回軸の色置換を完全にするためにこの図では6色使いました
(地図の塗り分けで,4色問題というのがありましたね.長い間未解決の難問でしたが今は証明されています.この図の場合は,実は3色あれば塗り分けられます.一色の周りは4辺で,皆頂点で接続していますから)
そして,これは壁紙模様の平面群の一つで6回対称です.
色置換の対称性も完全にするには6色で塗り分ける必要があります.
色の区別ができる場合の単位胞タイルは大きな白い4辺形,
色の区別ができない場合の単位胞は小さな白い4辺形です.