トランプ大統領誕生と世論調査

━━━━━━━━━━━━━━━━━━━━
数学月間SGK通信 [2016.11.15] No.141
<<数学と社会の架け橋=数学月間>>
━━━━━━━━━━━━━━━━━━━━
ドナルト・トランプ大統領が誕生しました.
大方の世論調査でも,期日前投票や投票当日の出口調査でも,ヒラリー・クリントンが優勢でした.
トランプをとんでもない候補だとする,新聞やTVによる刷り込みが激しかったこともあり,
多くの人々がこの逆転結果に驚きました.選挙戦中のメディアの報道は明らかにクリントン支持に偏っていました.
しかし,クリントンは現政権の中枢におり,既成勢力の政治はもうたくさんだとトランプに共感する人々は多かったのです.
今回も外れてしまった世論調査はどれほど信用できるのでしょうか.
選挙直前の世論調査を振り返ってみましょう.
10/29-11/01の期間に行われたワシントンポストとABCテレビによる世論調査は,50州の1,767人を対象とし,
トランプ45%,クリントン47%でした.
同時期のロイターによる世論調査は,1,700人の回答を得て,トランプ39%,クリントン45%だった.
直前11/7のロイター/イプソスの調査は,全米50州とワシントンDCの15,000人に対して行われ,
獲得選挙人を,トランプ235人,クリントン303人と予想しました.
政治専門サイト「リアル・クリア・ポリティクス」によると,7日午後時点の支持率は,
トランプ44.3%,クリントン47.2%で,猛追してきたトランプだが,
差は前日の1.8ポイントから2.9ポイントに広がっています.
そして,選挙人獲得見込は,トランプ164人,クリントン203人でした.
調査会社「ファイブサーティエイト」の最終の選挙人獲得予測も,
70人近い差でクリントン圧勝としていました.
大統領選挙の結果は,獲得選挙人数で,トランプはクリントンに60人以上の差をつけましたので,
これらの予測は大きく外れました.しかし,獲得票数は拮抗しています(トランプの方が若干少ない)ので,
予測できたと言えないこともありません.
選挙人に換算するところで,わずかな誤差が積算されるために予測が困難なのです.
(注)アメリカの大統領選挙は,州ごとの集計で獲得票が1票でも上回った候補が,
その州の選挙人を総取りする方式なので,得票数と獲得選挙人の数は比例せず,
場合によっては逆転することもあります.

■世論調査はなぜ外れたのか
世論調査は,有権者全員(母集団)を対象にすべきですが,現実にはこれは不可能なので,
母集団から掬い取ったサンプル集合に対して調査を行います.
サンプル集合が母集団の性質を代表していると見做せるのは,ランダム・サンプリングがなされた場合です.
しかし,これが難しい.サンプル集合に偏りが生じてしまうのが普通です.
これを少しでも避けるために,サンプリングの方法に色々な工夫があります.
母集団を,性質(人口規模,地方性,産業構成,人種,....)が似ている地域(1つの層とする)ごとに層別し
その中でサンプリングします.
各層のサンプルについての調査結果に母集団内での構成比に応じた荷重をかけ結果を得ます.
このとき色々な誤差が入ります.例えば,ある層の人たちの回答が,少ない/多いとか,
あるいは,ある層のサンプリングが過剰になるなどのことが起こります.
これらに対して適切な補正ができればよいのですが実際はなかなか難しい.
もし,サンプル集合が完全なランダム・サンプリングであるならば,話は単純です.
信頼区間95%として,非常に大きい母集団でも,1,600のサンプル数があれば,
最も誤差の大きくなる拮抗状態でも,±2.5%の誤差が保証されます.
今回の世論調査による両者の支持率の差では,この誤差中に入り,まさに拮抗状態です.
実際の得票数もほとんど拮抗しています.
ワシントンポストとABCテレビのサンプリングはうまく行ったといってよいのではないでしょうか.
直前のロイター/イプソスの調査はサンプル数15,000なので,ランダム・サンプリングが正しければ
誤差は±0.8%程度になるはずです.各州ごとにサンプル数と支持率を検証しないとわかりませんが,
全体が大きく外れているのでサンプル集合の偏りが疑われます.
2015年の英国の総選挙の例では,保守党と労働党の票獲得は,予測された「統計的デッドヒート」状態にはならずに,
保守党が労働党に対し7ポイントの優位で下院の多数を勝ち取りました.
世論調査組織が使ったサンプル補集の方法が,労働党有権者を過剰に系統的に集め偏ったサンプル集合だったからです.
適用された統計的補正も働かず予想が外れたのです.
特に,米国大統領選挙の予測では,得票数予測の正確さが要求されます.
一人の差で,獲得選挙人の数が大幅に変わってしまう選挙制度なのですから.
以下で,サンプル集合を偏らせる原因のいくつかを並べてみましょう.
■固定電話の激減
世論調査はRDD(ランダムに選んだ固定電話に行う)方式です.固定電話が対象ですが,
米国でも携帯電話による固定電話の置き換えが進んでいます.
固定電話がつながった場合でも応答に出る確率は以下のように激減しているそうです.
 72%(1980)→81%(2000)→5.5&(2012)→0.9%(2016)
そして,固定電話に応答の確率は,高齢白人女性が若いヒスパニック男性より21倍も高いことや,
生産拠点の国外流出で労働者,黒人層に移動混乱があるミシガン州での固定電話の調査が困難なことなどです.
(Garret M. Graff;WIRED,2016,7による)
■隠れトランプ
いわゆる「隠れトランプ支持者」の存在が調査結果を歪ませ,影響を与えたと言われています.
人種差別者と誤解されたくないので「私はトランプ支持者です」と答えることを躊躇する有権者や,
逆に,ヒラリー支持と言いながら投票に行かない人の存在が考えられます.
多くのメディアが反トランプの立場で報道した反作用として,この影響がでているのでしょう.
日本で,NHKが報じないと信用しないというほど,多くの庶民がTV報道による歪曲を受けています.
世論誘導に利用する調査の数字では困ったものです.
■投票機における不正
実際の投票数の方がゆがめられて予測と合わなくなる場合の話です.
大統領選の本選では,このようなことはなかったと信じますが,
クリントンが勝ち,サンダースが負けた米民主党の5月の予備選挙で不思議なことが起こったようです.
米国の選挙には投票機(90年代に作られそのOSはwindowsCE)が用いられるので,
ROMを差し替えておくと改造プログラムが立ち上がり不正が可能といいます.
5月の予備選挙の後,米スタンフォード大学の大学院生らが,
この選挙でサンダースを不利にクリントンを有利にする不正が行われたとの研究結果を発表しています.
それによると,印字機能がついている投票機が使われている州だけを集計すると,
クリントンの得票率が49%,サンダースの得票率が51%でサンダースの勝ちだったが,
印字機能がついていない投票機の州だけを集計すると,クリントン65%,サンダース35%でクリントンの勝ちだったという.
このことから民主党本部は,印字機能がついていない投票機のROMを細工を施したものに差し替えて,
サンダースに投票した党員の何割かの投票結果をクリントンにすりかえることを実現したのだと推測されています.
(田中宇,2016年10月26日より)
トランプはこのことを受けて,不正が行われたなら自分は負けを受け入れないといったのだが,
クリントン支持の米マスコミに,「トランプは,大統領選の負けを受け入れないひどい候補者だ」
と歪曲キャンペーンに利用されました.