世論調査は正しいか

━━━━━━━━━━━━━━━━━━━━
数学月間SGK通信 [2016.05.24] No.116
<<数学と社会の架け橋=数学月間>>
━━━━━━━━━━━━━━━━━━━━
今年は選挙の年ですが,世論調査を鵜呑みにしてはいけません.
世論調査のためのサンプル集合は信用できますか?
母集団からサンプル集合を作るのに,
意見を聞く集団が偏っていることは良くあります.
視聴率調査のビデオリサーチのように,サンプル数の少ないものもあります.
母集団を代表しない偏ったサンプル集合では正しい情報が得られません.
ランダムサンプリングであるのが前提ですが
ランダムサンプリングであるかどうか事前に判定できません.
昨年6月の英国総選挙の世論調査では実際にそのようなことが起こり
保守党と労働党の票獲得は,予測された「統計的デッドヒート」が実現せず,
保守党が労働党に対し7ポイントの優位で下院の多数を勝ち取った.
選挙直後に,外れた世論調査の原因研究が
英国世論調査会議BPCと市場調査協会MRSによって立ち上げられ,
2016年3月に報告書(120ページの長文)が出た.
この報告書は大部のため,本稿への引用は,Tarranのエッセイによる(注).

報告書によると,サンプルが母集団を代表するものでなかったことが,
世論調査ミスの主原因であるというのだ.
世論調査組織が使ったサンプル補集の方法が,
労働党有権者を過剰に,保守党有権者を過少に系統的に集め,
適用された統計的調整手順も,これらのエラーの低減に効果がなかったという.
報告書が勧告する改善提案は,将来起こりうる世論調査ミスのリスクを低減するが,
リスクそのものを取り除くものではないことに注意しよう.

世論調査では,今後も非ランダムサンプリングを使用せざるを得ない.
ランダムサンプリング(確率的サンプリング)は,実行するのに,費用と時間がかかる.
しかし,非ランダムサンプリング(非確率的サンプリング)に比べて明らかに優れている.
非確率的サンプリングではサンプルに偏り(バイアス)が生じ易いのだ.
回答者がランダムに選択されるなら,母集団のすべてのメンバーに,調査参加者となる一定のチャンスがある.
これ自体は,得られたサンプルが,母集団の完全な代表であると保証するものではないが,
選択のランダム性は,代表されるグループの外部/内部を調整するためのサンプリング理論の適用を可能にする.
また,サンプルへ自己選択される可能性を下げ,回答者の採用過程で,バイアスがかかるリスクを軽減できる.
研究報告書を読んで失望する読者もいるだろうが,失望が畢竟実用主義への道を与え,
世論調査の難しさと不確実性を理解することになる.母集団でなくサンプルで解析するのだから限界がある.
世論調査は将来起こるかもしれない行動について,
有権者のようなよくわからない母集団を調べるので苦しい闘いに直面している.
世論調査の実施方法の高い透明性と,その推定の不確実性レベルを明確に伝える責任がある.
それぞれの政党の支持率の信頼区間と前回公開世論調査に対するそれぞれのシェア変化
の統計学的有意差検定を合わせて報告することを報告書は勧告している.

メディアのコメンテータは,世論調査で出た政党支持のわずかな変化を過剰に解釈する傾向があり,
証拠が推論をサポートしていない(統計的に有意でない)のに,公衆に党の運命が変わってきたと印象づける.
このようなことは避けるべきだ.

(注)https://www.statslife.org.uk/politics/2752