データ分析の解釈を狂わせる「交絡因子」の見抜き方
問題では図表1の横軸(RT数)と縦軸(共産党候補の得票数)に共通する交絡因子を求めています。交絡因子とは、「結果と要因の間に割って入ってきて三角関係を作る別の要因」です。交絡因子という特殊な名前がついていますが、因果構造の一角を占める要素のひとつに過ぎません。
因果構造を考える際に大切なのは対象に関する知識です。したがって、交絡因子を探す際にまず必要なのも対象に関する知識です。今回は必要な知識を提供するために、ヒントを先に示しておきました。これらの知識も踏まえつつ、この問題を解いていきましょう。
交絡因子を考える際、最初から2つの要素に共通する要因は何か? と考えてもうまくいかないことがあります。このような場合には、一方の要素の因果構造を考え、その中で他方の要因となりそうなものはないか考えるのがよいです。
ここでは、焦点となっている2つの要素のうち、知識があり想像が容易い側の要素について先に背景の因果構造を考えていき、その中でもう一方の要素と繋がるところはないか確認していく思考戦略を採用します。
今回は、先に「候補の得票数」に連なる因果関係を考えてみます。まず直接的な要因を考え、次にその奥の間接的な要因を考えてみるという因果構造の探り方を適用してみましょう。候補の得票数が多くなるのはその候補の支持者数が多いからだといったような、言い換えに近い因果関係を思い浮かべるわけです。
ただし共産党は、候補者個人を支持して投票したという人より、共産党の候補であれば誰でも投票するというような人が多いでしょう。ちなみに政治学では、このような投票行動を「箱推し」と呼びます(嘘です)。
得票数を大きく左右するのは都道府県の人口
ともかく、その選挙区における共産党や候補独自の支持者の数が多ければ、共産党候補の得票数も多くなると考えることができます。もっとも、支持者がたくさんいるので得票も多いという因果関係は直接的で当たり前すぎますから、さらに支持者の数の背後の要因を考えることになります。真面目に考えれば、農村部では共産党の支持者は少ない、貧困層が多い地域では共産党の支持者が多い等々と思いついていくことになるでしょうか。
しかし、もっと強力な要因があります。それは都道府県の有権者数(≒人口)です。
参議院の選挙区は都道府県ごとに分かれていますが、その都道府県の人口は最少と最多で20倍以上の開きがあります。仮に人口最少の鳥取県で共産党支持率が40%だったとしても、その支持者の数は人口最多の東京都での支持率わずか2%の場合と同程度ということになります。人口格差はこのように強い影響を及ぼします。したがって、鳥取県で出馬した候補がいかに頑張って得票“率”を上げても、東京都で出馬した候補が獲得するのと同程度の票“数”を獲得するのはなかなか難しいのです。