前提知識がないと、都道府県の人口が支持者の数や候補者の票数に影響することには気が付きにくいかもしれません。おそらく最も簡単に気が付ける方法は、実際の選挙結果を眺めてみることでしょう。共産党候補の得票数が、東京や大阪で多く鳥取や島根で少ないと知れば、都道府県の人口が候補者の得票数の根本的な要因ではと思い当たるでしょう。

そのほかの要因も考えてみましょう。候補の得票数は、党の支持者数や候補個人の支持者数から影響を受けるだけでなく、他の候補の得票状況からも影響を受けます。以下、少し議論を省略しますが、他の条件が同じなら、他党の有力候補者数が増えるほど共産党候補の得票数は減ることになります。

共産党以外から有力候補がどれだけ出馬するかは、選挙区の選出議員数に左右されます。参院選挙区では選挙区によってその選出議員数が異なり、選出議員数が多いほど他の有力政党から出馬する候補の数が多くなります。そして、参院選挙区の選出議員数は、選挙区(都道府県)の人口の多少で決まっています。

支持者の多い候補はフォロワー数、リツイート数も多くなる

「候補の得票数」の因果構造がだいたい見えてきたら、次に「リツイート数」の因果構造も考えてみます。ここでは「候補の得票数」の因果構造を先に考えているので、その中の各要因を交絡因子の候補と捉え、これらが「リツイート数」にどう絡むのか同時に考えると効率的です。

たとえば、リツイート数の要因として、各候補のフォロワー数やツイート数という要素を思いついたとしましょう。ここでさらに、各候補のフォロワー数の多少を決める要因として、先に考えた因果構造の中から党支持者数や候補独自の支持者数を繋げることができれば、これらが交絡因子の候補になります。

あるいは、「逆方向の因果関係で捉えてみる」という方法を用いてもよいでしょう。つまり、「候補の得票数」が「リツイート数」の要因となっているのではないかと一度考えてみるのです。得票数が多い候補にはそれだけ支持者の数が多いのだから、ツイッターのフォロワー数も多くリツイート数も多くなるのではと、この2つの要素を因果関係で結ぶように考えていきます。すると、「リツイート数」、「候補の得票数」それぞれが第3の要素「候補の支持者数」を起点とした矢印で繋がりますから、これを交絡因子の候補とすることができるでしょう。

図表2は、以上のような思索を経て作成した因果構造の図です。あくまで一例ですが、ここで焦点となっていた「候補の得票数」と「リツイート数」とを、「党支持者数」や「候補個人の支持者数」から伸びた矢印で繋げることができました。議論としては、図表1はリツイート数が得票数を伸ばすような因果関係を示すものではなく、党支持者数などを交絡因子とした偽の相関関係を示したものだ、と指摘することになります。

ここで一度、解答例を示しておきたいと思います。

解答例(文章)

この記事では、共産党候補の呟きの拡散が共産党候補の得票や当落に影響を与えたという因果関係を主張している。しかし、その根拠となる散布図は共産党候補の呟きの①リツイート数と②得票数の相関関係を示すに過ぎない。

たとえば東京都のような人口の多い選挙区では、鳥取県のような人口の少ない選挙区に比べて共産党支持者の数はかなり多く、同党候補の得票数も遥かに多くなる。同様に、東京都のような人口の多い選挙区では、鳥取県のような人口の少ない選挙区に比べて各党候補をフォローする支持者の数がかなり多くなり、必然的にリツイート数も多くなる。党の政策の宣伝のようなほぼ同じツイートでも、大都市圏の候補と小県の候補とでは、そのリツイート数は大きく異なることになる。

このように、選挙区間で大きく異なる党支持者数を共通の要因としているため、①リツイート数と②得票数が相関するのは当然である。すなわち、①②間の相関関係は党支持者数を交絡因子とする偽の相関関係と考えられ、①から②への因果関係を主張するのは誤りと考えられる。