誤ったデータ分析が新聞に掲載されてしまう理由
ところで、なぜこのような誤ったデータ分析が新聞に掲載されてしまったのでしょうか? ここには、怪しい分析が世に流通してしまう背景が垣間見えます。
まず直接的には、記者らにデータ分析に関する素養や対象に関する知識(この場合は選挙制度や政治に関する知識)が乏しかったことが要因と考えられます。交絡因子なるものが偽の相関関係を生み出すことを知らなければ、単純な散布図から容易に幻の因果関係を掴んでしまうのです。
マス・メディアに限らず、これらはデータ分析を失敗に導くよくある要因です。新聞社の場合はそもそも文系学部出身者が多いこと、そして入社後は取材と執筆の積み重ねの一方でデータ分析に関するトレーニングの機会や動機がおそらくほとんどないことも背景として想像できます。
さらに、新聞特有の事情もあります。それは、単純な分析結果しか示すことができないという媒体の縛りです。
新聞記者は、「一般の読者がわかる記事を書かなければならない」と自分自身を戒めているところがあります。これはデータ分析に限りません。筆者個人の印象ですが、取材や原稿のやり取りのときに、自分がわからないものは読者もわからないはずという謎の驕りを新聞記者から感じることがあります。
ただその結果、難しいことをわかりやすく伝えるのではなく、最初からわかりやすいことばかり並べたり、だいぶ単純化して物事を伝えているのではないかと疑問に思うこともあります。近年は大学の授業も同様の風潮があるように思いますが。
「わかりやすさ」の呪縛がデータ分析を狂わせる
そうした「わかりやすさ」の呪縛がデータ分析に向かうと、散布図を代表とする2つの要素間の関係のみを示す単純なグラフばかりが新聞に載ることになります。一応述べておけば、散布図は単純で便利で有意義なツールで、使っていけないことはありません。丁寧に因果関係を読み解くなら、分析と議論の良いお供にすることができるでしょう。
しかし、鍛錬していない人が散布図を用いると、グラフ上に表現された2つの要素のみに焦点を当て、単純で誤った議論を展開してしまいがちになります。
一方、社会に存する現象は本来複雑な背景を持つものです。2つの要素の関係を見るだけで因果関係を主張できるほど都合よく社会はできていません。だからこそ因果の構造を熟考することが重要なのです。
ともかく、散布図を根拠としてそこに登場する2つの要素間の因果関係を主張するような「分析」を見たら、何かあるはずだと交絡因子を疑って読むことを心掛けるとよいでしょう。