デジタル読者獲得施策として持て囃されたツイッター分析
一方、“紙離れ”に危機感を抱いていた新聞社、通信社は、デジタル版の読者獲得を狙い、ウェブ向けの企画に力を入れていました。ウェブで“映える”グラフを作りやすいツイッター分析は、まさにこの目的に適っていたと言えるでしょう。
マス・メディアによる日本の選挙に関する大規模なツイッター分析のおそらく最初の例は、朝日新聞が「ビリオメディア」(注1)と名付けた企画の中で、2012年衆院選を題材に行われたものです。ビリオメディアとは「10億(ビリオン)を超える人たちがソーシャルメディアで発信する世界」を示す同社による造語です。
注1:「朝日新聞デジタル」http://www.asahi.com/special/billiomedia/
当初は、記者がSNS(ツイッター)を利用することで取材過程をオープンにしながらSNSに関する記事を書くというのが企画の趣旨だったようです。そこに「ビッグデータ分析」という名前でツイッター分析が加わり、企画の二本柱となったようです(注2)。
注2:「ビリオメディアって何?/朝日新聞が何かやってます」togetter
おそらくこの企画を見て、他社もこぞって真似たのが2013年参院選のツイッター分析の流行の実際です。各社とも企業からデータの提供を受け、大学教員も使いながら、紙面とウェブで企画を展開していました。
ただ、それらの企画の中で提示された分析の水準は正直に言って酷いものでした。これについては筆者がかつてまとめて批判したことがありますので、興味ある方はそちら(注3)を参照してください。
※注3:菅原琢「『ネット選挙』から見る政治報道の課題と展望」『Journalism』2013年9号、88-97ページ
マスコミは「効果あり」を大きく報じてしまいがち
しかし、メディアと企業、大学教員など多人数が関わった大きなプロジェクトであるのに怪しいデータ分析が生み出されたのはなぜでしょうか。おそらくそれは、それこそ「大きなプロジェクトだったから」ではないかと筆者は考えています。
研究者の間では、出版バイアスという言葉が知られています。簡単に言えば、否定的な分析結果よりも肯定的な分析結果のほうが公表されやすいことを指します。
たとえばある成分がある病気を治癒する効果があるとは言えない(以下、「効果なし」と短絡的に言い換えます)とする分析結果が出たとき、効果があってほしいと思っていた分析者はそれを論文にせず、「効果あり」とみなせる分析結果が出るまで実験するかもしれません。そういう人は、「効果あり」の分析結果が出たときに、別の交絡因子が作用している疑いがあってもそれを無視したりするかもしれません。ときにはデータを捏造してでも「効果あり」にする研究者さえいます。
これと同じようなことがマス・メディアでも起きていたと想像することができます。大きな予算を使って、プロジェクトを組んで、紙面とネットで大々的に企画を展開したら、どうしても「効果あり」を大きく報じてしまう傾向があるということです。これは世論調査の結果を公表する際にしばしばみられることで、大きな数字は見出しに載せて大きく報じ、小さな数字には触れないといったことが起こります(注4)。
※注4:菅原琢「世論調査政治と『橋下現象』――報道が見誤る維新の会と国政の距離」『Journalism』2012年7号、38-47ページ
仮に「効果なし」を示唆するグラフを見ても「ネット選挙は意味がありませんでした」と記事にすることは難しく、逆に「効果あり」と感じさせるグラフが見つかれば即採用となりやすかったのではないかと想像します。「効果あり」の記事を出せと強い圧力を受ける現場の記者は訓練された研究者とは異なり、容易く「効果あり」を拾ってしまうのでしょう。
以上の考察を踏まえると、世に流通するデータ分析の失敗に敏感になるためには、データ分析自体を批判的に見るのに加え、データの出所やその分析が生まれ出てきた背景に着目することが有効だと言えます。誰が何のためにデータを作成したのか、どういう目的で分析が行われたのか考えを巡らせれば、見えてこなかったものが見えてくることがあります。