起点と終点が意図的に選別されたデータに要注意

多くの場合、これは回避するのが難しい問題です。データはどこかから始めなければなりませんし、通常は任意のどこかになります。もし数字が何度も大きく変動していたら、低い値を取るか高い値を取るかで、データから言えそうなストーリーが大きく違ってきます。

トム&デイヴィッド・チヴァース『ニュースの数字をどう読むか 統計にだまされないための22章』(ちくま新書)
トム&デイヴィッド・チヴァース『ニュースの数字をどう読むか 統計にだまされないための22章』(ちくま新書)

たとえば、子どもの貧困を改善させたことを示したい政府与党なら、子どもの貧困度が特に高かった年を起点にして「見てください、下がりました」と言いたいでしょうし、野党なら、特に低かった年を起点にして「見てください、上がっているじゃありませんか」と言いたいでしょう。

明らかな傾向があるのか、それとも単にノイズが多くて線がふらつくのかをチェックするのに、より広い視野を持つことが助けになります。しかし、結果がもっとも劇的になるようにデータの起点と終点を意図的に選別するとしたら、誤ったストーリーを語ることになるのはほぼ確実です。

ちなみに、「1998年以降温暖化はない」関連の論文は、2014年、2015年、2016年が、すべてそれまでより暑く、さらに、すべて前年よりもっと暑くなり、恐るべき“記録上最高に暑かった”3年間だったために、ほぼ絶滅しました。

誤ったストーリーを語るために外れ値を選ぶことは、やりたければできます。でも結局は、いずれにせよ潮は来るのです。

[脚注]
※1. Bob Carter, ‘There IS a problem with global warming... it stopped in 1998’, the Daily Telegraph, 2006
※2. David Rose, ‘Global warming stopped 16 years ago, reveals Met Officereport quietly released... and here is the chart to prove it’, the Mail on Sunday, 2012
※3. Sian Griffiths and Tim Shipman, ‘“Suicidal generation”: tragic toll of teens doubles in 8 years’, the Sunday Times, 2019
※4. ‘Suicides in the UK : 2018 registrations’, ONS, 3 September 2019
※5. COMPare, ‘Tracking switched outcomes in clinical trials’, Centre for Evidence-Based Medicine, 2018

トム・チヴァース(Tom Chivers)
サイエンスライター、作家

「テレグラフ」「バズフィード」を経て18年よりフリー。同年王立統計学会'statistical excellence in journalism'賞を受賞。著書に『AIは人間を憎まない』(飛鳥新社)。

デイビッド・チヴァース(David Chivers)
ダラム大学経済学部助教授

専門はマクロ経済。