起点と終点が意図的に選別されたデータに要注意

多くの場合、これは回避するのが難しい問題です。データはどこかから始めなければなりませんし、通常は任意のどこかになります。もし数字が何度も大きく変動していたら、低い値を取るか高い値を取るかで、データから言えそうなストーリーが大きく違ってきます。

トム&デイヴィッド・チヴァース『ニュースの数字をどう読むか 統計にだまされないための22章』(ちくま新書)
トム&デイヴィッド・チヴァース『ニュースの数字をどう読むか 統計にだまされないための22章』(ちくま新書)

たとえば、子どもの貧困を改善させたことを示したい政府与党なら、子どもの貧困度が特に高かった年を起点にして「見てください、下がりました」と言いたいでしょうし、野党なら、特に低かった年を起点にして「見てください、上がっているじゃありませんか」と言いたいでしょう。

明らかな傾向があるのか、それとも単にノイズが多くて線がふらつくのかをチェックするのに、より広い視野を持つことが助けになります。しかし、結果がもっとも劇的になるようにデータの起点と終点を意図的に選別するとしたら、誤ったストーリーを語ることになるのはほぼ確実です。

ちなみに、「1998年以降温暖化はない」関連の論文は、2014年、2015年、2016年が、すべてそれまでより暑く、さらに、すべて前年よりもっと暑くなり、恐るべき“記録上最高に暑かった”3年間だったために、ほぼ絶滅しました。

誤ったストーリーを語るために外れ値を選ぶことは、やりたければできます。でも結局は、いずれにせよ潮は来るのです。

[脚注]
※1. Bob Carter, ‘There IS a problem with global warming... it stopped in 1998’, the Daily Telegraph, 2006
※2. David Rose, ‘Global warming stopped 16 years ago, reveals Met Officereport quietly released... and here is the chart to prove it’, the Mail on Sunday, 2012
※3. Sian Griffiths and Tim Shipman, ‘“Suicidal generation”: tragic toll of teens doubles in 8 years’, the Sunday Times, 2019
※4. ‘Suicides in the UK : 2018 registrations’, ONS, 3 September 2019
※5. COMPare, ‘Tracking switched outcomes in clinical trials’, Centre for Evidence-Based Medicine, 2018

【関連記事】
超お買い得…「偏差値50台なのに」東大・京大含む国公立大に最大6割が受かる中高一貫校ランキング50
「かつては東大卒よりも価値があった」47都道府県に必ずある"超名門"公立高校の全一覧
「東大合格者は193人→1人に激減」日本一の都立高校・日比谷から天才がいなくなったワケ
「1位はM&A仲介会社の2680万円」平均年収が高いトップ500社ランキング2021
「1位はスーパー3社の持株会社で200万円」平均年収が低いワースト500社ランキング2021