※本稿は、トム&デイヴィッド・チヴァース『ニュースの数字をどう読むか 統計にだまされないための22章』(ちくま新書)の一部を再編集したものです。
地球温暖化は1998年に終わった?
2006年のこと、オーストラリアの地質学者であるボブ・カーターが、イギリス版「デイリー・テレグラフ」に「地球温暖化には問題がある」と寄稿したとき、見出しは「それは1998年に終わった(※1)」でした。それは、その後8年ほどにわたって書かれた多くの同じような記事の1つで、「テレグラフ」は「メール・オン・サンデー(※2)」と並んで、その手の記事を多く掲載していました。
温暖化が1998年に止まったというアイデアは、「地球温暖化の停止」や「中断」についての長い議論につながりました。温暖化がスローダウンしたように見える(逆行したという説もあり)のはどうしてなのでしょうか?
正直に言うと、この問題は複雑です。なぜなら、気候とは複雑なものだからです。カオス理論とは1匹の蝶がブラジルで羽ばたくとテキサスで竜巻が起こることだ、と考えるのとは違います。予想や理解がめちゃくちゃ難しいのです。
しかし、たまたまですが、シンプルな説明があります。それは「1998年に観測を始めたから」というものです。
外れ値を使えば誤ったストーリーも語ることができる
あなたはある日の午後、ビーチにいるとしましょう。波が寄せたり返したりしています。波が高く押し寄せてくることもあれば、低いこともあります。あなたは砂のお城をこしらえ、それが潮の流れで崩されるのを待っています(小さなお子さんと一緒にやるとよいでしょう。時の無情さや人間の努力の無益さを教えられます)。
しかし愚かにも、あなたは休日用コテージを離れる前に、潮が満ちるのか、それとも引くのかを確認しませんでした。そのため、見ているのはその時々の波の高さにすぎません。ほとんどの時間、波はお城の城壁に数フィート届きません。
3フィート届かないことも、2フィートのことも、4フィートのこともあります。しかしある時、たとえば午後3時50分にいくらか大きな波が来て、城壁の最上部にあるギザギザの部分に何とか跳ねかかり、その後はまたやや低いところにとどまるとします。
もし波の高さを5分ごとに記録するなら図1のようになるでしょう。多少の上下はあっても明らかに上昇傾向にあり、1回だけ異様な外れ値があります。
起点をいつにするかでデータの見え方は変わる
しかし、ちょうど子どものおやつの時間が来たので、あなたは皆を家に帰らせたいと思っているとしましょう。その場合あなたは、実際に潮は来ておらず、お城が壊れるのを待っていてもムダなので、さっさと車に乗り込んだほうがよいと、子どもを説得する必要があります。どうすればできるでしょうか?
とても簡単です。データの起点を決めればよいのです。子どもにはこう言いましょう。「見て、3時50分に潮は26メートルのところまで来た。でもその後50分間、そこまでは来なかった。3時50分以降は、潮は満ちてこなかったよ」と。
この言い方は、潮が同じ高さまで来ることはなかったという点においては真実ですが、誤解を招きます。もし3時50分以外の時刻を起点に選んでいたら、確実に上昇しているからです。
3時50分の異様に大きな波(高速モーターボートが通ったからかもしれませんし、元気な地元のクジラかもしれません)はデータから突出していますが、低いところから高くなっていくという全体の傾向は変わりません。
ティーンエイジャーの自殺率は本当に増えているのか
自分の子どもにそんなことを言うなんて、あなたはかなりの変わり者に違いありません。しかしデータの扱いで、人々はしょっちゅうこれと同じことをしています。
2019年の「サンデー・タイムス」のトップ記事は、「ティーンエイジャーの自殺率はこの8年でほぼ倍になった」と言明しましたが、その記事では、さっきの想像上の父親がビーチでやったのとまったく同じことをしていました(ただし逆向きに)(※3)。
その記事では、イングランドとウェールズにおけるティーンエイジャーの自殺が記録上最も少なかった2010年を起点にしていたのです(※4)。2010年を起点に測定すれば、まさにどの年も自殺率は上昇します(あるいは、2010年以前のどの年を起点に取ってきても、自殺率は下降します)。
結果が分かってから仮説を立てる「HARK」の問題点
起点と終点をいいとこ取り(チェリーピッキング)することは「結果が分かってから仮説を立てる(hypothesizing after results are known)」、略してHARKとして知られているやり方の一例です。
まずデータを取り、その後に点検して面白いことを見つけるのです。気候変動や自殺といったノイズの多いデータでは、まるで波のように、特別な理由なく上がったり下がったりする自然の変動が見られます。
やろうと思えば、異常に高い、または異常に低い点を起点か終点に選んで、上昇または下降傾向を示すのに使うことができます。潮の満ち引きのような長期の傾向を見つけるには、単に最高点と最低点だけを見るのではなく、より深くデータを眺める必要があるのです。
HARKの方法は他にもあります。データのうちどの部分を見るか、言い換えればデータを選択する基準を、好きに選べばいいのです。たとえば前述の自殺の記事ではティーンエイジャー、特に15~19歳を見ていました。
それ以外の年齢では自殺率の上昇は見られなかったのです。また、ティーンエイジャーの自殺はそもそも極めて稀なので、データにわずかでもランダムな変化があると、パーセンテージが大きく揺らぐことがあります。10~29歳の若者一般を見ると、そのような急上昇はありませんでした。
医学学術誌でもHARKが利用されている
気候に関するデータも同じです。確かに地表面の気温は長年、1998年のレベルに達しませんでした。しかし、海面から10フィートのところには、地球の大気全体に匹敵するほどの熱エネルギーが蓄えられています。
これは単なる気象学や自殺報道よりも広範な問題です。HARKは、目新しさへの要求と同様に、科学において非常に大きな問題なのです。
オックスフォード大学のEBM(Evidence-Based Medicine)センターによると、世界でもっとも高く評価されている医学の学術誌に発表された論文でも、臨床試験を登録した後で、求めるもの[検証したいアウトカム]を変更することがしばしばあり、しかもその変更について論文中に明記していませんでした(※5)。
それでは起点と終点を選ぶのと同じようなものであり、研究を成功させるためにまったく異なる選択基準すら選ぶことができてしまいます。アウトカムの変更にはもっともな理由があるのかもしれませんが、p値ハッキングの一種にもなり得ます(加えて、当然ながら、変更したことを論文中に明記すべきです)。
起点と終点が意図的に選別されたデータに要注意
多くの場合、これは回避するのが難しい問題です。データはどこかから始めなければなりませんし、通常は任意のどこかになります。もし数字が何度も大きく変動していたら、低い値を取るか高い値を取るかで、データから言えそうなストーリーが大きく違ってきます。
たとえば、子どもの貧困を改善させたことを示したい政府与党なら、子どもの貧困度が特に高かった年を起点にして「見てください、下がりました」と言いたいでしょうし、野党なら、特に低かった年を起点にして「見てください、上がっているじゃありませんか」と言いたいでしょう。
明らかな傾向があるのか、それとも単にノイズが多くて線がふらつくのかをチェックするのに、より広い視野を持つことが助けになります。しかし、結果がもっとも劇的になるようにデータの起点と終点を意図的に選別するとしたら、誤ったストーリーを語ることになるのはほぼ確実です。
ちなみに、「1998年以降温暖化はない」関連の論文は、2014年、2015年、2016年が、すべてそれまでより暑く、さらに、すべて前年よりもっと暑くなり、恐るべき“記録上最高に暑かった”3年間だったために、ほぼ絶滅しました。
誤ったストーリーを語るために外れ値を選ぶことは、やりたければできます。でも結局は、いずれにせよ潮は来るのです。
[脚注]
※1. Bob Carter, ‘There IS a problem with global warming... it stopped in 1998’, the Daily Telegraph, 2006
※2. David Rose, ‘Global warming stopped 16 years ago, reveals Met Officereport quietly released... and here is the chart to prove it’, the Mail on Sunday, 2012
※3. Sian Griffiths and Tim Shipman, ‘“Suicidal generation”: tragic toll of teens doubles in 8 years’, the Sunday Times, 2019
※4. ‘Suicides in the UK : 2018 registrations’, ONS, 3 September 2019
※5. COMPare, ‘Tracking switched outcomes in clinical trials’, Centre for Evidence-Based Medicine, 2018