データを正しく読み解くにはどうすればいいか。データ分析・活用コンサルタントのサトウマイさんは「2018年度の日本のプロ野球選手(NPB)、プロサッカー(J1)、プロバスケットボール選手(B1)の生年月日を収集して結果を見たところ、4~9月生まれが多く、1~3月生まれが少ない傾向があった。データを見ると、『春に生まれた子どものほうがスポーツ選手になりやすいのか?』と思うが、『春に生まれる→スポーツ選手になりやすい』という直接的な因果関係はない。このように相関関係を因果関係と混同してしまうのは『錯誤相関』である」という――。
※本稿は、サトウマイ『はじめての統計学 レジの行列が早く進むのは、どっち⁉』(総合法令出版)の一部を再編集したものです。
数字はウソをつかないが、人間はウソをつく
クイズです。以下の中で、正しいものはどれでしょうか?
①警察官が多い地域は、犯罪件数が多い
②アイスが売れる日は、水辺で事故がよく起きる
③体重が重い小学生ほど、足が速い
②アイスが売れる日は、水辺で事故がよく起きる
③体重が重い小学生ほど、足が速い
答えは、「すべて正しい」です。
「え、そうなの?」と思った方、統計のトリックに騙されています。世の中には、「これをすればこうなりますよ」というような、謳い文句であふれています。
しかし、それをそのまま鵜呑みにしてはいけません。
ご丁寧に、モニターさんのビフォーアフターの写真が載っていたら、「私もこうなれるかも!」と信じてしまいがちですが、一旦立ち止まりましょう。データそのものは正しくても、見せ方ひとつで、人の印象を操作することができるからです。
数字はウソをつきませんが、人間はウソをつきます。
データ社会では、数字のウソを見破れるようにならなければいけません。空き巣の対策を取るなら空き巣の手口を知る必要があるように、数字に騙されないためには数字による騙し方を学ぶ必要があるのです。