「生存者バイアス」があなたの目を曇らせる
というのも、彼の答えは、「弾痕のない部分の装甲を厚くする」だったからです。
いま、私たちが見ている損傷パターンは、「生還した爆撃機」の弾痕パターンです。つまり、図の部分に当たっても爆撃機は生還できたわけで、逆にいえば、それ以外の部分に当たった爆撃機は生還できなかった、といえます。それなら、その「生還できなかった損傷パターン」の部分の装甲を厚くすればいい、というわけ。
もちろん、「生還できなかった爆撃機」のデータはありません。しかし、「生還できた爆撃機のデータ」からひき算をすれば、推測することができます。
「損傷を受けた部分=見えている部分」にスポットを当てている限り、解決策は出てこなかったというわけですね。このように、見えるデータ(情報)にばかり目を向け、実態を見落とすことを生存者バイアス(バイアス=偏り)といいます。
統計学やビッグデータ解析では、誰もが「存在するデータ」に目をやりがちですが、いくら対策を立てても効果をあげないこともあります。そんなときは、「もしかすると、生存者バイアスに陥っているのではないか?」と疑うことも必要です。
安い・早い・信頼できる・コスパのいい「サンプル調査」
政府や企業は今の傾向を知るためにデータ分析をしています。さまざまなデータをとるためのリサーチをしますが、多くの調査では全数調査(すべてのデータのリサーチ)を行わず、代わりに「サンプル調査」を採用しています。
常識的に考えれば全数調査をするほうがよさそうですが、なぜしないのでしょうか? その理由は、クラスや会社の全数調査ならすぐにできても、国単位や県単位の場合、全数調査をすると、あまりに時間と手間がかかること、さらに費用が莫大になることです。
全数調査の代表は「国勢調査」です。これは5年に1回、実施されますが、2015年の調査費用には650億円かかったとされています。主に地域の自治会や町内会が実際の調査員を出し、調査員に選ばれた人は50~100戸を担当し、国勢調査の説明とその後の回収を担当します。何度伺っても不在の家もありますので、調査員が国勢調査に割く時間はかなりのものとなります(調査員は全国で70万人といわれる)。
その点サンプル調査は、安い、早い、信頼度が高い(高い確率)という、メリットの多い調査方法で、これを支えているのが統計学なのです。
しかし、使い方を誤ると誤解やミスリードも起きるので、注意が必要なんです。それらの事例も、解説していきましょう。