数字に苦手意識を持つビジネスマンは少なくない。ビジネスに役立つ数字や、覚えておくと得する法則を、硬軟織り交ぜて、数字の専門家やビジネスの専門家たちが指南する。

迷惑メールも見分けるベイズ推定

問題です。ある夫婦の間に、女の子が2人続けて生まれました。3人目が女の子である確率は何%でしょうか。統計上、男女の比率はほぼ半々だから、3人目に女の子が生まれる確率も50%に違いないと考える人が多いかもしれませんね。

エルカミノ代表取締役 
村上綾一氏

しかし、最近脚光を浴びている「ベイズ推定」は、従来の確率論とまったく異なるアプローチをします。ベイズ推定では、これまで2人続けて女の子が生まれたのだから、その夫婦から女の子が生まれやすい何らかの理由があると考え、逆確率という方法で確率を導きます。具体的な数式は省きますが、ベイズ推定で考えると、3人目も女の子である確率は約75%。つまり俗にいう「2度あることは3度ある」は75%の確率で起き、逆に「3度目の正直」は25%になります。

実はベイズ推定のもとになる「ベイズの定理」は、イギリス人牧師ベイズによって約250年前に発表されていました。昔の理論がいまになって急に注目されるようになったのは、迷惑メールのフィルタリングにベイズ推定が活用され始めたからでしょう。ベイズ推定では、ひとまず迷惑メールと認定したメールから、単語ごとのスパム確率を推定。例えば「出会い」という単語が入っていれば70%、「恋人」なら40%というように確率を計算して、それを次のメールの判断に適用します。これを繰り返すことにより判定の精度が高まり、さらに新しいスパムメールの流行にも柔軟に対応できます。

迷惑メール判定の例からわかるように、ベイズ推定は少ない情報から確率を推定できる点に強みがあります。この特徴を活かしたのが株式投資予測。例えば朝の買い注文から銘柄が値上がりする確率をベイズ推定によって計算して、投資判断の材料にするわけです。ほかにも今後はマーケティングリサーチへの応用が期待されています。

ベイズ推定なら、「お昼の1時間、ある店舗の顧客の属性をサンプル調査したら女性が55%だった」という少ない情報から、全店・全時間帯の女性の利用率を推定することも可能。伝統的統計手法ではサンプルが足りないといわれる状況でも、ベイズ推定ならそれなりの精度で確率がわかるのです。

ただ実際の計算は少々複雑で、ビジネスマン個人がベイズ推定を直接使うシーンはほとんどないでしょう。ではなぜベイズ推定を推すのか。それは前提となる常識を疑う思考を身につけていただきたいからです。冒頭に解説したように「生まれてくる子供は男女五分五分の確率」という常識も、ベイズ推定で考えると異なる値であることがわかります。ビジネスの世界で頭角を現すのは、みんなが常識として信じている確率を疑い、個別のケースではどうかと考えることができる人。その意味で、ベイズ推定的な思考は重要だと思います。