統計学ではわからないデータの使い方

プレゼンのために関連がありそうなデータを収集してみたはいいものの、そこから何を読み取ればいいのかわからなくなった、という経験がある方は少なくないのではないでしょうか。

相手を説得するためのデータ・分析と、複雑で精度の高いデータ・分析は、一見同じに見えて、全く異なるものです。

まず知っておかないといけないのは、「データは、目的に対する手段でしかない」ということ。データは、目的に対して適切に使われて、はじめて価値を発揮します。しかし、統計学もデータサイエンスもこの事実を教えてはくれません。

例えば、アイスクリームの製造計画を立てるため、いつごろたくさん売れるのかを知りたいとします。

最新のデータサイエンスを用いて、各月ごとにアイスが多く売れる確率をそれぞれ小数点以下数桁にわたり計算することが可能です。これは「精度の高い」データではありますが、本当に「必要なデータ」でしょうか。

暑い7~9月にアイスクリームがたくさん売れることは、最新のデータサイエンスを用いずともわかることでしょう。「いつごろたくさん売れるのかを知りたい」という目的に対して、この計算は本当に必要なのでしょうか。