データの「定義・意味」「傾向」をチェックする

わたしは長年の経験で「間違っていないデータはない」と考えています。

機械の不具合、人間の勘違い、入力ミス等で誤ったデータが紛れ込むこともあれば、「定義」「意味」が違ったせいで、誤った解釈でデータを捉えることもあります。

データが間違っていないか、チェックする際は、

①定義・意味の確認
②傾向の確認

をすると良いでしょう。

定義・意味の確認は意外と忘れがちなので、分析に取り掛かる前に必ず確認するくせを付けた方が良いでしょう。

例えば、スイーツカテゴリの売上が昨年比50%減だとわかったとします。

しかし、実はその原因は、主力商品の「フレンチトースト」が、今年からスイーツカテゴリではなく、ランチカテゴリで集計することになったからだった、みたいな話がよくあります。

定義・意味の確認をすることで、こうしたミスを防げるようになります。

傾向の確認をするには、手元にある数字の内訳を見ます。

例えば、あるスーパーの購買データを分析するにも、時間別の売上、売れ筋商品の傾向を知っておけば、購買データ1件1件を見ずとも「だいたい、こういう傾向にあるな」と判断が付きます。