平均値にだまされないための「2つの質問」

平均値の話を続けましょう。だまされないコツは、グラフにしてしまうなどすべてのデータが明らかになる状態にすること。これが基本でした。

しかし、現実はそれが難しい場合のほうが圧倒的に多いはずです。そこで、データ全体をグラフにしなくても「なんとなくどんな姿をしているか想像がつく方法」をご紹介します。とても簡単で、今日からすぐにできるテクニックです。

あなたが転職活動中とします。希望する転職先の担当者から、「ウチの従業員の平均年収は600万円とまあまあ高めですよ」という説明があったとしましょう。この「まあまあ高め」という説明をあなたは疑いますよね。

このような場面では次の2つの質問をしてみてください。

Q1「ちなみに中央値はいくらなのでしょうか?」
Q2「最大値と最小値はいくらでしょうか?」

中央値というのは全データを大きい(小さい)順で並べたときにちょうど中央にあたる数字のことです。最大値(最小値)は文字通り全データの中でもっとも大きい(小さい)数字のことです。この質問の意味を理解していただくために、簡単なクイズを出しましょう。

A:{○、△、□、◇、☆}、B:{●、▲、■、◆、★}という2種類のデータがあります。それぞれの記号はある数字を意味しますが、実は私はこの5つの数字を具体的に設定しています。今からヒントを出しますので、AとBでそれぞれどんな数字なのかを想像してみてください。

「平均値」と「中央値」を比べることで実態が見えてくる

Aの中央値は9であり、最大値は1800、最小値は1となります。ちなみに平均値は365です。Bの中央値は360であり、最大値は430、最小値は305となります。ちなみに平均値は365です。さて、あなたはAとBにそれぞれどんな数字が並んでいることを想像するでしょうか。

A:中央値が9、平均値が365
中央値と平均値はあまりにかけ離れており、平均値がいわゆる真ん中あたりの数字という解釈には違和感があります。Aの中にはだいぶ大きな数字が存在し、それが平均値を大きくさせていることが容易に想像できます。

B:中央値が360、平均値が365
逆にこちらは平均値と中央値が近い数字であり、この平均値はいわゆる真ん中あたりの数字というイメージを持っても差し支えないでしょう。