バラつきを見る方法として、ここでは変動係数とヒストグラムを紹介しましょう。

変動係数とは、データのバラつき度合いを示す標準偏差を平均値で割ったものです。

標準偏差とは、それぞれのデータが平均からどの程度離れているかを示した指標。標準偏差が大きいほど平均から離れた値にまでデータが存在しバラつきが大きく、小さいほど平均値周辺に多くのデータが集まりバラつきが小さいことを示します。

ただし、一般的に標準偏差は基のデータの大きさの影響を受けます。1日あたりの平均売り上げ1000万円の店舗と100万円の店舗の標準偏差が同じ30万円でも、同じ意味をなしません。そこで、比較する場合は変動係数を使うのです。

【標準偏差と変動係数で振れ幅を測ろう】

まずはデータのバラつき度合いを示す標準偏差を求めよう。36~50歳の来店者数の標準偏差を求める場合、STDEV関数を使って表のように算出される。標準偏差を平均来店者数で割った値が変動係数。数値が大きいほどバラつきがあることを示す。36~50歳は、ほかの年齢層に比べ振れ幅が著しく大きいことがわかった。

標準偏差
……それぞれのデータが平均からどの程度離れているかを指標にしたもの

=STDEV(データ範囲)

変動係数
……標準偏差を平均で割り、データの大きさによる影響をなくしたもの

ヒストグラムは縦軸にデータの数、横軸にデータの大きさの範囲をとった棒グラフで、バラつきを可視化させたものです。算出した変動係数とヒストグラムからは、36~50歳層は平均値が最低ではないものの、他の年齢層と比べ振れ幅が著しく大きいことがわかります。この店舗の改革はこの年齢層の扱いが焦点になりそうです。

【ヒストグラムでバラつきを可視化しよう】

次はヒストグラムでバラつきを可視化してみよう。最初に度数分布表を作る。上図では横軸に年齢層、縦軸に来店者数を設定し、来店者25人ごとの週の頻度を算出。たとえば36~50 歳で201人以上225人以下の来店者があった週の頻度を求める場合、標準偏差の項で使った上図から範囲を指定し、左上表のように関数を入力。この方法ですべての数値を求めて表が完成したら、棒グラフ化。棒の間隔をゼロにすれば、右上のようなヒストグラムが完成。

ヒストグラム
……データの数を棒グラフで示し、大きさのバラつきを可視化する方法

=COUNTIFS (データ範囲,最初の条件,もう1つの条件)