データと実感の間に「差」が生まれる理由

今回は4人という少ない人数で見たが、実際に「全カテゴリの平均所得が上昇すると同時に、貧しい人が増える」という状態は、景気の悪化局面で起きることがあるのだ。

さて、前述のネットブログは、景気回復の根拠として、どの階層でも平均所得が上がっていることをあげていた。しかしいま見たように、必ずしもそうとは言えないことがわかる。これがデータと実感の差、違和感への答えである。このような「集団全体の性質と、集団を分けたときの性質が異なる」現象を、「シンプソンのパラドックス」と呼ぶ。

ちなみに、今回のカテゴリは500万円を境界線にしたが、400万円にするとどうなるか。元600万円(現480万円)の人も高所得カテゴリに残り、高所得層の平均は「(1120万+480万)÷2=800万円」。低所得カテゴリは「(240万+160万)÷2=200万円」となる。不景気になり、確かに両カテゴリともに平均所得が下がっている。

このように不連続なデータを「カテゴリカルデータ」というが、もともと連続なデータを自分の主張に合わせて区切り方を調整することができる。したがってデータが正しいからといって、その主張が必ずしも正しいとは言えないこともあるので注意したい。

▼編集部おすすめの関連記事
平均年収が高い"トップ500社"ランキング
(構成=田之上 信)