さらに覚えておきたいのが、平均値・中央値の違いである。たとえば、世界の貧困率という数値が算出されているが、貧困率とは、世帯の所得が、中央値の半分以下である人々の比率のことである。

たとえば世界の6000万世帯を想定すると、上から3000万番目、下から3000万番目の人の所得が中央値である。その人が年収400万円だとすると、その半分である200万円以下の世帯の比率が貧困率ということになる。

この場合、中央値は平均値にはならない。なぜなら、前述のべき分布だからだ。正規分布しているなら中央値も平均値も同じだが、べき分布している統計で平均値を取ると、上に引っ張られてかなり高くなってしまう。こういう場合は、中央値を取って初めて意味がある。

会社内で、営業マン一人当たりの売り上げを見る際は、まず営業成績のよい人と悪い人を分けてみて、その分布を確認してから、平均値で出すほうがいいか、中央値で出すほうがいいかを判断する必要があろう。

サンプル調査を行う際は、サンプルがどのくらい必要かを見極めたり、サンプルにバイアスがかかっていることがあるので注意が必要だ。

ネットで調査を行う際によくいわれるのが、たとえば貧困国で調査すると、ネットを使っている人じたいが富裕層ばかりだから、信憑性に問題が出てくるということ。政府の世帯調査では、公務員を完全に外している調査もあれば、逆に調査しやすい公務員が数多く含まれるものもあるので、参考にする際はそこをチェックしておこう。

統計データは、サンプルの扱い方によっても結果が変わる。安倍内閣のいう2%のインフレターゲットに関連して、当の消費者物価指数をどうやって計算しているかを見てみよう。

たとえばパソコンなど家電製品やスマートフォンの機能を、価格を据え置いたまま向上させることがよくあるが、実はそれは「価格が下がった」と見なされるのだ。2本100円だったバナナを4本に増やしても変わらず100円なら、「バナナの価格は下落した」と見なすのと同じ考え方で、16ギガのメモリが32ギガに上がっても、価格が変わらないなら価格は下落したことになる。実はこうした事柄も、消費者物価指数を押し下げる一因となっているのだ。