「平均値」と「中央値」と「最頻値」は何が違うか

数学のなかで特にビジネスの現場で活用されているのが「統計」であり、多くのビジネスパーソンも身近な存在として感じているはずである。そうした統計の一例として、誰もが関心を持っているであろう自分たちの「寿命」に関する統計について考えてみたい。

統計ではよく「平均値」が使われる。平均値は統計の代表値の1つで、「平均寿命」も平均値である。そのほか代表値には、「中央値」と「最頻値」があることはご存じだろうか。

まず、平均寿命の計算法を、2016年の「簡易生命表」(厚生労働省)を基に見ていこう。

平均寿命は、その年の各年齢ごとの死亡率から算出する。まず男女それぞれ10万人が生まれたとする。この数に0歳の死亡率(男0.00194%・女0.00198%)を掛けて、男194人・女198人が亡くなって、残り男99,806人・女99,802人が1歳を迎える。

その数にさらに1歳の死亡率を掛けて、男31人・女29人が亡くなって、男99,775人・女99,773人が2歳になる。この計算の繰り返しである。「簡易生命表」では105歳以上がひとまとめになっているので、そこで全員が亡くなると考える。

こうしてできあがった各年齢ごとの死亡者数、それは「2016年の各年齢ごとの死亡率・生存率に従うと想定したときの、男女10万人ずつの各人が生きた年数」であり、その平均値が「平均寿命」なのである。具体的には「年齢×死亡者数」で年齢ごとの小計を計算し、その和(生存年数の合計)を人数(10万人)で割った数字。結果は「男80.98歳、女87.13歳」となり、厚生労働省発表の2016年の平均寿命の値とほぼ一致することがわかる。