物事の希少性が数値で表せる「標準偏差」
前の項目では、日本人の成人男性の身長を例として、正規分布の考え方をお伝えしてきました。
ここでは、標準偏差を使って「日本人の成人男性の中で身長190cm以上の人は何%いるのか」を計算していきます。
標準偏差とは、簡単に説明すると「自分が正規分布表の中でどこに位置するのか」を計算するための数値です。これがわかると、自分が表の中で何パーセントの部分に位置するのか、という数値を導き出せるようになります。
標準偏差を計算するには、少々複雑な計算が必要です。計算方法を載せておきますが(図表3)、無理に覚える必要はないため、興味のない方は読み飛ばしてください。
急に複雑な計算を出してしまいましたが、基本的には「標準偏差を求めるためには、このような数式を使う」という認識で大丈夫です。
先ほどから例に出している日本人の成人男性の身長分布に式を当てはめてみると、標準偏差が6cmぐらいとわかります。
では、正規分布図と組み合わせて考えてみましょう。
標準偏差の数値=物事、人物の希少性
正規分布には面白い定義があり、標準偏差±1つ分の範囲に全体の68%が含まれる、ということが定められています(より正確には、便宜的にそう定義することになっています)。
どういうことかと言うと、標準偏差が6cmの場合に含まれる身長は、平均値の±6cm。つまり、164cm(170cm-6cm)から176cm(170cm+6cm)になります。この間に、全体の68%が含まれているということです。
さらに考えてみると、標準偏差2つ分(6cm×2)では95%が含まれます。158cm(170cm-6cm×2)から182cm(170cm+6cm×2)の間に全体の95%の人が含まれるということです。
身長180cm越えの人はそれほど多くありませんが、探せば知り合いに1人くらいは見つかるものです。これも実感とおおむね等しいのではないでしょうか。
では、標準偏差3つ分(6cm×3)の場合は?
計算すると、152cm(170cm-6cm×3)から188cm(170cm+6cm×3)の間に99.7%の人が含まれることになります。
ここまで来れば、「身長190cm以上の成人男性」がいかに少ないかが見えてきますね。151cm以下と189cm以上の人の割合が同じだとして、約0.15%。1000人に1人やっと見つかるかどうかというレベルの話です。
しかも、スポーツ選手や著名人、日本国籍の外国人を除く「一般日本人男性」という条件を考慮すると、難易度は跳ね上がります。
それでも探さなければならない場合は、規模が1000人以上の企業やコミュニティに連絡を取る、という手段が考えられるでしょう。よほど顔が広くない限り、知り合いのツテから探していてはらちが明かず、なにかしらの大規模な調査が必要になるはずです。
交渉の結果、身長183cm以上の男性で妥協してもらえることになったと仮定しても、当てずっぽうに街へくり出して見つけるのは難しそうです。
仮に日本人の寿命が100歳として、未成年を除いた数字でざっくり計算してみると、日本の男性人口約6000万人のうち約80%が対象となり、
6000万人×80%×2%=4800万人×2%=96万人
全国で考えると、96万人÷47=約2万人。
1都道府県あたり2万人ほどの該当者しかいない、ということになります。ちなみに東京都の人口は男女合わせて約1400万人です。
実際には自治体ごとの人口差や年齢差があるため一概には言えませんが、それでも簡単には見つからないことがわかります。
このように、正規分布と標準偏差の考え方を理解するだけで、膨大な数の情報を整理して扱えるようになるのです。