300万人のサンプルから相関を導き出す

70個しか見つかっていなかったSNPが、いきなり1200個以上になったのを不思議に思う人もいるでしょう。

世界各地にはゲノム情報と共に各種の身体的・生理的特徴、生体サンプル、生活状態などの情報を大規模に収集しているバイオバンクとよばれる研究事業があります(イギリスのUKバイオバンクなど)。また23andMEのような遺伝子検査サービスも大規模なデータベースをもっています。

こうしたデータベースには学歴も基本情報として登録されており、それらを合わせると100万人以上のデータになります。そこで知能と0.5の相関がある学歴データも知能の指標として使えることに気づいた研究者がいました。このデータをGWASにかけることで一気に研究が進んだというわけです。さらに2022年の最新の論文では、サンプルがさらに300万人に増え、その説明率は16パーセントにまでなりました。

UKバイオバンクなどのデータから学歴についてのポリジェニックスコアが算出され、これを用いた研究も進んでいます。中でも大きな注目を集めたのが、アメリカの行動遺伝学者キャサリン・ハーデンらが2020年に発表した研究です。

研究対象となったのは、1994年、1995年から4年間、アメリカの高校に在学していたヨーロッパ系の生徒3635人。アメリカの高校では難易度によって数学のコースが分かれているのですが、ハーデンらは学歴に関するポリジェニックスコアが最終的な学歴にどう関係しているのかを調べました。

学歴スコアが高い生徒は、どんな学校にいても優秀

9年生(日本の中学3年生に相当)の時点で、学歴ポリジェニックスコアが高い生徒ほど難易度の高い数学コースから始めており、高校卒業後にはカレッジ、さらには大学院に進みます。途中で脱落する人もあまりいません。

講義を受ける学生
写真=iStock.com/kazuma seki
※写真はイメージです

これに対して、学歴ポリジェニックスコアが低い生徒は、9年生時点で難易度の低いコースから始めて、途中で脱落することが多くなります。一番下のグレードから始めた生徒で、最終的な学歴がカレッジ以上の生徒はいません。これは私もさすがになかなか怖い研究結果だと感じています。

この研究では、生徒のSESとの関連についても調べています。SESとはSocio economic Statusの略で、学歴、収入、職業などを組み合わせて算出した社会経済状況のことです。その学校に通う生徒のSESの平均が高いか低いかに関係なく、ポリジェニックスコアの高い生徒は数学のトレーニングに取り組みます。

SESの低い生徒が多く通う学校の場合は平均もしくは低スコアの生徒は脱落しやすく、SESの高い生徒が多く通う学校ではポリジェニックスコアが非常に低い生徒だけが脱落してしまいます。要するに、ポリジェニックスコアの高い生徒はどんな学校でも優秀だけれど、スコアが平均あるいは低い生徒に関しては学校の良し悪しが関係してくるということです。

現在のところ学歴ポリジェニックスコアによる効果量は12~16パーセント程度ですが、今後分析対象のデータが増えてきたり他のデータとの相関を調べたりすることで、効果量は上がっていくと考えられます。