「恣意的な微調整」を許すと結果も変わる

「一見体に悪そうなデータ」がいかに当てにならないかを少しだけ解説しておきましょう。

第一に、このガイドラインは「糖尿病がある人には当てはまらない」という但し書きがあります。理由として、「このガイドラインの扱う範囲を超えている」という説明にならない説明が書かれているのですが、ともかく糖尿病がある人のデータは参照されていません。

写真=iStock.com/Suriyawut Suriya
「糖尿病がある人には当てはまらない」という但し書き(※写真はイメージです)

糖尿病の有無によっていろいろな病気のリスクが変わることはありえるので、解析も別にすることはわからなくもありません。

しかし、高血圧でも肥満でもなく糖尿病だけを特別扱いする理由ははっきりしません。

このように恣意しい的な微調整を許すと、実質的には同じデータを、少しずつ条件を変えて何度も解析することになり、たまたま有意差が検出されたように見える確率が上がります(統計学用語では多重性と言います)。

栄養統計は多重性の塊

第二に、引用した図表1のとおり、非常に多くの健康上の指標(アウトカム)について、人工甘味料との関連が検討されています。これもやはり、同じデータを何度も解析しているわけですから、多重性があります。

解析の回数があらかじめ決まっていれば、数学的な調整により多重性の効果を緩和できるのですが、このガイドラインのように既存のデータをあとから解析する場合、理論上無限に後付けの指標を作れます(たとえば「CVD」は研究ごとに定義が違うことで悪名高いものです)ので、多重性は調整不可能です。

同様に、「人工甘味料」の定義をいじって多重性を増やすこともできるし、「人工甘味料の消費量が多いか少ないか」という分けかたを変えて多重性を増やすこともできます。

栄養統計はそうした多重性の塊なのです。