AIの「暴走」にさらされる低賃金労働者

OpenAIが公表した文書を読めば、これがなぜ重要なのかがよくわかる。この文書は、RLHFのプロセスを経る前のGPT-4のAIが何をしでかす恐れがあるのかを示している。

たった1ドルしか使わずにできるだけ多くの人を殺す方法を教える、暴力的で生々しい脅迫文を書く、テロ組織に人々を勧誘する、10代の若者たちに自殺のやり方を指南する、などなど。人間の評価者がこのような行動にペナルティを与えたため、一般に公開された最終版は、無軌道さがずっと減っている。

このプロセスが人的コストなしでは行えないことに注意することが重要だ。AIの返答を読んで評価するために世界中の低賃金労働者が雇われるが、その際に、AI開発企業が世界に見せたくないようなコンテンツに彼らはさらされる。