“想定外の利用”を恐れて規制が厳しくなっている
文章であれ、画像であれ、生成AIに望み通りの内容を出力させるためには指示を工夫する必要がある。時に“呪文”などと呼ばれることもあるが、インターネット上ではさまざまな工夫がシェアされているのはよく知られているところだ。
ところがアーニーボットはその“呪文”への反応が鈍く、また工夫を積み重ねていると、前述の「AI言語モデルである私はこの問題にどのように答えるのか、まだ学習しておりません」という文言で出力を拒否されてしまう。不正利用ができないような設定が強化されていることは一つの要因だろう。間違っても習近平総書記の悪口や中国共産党を批判するような文章を作らないようにとの配慮だ。一つ間違えば、サービスそのものがお取り潰しになりかねないだけに慎重を期すのは理解できる。
ただ、それだけではない。どうやら中国の生成AIは今、壁にぶちあたっているのだという。
「すでにアメリカを超えた」と豪語していたが…
冒頭で述べたとおり、中国は米国と並ぶAI大国である。その強みを確認しておこう。
AIの開発にはアルゴリズム、コンピューティングパワー、データという3つの要素が必要になる。このうちアルゴリズムは論文やオープンソースソフトウエアとして公開されるため、後発国でも追いつきやすい。コンピューティングパワーはGPUメーカーのNvidia(エヌビディア)を筆頭に米国企業が圧倒的なシェアを握るが、中国はその製品を購入すればことは済む。
そして、データだ。データ関連の法規、規制が緩く、企業がデータを入手しやすい。IT企業の事業分野が広く、幅広いデータを収集できることも強みだ。さらに辺境の農民など低賃金の労働者が多く、アノテーション(データへのタグ付け)に関するコストが安いことも相まって、この点では他国を上回る優位性を持っている。
元グーグル中国総裁にして、生成AIスタートアップ「Project AI2.0」を今年創業した李開復(リー・カイフー)は著書『AI世界秩序 米中が支配する「雇用なき未来」』(日本経済新聞出版、2020年)で、「(AIビジネスに取り組む中国の)企業家集団は、中国テクノロジー界のもう一つの“天然資源”、すなわち、有り余るほどのデータにアクセスできる。中国のデータ生産量は、すでにアメリカを超えた」と指摘し、AI開発競争では中国が優位に立つとの見通しを示していた。
ところが、今、この強みが失われている。