例えば、出張のホテルを予約する場面を想定しよう。ChatGPTやGeminiに出張先を教えれば、利便性の高い宿泊エリアの候補を回答してくれるだろう。しかし、その先はユーザーの手作業となる。宿泊予約サイトを複数巡り、希望の条件で予算に収まる施設を比較し、個人情報を手で入力して予約を済ませる。AIが行ってくれた作業は、思いのほか限定的だ。

そこで、いまAI開発各社が完成を急ぐのが、パソコン操作を代行するAIエージェントだ。米テックメディアのヴァージによると、Googleは12月にも独自のAIエージェント「Gemini」の次世代版を公開する見込みだという。ChatGPTのOpenAIも、2024年1月に新製品の発表を予定している。

さらに、MetaもAIエージェントの開発を進めており、ChatGPTの対抗馬「Claude」を開発するAnthropicはすでにAPI(プログラムからAIを呼び出す仕組み)を通じて基本的なエージェント機能の提供を始めている。

米AI開発支援企業「スケールAI」のアレクサンドル・ワン最高経営責任者(CEO)は、「AIエージェントにも、対話型AI『ChatGPT』が実現したような画期的な瞬間が訪れるでしょう」と述べ、「汎用的なエージェントが相当な人気を集めるはずです」との見通しを示している。

勝手に「息抜き」も…未完成のAIエージェント

ただし、現状のAIエージェントは完成にはほど遠い。Anthropic社は、Claudeによるコンピューター操作機能のデモンストレーション中、予期せぬトラブルに見舞われた。

ヴァージによると、長時間の画面録画中、Claudeは誤って録画停止ボタンを押してしまい、それまでの映像データが全て消失したという。さらに別のデモでは、プログラミングのデモンストレーション中に、Claudeが突如として作業を中断。イエローストーン国立公園の写真を閲覧し始める始末だった。ある意味で人間らしいと言えるだろうか。

こうした予期せぬ動作は、Anthropic社の研究者たちにとっても想定外だったという。ヴァージによると、同社は現在のClaudeについて、画面のスクロールやドラッグ、ズームといった基本的な操作でも困難を抱えていることを認めている。

ソフトウェア開発者
写真=iStock.com/MTStock Studio
※写真はイメージです

旅行予約サービスでは、すでにアルファ版が提供中

とはいえ、紆余曲折がありつつも、自動化の流れが止まることはなさそうだ。米テックメディアのテック・クランチは、世界最大級の旅行予約サイト「エクスペディア」の元上級副社長であるマイケル・グルマン氏が、AIを活用した出張予約サービス「Otto」を立ち上げたと報じている。

グルマン氏は同サイトの消費者向け製品部門のトップを務めた経験を活かし、自然言語による航空券やホテルの予約処理システムを開発。たとえばルーフトップバーのあるホテルを探すなど、エクスペディアならば検索条件も存在せず、検索に苦労するようなホテルも容易に見つけるという。