生成AIが話し相手になる時代がやってきた。人間同士の会話とAIとの会話で、最も異なる点は何か。『言語学者、生成AIを危ぶむ 子どもにとって毒か薬か』(朝日新書)を出した川原繁人さんは「人間言語と生成AIの重要な違いが、前者は『音』から学ぶのに対して、後者は『文字』を訓練データとする点だ」という――。
子供のもつスマートフォンに映し出されたロボット
写真=iStock.com/cheangchai4575
※写真はイメージです

「Cotomo」とのおしゃべり動画を視聴してみた

2025年4月現在、AI「しまじろう」が正式にリリースされましたが、そこでできるやり取りはまだ「しりとり」や「クイズ」など単純なものに限られていて、「会話」と呼べるほどのやり取りはできません。本書執筆時点では、これからどのような機能が追加されていくかはわかりません。

一方で大人向けの「Cotomo」という「音声会話型おしゃべりAIアプリ」が公開され、使用が広く始まっています(*1)

このアプリは12歳以上が対象で、「名前」「声の種類・テンポ」「アイコン」を設定することができ、主に「おしゃべり相手」として提供されています。高齢者が使用することで認知症予防につなげる効果も期待されており、その応用に関する研究もなされているようです(*2)

Cotomoは大人向けではありますが、生成AIと人間がおしゃべりした時、具体的にどのような問題が生じるのか観察し、考えるための題材になりそうです。そこで、著名人がCotomoを使用した動画がYouTubeでいくつも公開されていたので、私も視聴してみました。

子ども向け対話型アプリについて考える

私自身がCotomoを試してもよかったのですが、公開されている動画を分析することで、読者の方々にもCotomoの性質を「客観的に」検証してもらえる、という利点がありました。

また著名人が使用した動画が複数個YouTubeに上げられていることから、現在、それなりに広く知られたアプリであることも想定されますので、その点からも、分析の対象として有用だと感じました。Cotomoは十二歳以上が対象ですが、本稿の分析はあくまで将来的にリリースされる可能性のある子ども向け対話型アプリについて考えるためのものです。

そもそも、私はおしゃべりアプリに対して批判的な意見を持っていますので、私がCotomoを使用してもバイアスのかかった判断をしてしまうことが予期されました。しかし、動画を基にすれば、生成AIに対して必ずしも批判的な意見を持っていない人々がおしゃべりアプリと接した時の反応を観察できると考えたのです。

というわけで、本稿の分析は、具体例としてお笑い芸人さまぁ〜ずによる『【凄すぎAIとトーク】今話題のcotomoにビックリ!普通に話せる‼』を題材としました(*3)。さまぁ〜ずは、三村みむらマサカズさんと大竹おおたけ一樹かずきさんによるお笑いコンビです。