※本稿は、緒方憲太郎『ボイステック革命 GAFAも狙う新市場争奪戦』(日本経済新聞出版)の一部を再編集したものです。
日本のハード産業は「残念な状況」
【宮坂】僕は、グループ通話ソリューションを手掛けていて、ワイヤレスイヤホンも作っているんですが、日本のハードウェアはすごく残念な状況ですね。日本に住んでいると、ソニーもオーディオテクニカもあるし、「日本のブランドってオーディオデバイスはそこそこいいんじゃないか」と思っちゃいますが、グローバルではほんとに存在感がないんです。基本的にアップルのAirPods(エアポッズ)が圧倒的に強くて、ワイヤレスイヤホン市場の半分ぐらいを取っている。あとは中国や韓国、そして日本のメーカーが残りの市場を分け合ってるという感じです。
昔は日本のコンシューマーエレクトロニクス(家庭用電化製品)は世界で強かったけど、今はかなりシェアが落ちているし、技術も追いつかれている。イヤホンについては、国内でちゃんと作れる工場がほとんどないんですよ。産業の空洞化が進んで、中国や台湾、韓国に出てしまっています。
ワイヤレスイヤホンの中に入っているBluetoothチップセットは、アメリカのクアルコムが圧倒的なシェアを持ってるんですが、日本にはクアルコムのファームウェアを作れる人がほとんどいない。イヤホンのハードも中のソフトも作れる人がいないんですよ。ほんとに残念です。
このビジネスを始めた最初の頃は、せっかく日本からこういうイヤホンを作るんだから、できれば「メードインジャパン」でやりたいと思ったんですが、できないんです。
「高くなるから」とかそういう問題ではなくて、「できない」。
僕も、昔の「ものづくりと言えば日本」みたいなイメージがあったので、日本発でハードを作るならアドバンテージがあるんじゃないかと思ってたんですが、むしろ逆だったという……。中国の深センで作った方が早かったかもという感じがします。悲しいですよね。
日本語が参入障壁に
【緒方】ハードの面では日本は苦しい状況ですね。テクノロジーの面ではどうでしょうか。
【金子】音声合成技術や音声認識技術の分野は言語依存が大きいので、これは日本にとって強みにも弱みにもなります。私は、音声合成技術を手掛けるコエステにいるんですが、コエステが海外展開をやろうとすると、言葉の壁があるのでそう簡単ではないです。でも、グーグルやアマゾンみたいな資金力があるグローバル企業でも、日本語の市場はそう簡単にコエステに勝てないんですよ。言語が参入障壁になっている面もあるわけです。
【八木】スマートスピーカーも言語の壁のせいで、日本展開ってだいたい英語圏から3年くらい遅れてますよね。グローバルの音声系サービスは、グローバル展開するとしてもだいたい日本市場は最後みたいなことが多い。
【金子】そうなんですよ。日本語って結構特殊なんですよね。いろんな言語の中でも特に難しいんです。
【八木】漢字とカタカナとひらがなが混じると、もう歯が立ちません。
音声の「閲覧性の低さ」をどう解消するか
【金子】強みとしては、日本独自のエンタメコンテンツがある気がします。
日本では声優さんがすごく人気があります。海外では声優さんって日本ほどの人気がありませんが、日本の声優は海外でも人気があったりします。「声優文化」があるというか、声に魅力を感じて、声にエンタメ性を持たせているところがあるので、これからはそこが日本独自の強みになっていくんじゃないでしょうか。
【緒方】ボイステック関連の海外企業で、気になるところはありますか。
【金子】やっぱりグーグルやアマゾンの動きは気になりますね。
【宮坂】僕はあえて言うならポッドキャストの分野かな。海外の方が、ポッドキャストのエコシステム(業種・業態を横断した協業で共存共栄していく仕組み)が進んでいますよね。
その中で目立つのはスポティファイです。ポッドキャスト関連の企業をたくさん買収して力を入れている。それ以外にも、新しいいろんな会社がポッドキャストエコシステムを作っていて、新しい体験を生み出しています。
例えば、音楽だと最初の3秒くらい聞けば好みの音楽かどうかがわかるけど、ポッドキャストは、結構聞かないとおもしろいかどうかがわからない。そういった、「閲覧性の低さ」みたいなものがあるわけですが、そこでAIとかを使って、自動的にポッドキャストのハイライトだけ切り取り、ニュースフィードのようにどんどん出してくれて、新しいポッドキャストを発見できるというアプリがあるんです。
僕は結構ポッドキャストを聞くんですけど、サブスクライブ(登録、フォロー)している番組があんまり増えないんですよ。新しいものをなかなか見つけにくい。そういうディスカバラビリティというか発見しやすさみたいなところに問題があると思ってたんです。でも、ちゃんとそこを解決してくれるテクノロジーやサービスが出てきている。エコシステムがリッチなんだなと思います。
「人と対話する」音声広告の世界
【八木】僕は広告屋なので、広告テクノロジーの会社が気になるんですが、シリコンバレーにInstreamatic(インストリーマティック)という、対話型音声広告を作っている企業があります。
音声広告を流した後、広告バナーが出せるような媒体なら、聴き手は興味があればクリックできますが、バナーが出せない場合は、音声広告を聴いても「こんなのがあるんだ」で終わってしまう。
対話型音声広告の場合は、音声広告を流した後、「はい」「いいえ」で答えられるような質問があるんです。例えば、コーヒーショップの音声広告の後に、「いいコーヒーがあるんですが、クーポンが欲しくないですか?」という質問が流れて、視聴者が「はい」か「いいえ」と音声で答える。すると、それを認識して、「はい」と言った人にはクーポンのURLを送ってきて、「いいえ」と答えた人には「そうですか。さようなら」と応答してくる。
今、ワイヤレスイヤホンを耳に挿しっぱなしの人が増えていますが、マイクがついていないものが多い。もしマイクがついているものが普及すれば、こういった体験もできるのでおもしろいですよね。
耳元にAIが常駐する日常
【金子】僕は、そういう世界を作りたくてコエステをやっているんです。これからAIが進歩すると、AIアシスタントみたいなのが、イヤホンだけでなく、いろんなものに宿るようになると思うんです。今までなら、例えば来月引っ越ししたいとなると、まずネットで検索して安いところを探したりという行動をとりますが、耳元にAIアシスタントがいれば、「引っ越し業者を探しておいて」って頼める。「A社が今キャンペーンをやっていて安くなっていますから予約しておきましょうか?」「おねがい」みたいな世界になっていくと思うんです。
そうすると、AIと会話する中で自然に広告が差し込まれるようになるでしょうね。「お疲れのようですから、コーヒーを買っておきましょうか」「よろしく」と。このときのコーヒーは、実は広告なんですね。でも、あまり広告だとは思われず、ネガティブな印象を与えない。自分に必要な情報が適切なタイミングに提供されて、「よろしく」と言うだけで実現できるわけです。
その中で、やはりせっかくなら自分の好きなアイドルに話しかけてもらった方がうれしいじゃないですか。しかも、音声合成の技術を使えば、「○○さん、お疲れ様」と名前を呼んでもらったりもできます。
好きなアイドルが勉強を応援
【緒方】「俳優の佐藤健さんが話しかけてくれる」とか人気が出そう(笑)。
【金子】前に女子高生を対象に、「コエステの技術を使って、こういうサービスがあったらいいなと思うものを考えてみましょう」というワークショップをやったんですが、「勉強がつらいときに、好きなアイドルの声で勉強を教えてくれるとうれしい」というアイデアが挙がってましたね。勉強の合間に、「○○ちゃん、あと30分だけ頑張ろう!」と、応援してくれたり励ましてくれたりする。
【一同】(笑)。
【宮坂】おもしろい! でも、危ないところもありますよね。ディープフェイクみたいなのが出てきそう。オレオレ詐欺が進化して、本当に息子の声を合成して騙す。
【金子】実はコエステは、科学警察研究所にも協力しているんですよ。これから音声合成を悪用した犯罪も出てくるだろうということで、警察も、今のうちから研究しておく必要があると考えているようです。
【八木】すごいですね。
【金子】あと、コエステの音声には、人間の耳では聞き取れないような信号が埋め込まれているんです。いわば音声ウォーターマーク、電子透かしのようなものです。それをやっておかないと、やっぱりオレオレ詐欺とかに使われたときに判別できなかったりしますから。犯罪対策もやっているんですよ。