提携を初めに報じた米技術専門誌のMITテクノロジーレビューによると、ココはすでにアメリカの主要都市やヘルシンキで約1000台のロボットを走らせ、ピザや食料品を届けている。ただ、歩道を時速約8キロで進むロボットを都市部で正確に走らせるのは一筋縄ではいかない。

ナイアンティック・スペーシャルのブライアン・マクレンドンCTOは、「都市の谷間(アーバンキャニオン)はGPSにとって世界最悪の環境だ」と指摘する。高層ビルに挟まれた街路ではGPS信号がビル壁面に反射し、位置表示が最大50メートルもずれることがある。マクレンドン氏は、「それだけで別の街区、別の方向、あるいは道路の反対側に立っていることになる」と続ける。これでは全く違った家にピザを届けかねず、配達の経路の移動にも支障が出る。

この難問に頭を抱えていた同社に、思いがけない突破口が開いた。ポケモンGOのプレイヤーが知らず知らずのうちに撮りためた、膨大な都市の風景。その視覚情報を土台にした、正確な測位技術だ。

ポケモンGO
写真=iStock.com/Wachiwit
※写真はイメージです

同じ場所の写真が大量にある強み

MITテクノロジーレビューによると、ナイアンティック・スペーシャルがモデルの訓練に用いた画像は、実に300億枚にのぼる。主な情報源となったのは、ポケモンのバトルアリーナなどゲーム内の重要拠点、いわゆるホットスポットだ。その数は世界で100万カ所を超える。

各拠点ごとに、ユーザーによって違う角度・時間帯・天候で撮影された画像が、数千枚単位で存在する。その1枚1枚に、スマートフォンの位置・向き・傾き・移動速度・方向などが、詳細なメタデータ(付随情報)として記録されている。

同社CTOのブライアン・マクレンドン氏は、「立っている場所が数センチという精度でわかります。中でも最も重要なのは、どこを見ているかがわかることです」と語る。配達ロボットの制御には、現在の緯度経度を示す位置情報だけでは足りない。その点、カメラがどちらの方向を向いているか正確に判明しているポケモンGOのデータは、貴重な学習リソースとなった。

膨大な画像数ゆえに、2Dの画像から都市の建物の立体形状を推定することも可能になった。米テクノロジー情報サイトのテックスポットによれば、市街地の交差点や店舗、建物外壁といった特徴的なポイントを、複数の角度から撮影された画像をサンプリングし、立体構造を捉えるマルチビュー3Dを生成できるようモデルを訓練した。

データの充実したホットスポットで学習を重ねた結果、ホットスポットから離れた未知のエリアでも、わずかな画像から正確な位置と向きを割り出せるようになったという。