「世界を理解するAI」の時代へ

本稿では、CES2026で見えたこの変化を、個別技術の解説ではなく、デモの羅列でもなく、「構造」として読み解く。具体的には、フィジカルAIの全体構造(横軸×縦軸)、その中枢にあるWFMの正体、エヌビディアとテスラという2つの実践モデル、そして、日本企業がどこを担うべきかを、一気通貫で整理する。フィジカルAIの時代とは、ロボットの時代ではない。世界を理解するAIが、産業と社会の中枢に入り始めた時代である。CES2026は、その始まりをはっきりと告げていた。

【注】本稿でいうWorld Foundation Model(WFM、世界基盤モデル)は、ロボット工学の分野で議論されてきた視覚・言語・行動を統合する基盤モデルを技術的に包含したうえで、その射程をロボット単体に限定せず、自動運転や工場といった複数の実行体に共通する世界理解の中枢として再定義した概念である。各実行体は、この共通の世界理解に接続することで、身体や役割の違いを超えて一貫した判断と行動を生成できるようになる。

なお、WFMという用語は、エヌビディアが自社の取り組みを説明する際に明示的に用いている概念である。一方で、テスラをはじめとする他の先進的企業は、必ずしも同一の用語を使用してはいないものの、物理世界の構造や因果関係を統合的に学習し、複数の実行体(自動運転車、ロボット、工場システム等)に共通の世界理解を提供するという点において、構造的に同型のアプローチを採用している。

本稿では、こうした用語上の違いを超えて、「物理世界を横断的に理解し、その理解を多様な実行体に供給する中枢知能」という構造的共通性に着目し、エヌビディアが明示的に提示するWFMのみならず、テスラのように別の表現や実装形態をとりながら同等の世界理解構造を内包する取り組みについても、分析概念としてWFMと総称している。これは特定企業の用語を拡張して流用するものではなく、フィジカルAI時代に出現しつつある世界理解AIの共通構造を抽象化した分析枠組みとしてWFMという呼称を用いている点を、あらかじめ明確にしておきたい。

ここで重要なのは、フィジカルAIの競争を「ロボット市場の競争」として捉えた瞬間に、私たちが“誤ったゲーム”を戦い始めてしまうという点である。エコシステム・ディスラプション論が示す通り、勝敗を分けるのは既存ゲームの中での勝利ではなく、価値構造そのものの組み替えである。WFMを中枢に、ロボット・自動運転・工場・倉庫が単一の構造へ収束し始めている現在、競争の単位は「製品」でも「市場」でもなく、最小成立する新エコシステム(MVE=Minimum Viable Ecosystem、単体の製品やサービスではなく最小構成で自走できる価値循環を成立させた生態系の最小単位)をどこで作り、どの順序で拡張するかへ移っている。

CES2026において筆者撮影
CES2026において筆者撮影