ChatGPTより透明性が高い
英ガーディアン紙は、DeepSeekの高度な画像認識能力に注目。小規模なモデルながら、他者の先進的なAIと同様、スマートフォンで撮影した本の写真を解析し、その内容について対話するなどを高い品質でこなしたという。
また、シェイクスピア風の14行詩(ソネット)を生成する際にDeepSeekは、詩の構造や韻律について、システムの思考過程を順を追って表示したという。
一方、ChatGPTの最新モデル「o1」にもソネットの生成を求め、思考過程を示すよう指示したところ、最初は使用ポリシー違反だとして断られた。繰り返し求めると、「韻を調整中…」など実行状況を表示するようになったが、生成された詩は五歩格(韻律)に多少の不整合が見られた。DeepSeekの方が思考過程の透明性があり、結果の品質も高いとの結果になったようだ。
イギリスの人工知能研究の中核を担う英アラン・チューリング研究所のロバート・ブラックウェル上級研究員は「ゼロの状態から、これほどの競争力を持つまでに成長した」とDeepSeekの急速な進化に驚きを示している。
アメリカが出し抜かれた…「スプートニク・モーメント」の到来
DeepSeekは従来の常識を打ち破った。性能の低いチップを少数使用しながら、独自の工学的手法を駆使。ニューヨーク・タイムズ紙によると前モデルの開発費用は、AI開発としては非常に少ない550万ドル(約8億3000万円)であった。
小規模モデルで大規模モデルと同等以上の性能を実現していることから、同紙は、AI産業における「スプートニク・モーメント」、すなわちアメリカが技術・軍事力で他国に出し抜かれる決定的瞬間になった、との見方があると報じている。
なぜ軽くて賢いのか。高性能の秘密を、Apple社のAI研究チームが明らかにした。テクノロジー専門メディアのZDNetが詳しく報じている。
記事によると、DeepSeekが優れた効率性を実現できている理由は「スパース(疎性)モデリング」という技術にあるという。この技術は、実質的に結果にほとんど影響しない処理を特定して省き、計算速度を高速化する。
具体的には、ニューラルネットワークの「重み」または「パラメータ」と呼ばれる構成要素のオン/オフを制御し、結果に影響しない範囲で処理を軽量化する。これらのパラメータは、入力されたプロンプト(指示文)からテキストや画像を生成する方法に直接関与するため、計算時間に大きく影響する。
ただし、スパース・モデリング自体は目新しい技術ではない。半導体大手のインテル社など、多くの企業がこれまでも研究を重ねてきた分野だ。DeepSeekは既存技術を効果的に取り入れ、AIにブレイクスルーをもたらした。