DeepSeek、待望のAIモデル「DeepSeek-V4」を発表。100万文字規模に対応、性能はClaude 4.5超え

注目を集める中国の人工知能(AI)企業「DeepSeek(ディープシーク)」が4月24日、次世代モデル「DeepSeek-V4」(プレビュー版)を正式に発表し、同時にオープンソースとして公開した。前世代モデル「R1」のリリースから15カ月ぶりの刷新となる。

V4は100万文字規模の超長文コンテキストに対応。エージェント能力、世界知識、推論性能の全ての面において、中国国内およびオープンソース分野をリードしている。今回リリースされたV4シリーズには、高性能な研究開発向けのV4-Pro(総パラメータ数1兆6000億、アクティブパラメータ数490億)と、経済的で効率的なデプロイメント向けのV4-Flash(総パラメータ数2840億、アクティブパラメータ数130億)の2つのバージョンが含まれる。

「外部資本拒否」から転換——DeepSeek、評価額100億ドル超で初の外部資金調達か

公式による評価結果によると、V4-Proはエージェント能力、数学、STEM(科学・技術・工学・数学)、競技コーディングなどで、公開されている全てのオープンソースモデルを上回っている。V4-Proは世界知識の蓄積量は米グーグルの「Gemini-Pro-3.1」に次ぐ水準、エージェントコーディングの性能は米アンソロピックの「Claude Sonnet 4.5」を上回り、出力品質はアンソロピックの「Claude Opus 4.6」の非思考モードに迫るものの、同モデルの思考モードと比べると依然として差がある。

また、DeepSeekはV4シリーズがすでにファーウェイ(華為技術)のAIチップ「Ascend(昇騰) NPU(ニューラルネットワーク処理装置)」上での検証を完了しており、推論速度がベースラインと比較して最大1.96倍向上したことを明らかにした。一方で同社、ハイエンドの計算能力の制約により、現在のProモデルのサービス処理能力(スループット)は非常に限定的であることも明かした。7~12月期にファーウェイの次世代AI基盤「Ascend 950」のスーパーノードが大量に市場に投入された後、モデルの価格は大幅に引き下げられる見通しだ。

米半導体大手エヌビディア(NVIDIA)のジェンスン・フアン(黄仁勲)CEO(最高経営責任者)も以前、中国のチームはアルゴリズムの革新によってチップ性能の差をカバーすることができると述べており、DeepSeekはまさにその典型的な事例である。中国の業界では、V4が計算能力の制約下で実現したアーキテクチャの課題解決は、中国の大規模言語モデル開発チームのエンジニアリング能力と、オープンソースへの決意を改めて証明するものだと広く認識されている。

差はわずか「2.7%」、AI性能で米中ほぼ互角ーースタンフォード大報告書

(36Kr Japan編集部)

日本企業のDXを促進するプラットフォーム「CONNECTO」
無料コンテンツ公開中

最新記事