中国発オープンソースAI、世界LLMランキングを制覇 「Kimi K2」が首位に

世界の大規模言語モデル(LLM)の比較・ランキングサイト「LM Arena(LMアリーナ)」のオープンソースモデル部門で、月之暗面(Moonshot AI)の「Kimi K2」が1位に輝いた。2位はDeepSeekの「DeepSeek R1」、3位はアリババクラウドの「Qwen3」と中国勢がトップ3を独占した。米グーグルの「Gemma-3」は5位、米メタの「Llama4」は9位だった。

Kimi K2は総パラメータ数1兆を誇るオープンソースAIモデルで、7月11日に公開されたばかり。MoE(Mixture-of-Experts)アーキテクチャを採用した基盤モデルで、コーディング能力とマルチエージェントタスクに優れている。従来の対話モデルや推論モデルとは異なり、検索ソフトや数学ソフトなど各種ツールを用いて多段階タスクを実行できる「エージェント向けLLM」となっている。

中国のAIスタートアップで最高値!LLM開発の「Moonshot AI」、評価額が約4900億円なるか

公開されるやいなや世界中の開発者コミュニティで大きな反響を呼び、英科学誌ネイチャーのウェブ版では「第二のDeepSeek登場の瞬間だ」と評価され、DeepSeekの後を継ぐ勢いを見せている。

中国DeepSeekの衝撃・創業者独占取材「中国AIがいつまでも米国の追随者であることはない」

複数の権威あるベンチマークテストでも、コーディング能力とエージェント能力でトップクラスの実力を示した。特筆すべきはその価格で、世界最高のコーディングモデルと評された米アンソロピックの「Claude 4」など、先行するクローズドソースモデルに比べて大幅に抑えられている。

推論コスト、DeepSeekの3分の1に⋯世界を揺らすアリババ「Qwen3」、オープンソースLLMで“最強“評価

(36Kr Japan編集部)

 

日本企業のDXを促進するプラットフォーム「CONNECTO」
無料コンテンツ公開中

最新記事