セミナー情報や最新業界レポートを無料でお届け
メールマガジンに登録
AIモデルの性能評価を専門とするArtificial Analysisが5月9日、最新の大規模言語モデル(LLM)ランキングを発表した。中国アリババグループ傘下、アリババクラウドの「通義千問(Qwen3)」が知能水準で世界トップ5にランクインし、オープンソースモデルとしては首位を獲得している。さらに、Qwen3は主要な先端モデルの中で、最もコストが低く、推論コストはDeepSeek-R1の3分の1、Claude 3.7の20分の1に抑えられている。
Qwen3は4月29日にオープンソースとして公開されたばかり。Qwen3には、混合専門家モデル(MoE)を採用した2種類のモデル(パラメータ数300億および2350億)と、パラメータ数6億から320億までの密集型モデル6種類が含まれ、モバイルデバイスやスマートグラス、自律走行車、ロボティクスなど、多様なニーズに対応する構成となっている。また、119の言語と方言に対応しており、グローバルに活用できる。
Qwen3は中国で初めて「ハイブリッド推論モデル」を採用し、単純な問いには低い演算負荷で瞬時に応答する「非思考モード」と、複雑な問題に対して段階的かつ深い推論を行う「思考モード」を一つのモデル内に統合している。これにより、少ない計算リソースでも効果的に運用できるようになった。
Qwen3は複数の主要な性能指標で話題を集めていたDeepSeek「R1」を大きく上回り、世界のAI開発者コミュニティで瞬く間に注目の的となった。たとえば、フラッグシップモデル「Qwen3-235B-A22B」は、高度な数学的推論能力測る「AIME25」の評価で81.5点を記録し、オープンソースモデルとして過去最高得点を更新。また、コード生成能力を評価する「LiveCodeBench」では70点を超え、X(旧Twitter)のGrok3を上回った。さらに、人間の好みに沿った応答を評価する「ArenaHard」でも95.6点を獲得し、米OpenA「o1」やDeepSeek「R1」を超えた。
Qwenシリーズはこれまでに200以上のモデルをオープンソースとして公開し、累計ダウンロード数は3億回を上回る。派生したモデルは10万を超え、世界一のオープンソースモデルとなっている。
日本経済新聞の報道によれば、Qwenシリーズはすでに日本国内でAI開発の基盤として活用されており、存在感を高めているという。最新モデル「Qwen2.5-Max」は、4月に公開された日経の独自評価「AIモデルスコア」で6位にランクインしており、日本国内のスタートアップ企業の間では、Qwenをベースにした企業向けAIモデルの開発も始まっている。
(36Kr Japan編集部)
セミナー情報や最新業界レポートを無料でお届け
メールマガジンに登録