首位は“使えない”Claude Fable 5——中国発LLM「GLM-5.2」、コーディングで世界2位に
更新
中国の大規模言語モデル(LLM)開発企業・智谱(Zhipu AI;海外ブランドはZ.ai)は6月17日、新たな旗艦モデル「GLM-5.2」を正式に公開し、商用利用も認める寛容なMITライセンスでオープンソース化した。コーディング能力と長文コンテキスト処理を前面に押し出し、米OpenAIやAnthropicが主導してきたAIコーディング市場への本格参入を狙う。
「実務でClaude Opusに匹敵」の声も
GLM-5.2は、LLMのブラインド評価プラットフォーム「Code Arena」のプログラミング部門で1595点を獲得し、総合ランキングで2位に入った。首位はAnthropicの「Claude Fable 5」だが、後述の通り米国の規制で多くの利用者が使えない状態にあるため、実際に利用可能なモデルに限ればGLM-5.2が世界首位となる。

LLMのブラインド評価プラットフォーム「Code Arena」
長時間かつ高難度のソフトウエア開発を測る「FrontierSWE」では、Anthropicの「Claude Opus 4.8」や一部の非公開(クローズド)モデルに次ぐ水準で、トップとの差はわずか1%。オープンソースモデルとしては最上位につけた。デザイン性を競う「Design Arena」でも世界首位を記録したという。

長時間かつ高難度のソフトウエア開発を測る「FrontierSWE」

AIのデザイン能力に焦点を当てたテスト「Design Arena」
第三者評価でも、独立系のArtificial Analysisが6月17日に公表した知能指数(Intelligence Index v4.1)で、GLM-5.2はオープンウエートモデルの首位に立ち、同じく中国発のMiniMaxやDeepSeek、Kimiの最新版を上回った。Next.jsの生みの親であるギレルモ・ラウク氏が「ゲームチェンジャーだ」と評するなど、国内外の開発者からは「実務レベルでClaude Opusに匹敵する」との声も上がっている。
智谱によると、GLM-5.2は最大100万トークンの長文コンテキストを安定して扱える。中国テック系メディア・智東西の実証では、戦略ゲーム「シヴィライゼーション」風のゲームをゼロから開発し、約87万トークンの文脈を保ったまま16件のバグを修正。数十万トークン前に書いたコードの不具合原因まで特定したとしている。
追い風となった「米最先端モデルの突然の利用停止」
GLM-5.2が「利用可能なモデルで首位」という限定付きで語られる背景には、最先端モデルをめぐる地政学がある。
複数の報道によると、米AnthropicはGLM-5.2公開の数日前、米政府から緊急の輸出管理指令を受け、最上位モデル「Claude Fable 5」「Claude Mythos 5」へのアクセスを、米国内外を問わず外国籍の利用者すべてに対して遮断するよう求められた。両モデルは公開から72時間ほどしか経っていなかった。
この結果、世界最高水準とされる一部のモデルが使えなくなり、「利用可能なモデル」の顔ぶれが大きく変わった。智谱はこのタイミングを突くようにGLM-5.2を投入。GLM開発を率いる清華大学の唐傑氏はSNSで「フロンティアの知能は万人のものであるべきだ」と述べ、非技術的な理由でモデルへのアクセスが突如断たれる状況へのアンチテーゼとして、完全なオープンソース化を位置づけた。
オープンソースと「国産化」で囲い込みに対抗
智谱の戦略は明快だ。MITライセンスでのモデル重み(パラメータ)公開により、企業や開発者は自社環境での運用・改変・商用化を法的懸念なく行える。重みはHugging FaceとModelScopeで公開され、APIも自社のBigModelおよびZ.aiで提供を開始。すでにClaude CodeやClineなど主要なコーディング支援ツールから呼び出せる。
さらにGLM-5.2は公開初日に、ファーウェイの昇騰(Ascend)や寒武紀(カンブリコン)、摩爾線程(ムーアスレッド)など主要な国産AIチップでの推論に対応した。米国の対中規制で先端半導体の調達が制約されるなか、「ソフト・ハードの両面で自立できる」ことを示した形だ。
市場の反応も大きく、香港上場の智谱株は6月22日に一時26%超上昇した。クローズドな最先端モデルに全面依存しない選択肢を開発者に示せるか——GLM-5.2は、中国のAIエコシステムにとって重要な一歩となる可能性がある。
(36Kr Japan編集部)