首位は”使えない”Claude Fable 5——中国発LLM「GLM-5.2」、コーディングで世界2位に（36Kr Japan） - Yahoo!ニュース

中国の大規模言語モデル（LLM）開発企業・智谱（Zhipu AI；海外ブランドはZ.ai）は6月17日、新たな旗艦モデル「GLM-5.2」を正式に公開し、商用利用も認める寛容なMITライセンスでオープンソース化した。コーディング能力と長文コンテキスト処理を前面に押し出し、米OpenAIやAnthropicが主導してきたAIコーディング市場への本格参入を狙う。

LLMのブラインド評価プラットフォーム「Code Arena」などのランキング一覧

「実務でClaude Opusに匹敵」の声も

GLM-5.2は、LLMのブラインド評価プラットフォーム「Code Arena」のプログラミング部門で1595点を獲得し、総合ランキングで2位に入った。首位はAnthropicの「Claude Fable 5」だが、後述の通り米国の規制で多くの利用者が使えない状態にあるため、実際に利用可能なモデルに限ればGLM-5.2が世界首位となる。

長時間かつ高難度のソフトウエア開発を測る「FrontierSWE」では、Anthropicの「Claude Opus 4.8」や一部の非公開（クローズド）モデルに次ぐ水準で、トップとの差はわずか1%。オープンソースモデルとしては最上位につけた。デザイン性を競う「Design Arena」でも世界首位を記録したという。

第三者評価でも、独立系のArtificial Analysisが6月17日に公表した知能指数（Intelligence Index v4.1）で、GLM-5.2はオープンウエートモデルの首位に立ち、同じく中国発のMiniMaxやDeepSeek、Kimiの最新版を上回った。Next.jsの生みの親であるギレルモ・ラウク氏が「ゲームチェンジャーだ」と評するなど、国内外の開発者からは「実務レベルでClaude Opusに匹敵する」との声も上がっている。

智谱によると、GLM-5.2は最大100万トークンの長文コンテキストを安定して扱える。中国テック系メディア・智東西の実証では、戦略ゲーム「シヴィライゼーション」風のゲームをゼロから開発し、約87万トークンの文脈を保ったまま16件のバグを修正。数十万トークン前に書いたコードの不具合原因まで特定したとしている。

首位は”使えない”Claude Fable 5——中国発LLM「GLM-5.2」、コーディングで世界2位に（36Kr Japan） – Yahoo!ニュース