中国の大規模言語モデル(LLM)開発企業・智谱(Zhipu AI;海外ブランドはZ.ai)は6月17日、新たな旗艦モデル「GLM-5.2」を正式に公開し、商用利用も認める寛容なMITライセンスでオープンソース化した。コーディング能力と長文コンテキスト処理を前面に押し出し、米OpenAIやAnthropicが主導してきたAIコーディング市場への本格参入を狙う。
LLMのブラインド評価プラットフォーム「Code Arena」などのランキング一覧
「実務でClaude Opusに匹敵」の声も
GLM-5.2は、LLMのブラインド評価プラットフォーム「Code Arena」のプログラミング部門で1595点を獲得し、総合ランキングで2位に入った。首位はAnthropicの「Claude Fable 5」だが、後述の通り米国の規制で多くの利用者が使えない状態にあるため、実際に利用可能なモデルに限ればGLM-5.2が世界首位となる。
長時間かつ高難度のソフトウエア開発を測る「FrontierSWE」では、Anthropicの「Claude Opus 4.8」や一部の非公開(クローズド)モデルに次ぐ水準で、トップとの差はわずか1%。オープンソースモデルとしては最上位につけた。デザイン性を競う「Design Arena」でも世界首位を記録したという。
第三者評価でも、独立系のArtificial Analysisが6月17日に公表した知能指数(Intelligence Index v4.1)で、GLM-5.2はオープンウエートモデルの首位に立ち、同じく中国発のMiniMaxやDeepSeek、Kimiの最新版を上回った。Next.jsの生みの親であるギレルモ・ラウク氏が「ゲームチェンジャーだ」と評するなど、国内外の開発者からは「実務レベルでClaude Opusに匹敵する」との声も上がっている。
智谱によると、GLM-5.2は最大100万トークンの長文コンテキストを安定して扱える。中国テック系メディア・智東西の実証では、戦略ゲーム「シヴィライゼーション」風のゲームをゼロから開発し、約87万トークンの文脈を保ったまま16件のバグを修正。数十万トークン前に書いたコードの不具合原因まで特定したとしている。