OpenAI、GPT-5.6を発表も米政府要請により信頼できる顧客に限定公開。数週間以内の一般を目指す | XenoSpectrum

OpenAIは2026年6月26日、GPT-5.6 Sol、Terra、Lunaの3モデルを限定的にプレビュー公開した。提供先は米政府の要請を受け、政府に共有した一部の信頼されたパートナーに絞られる。OpenAIはこの手順を「長期的な標準にすべきではない」と明記し、今後数週間で対象を広げるまでの短期措置だと位置づけた。

旗艦モデルのSolは、コーディング、バイオ、サイバーセキュリティで能力が伸びるほど、提供範囲、安全策、政府との調整が一体で語られる構造になっている。モデルが強くなったから広く出す、という発表ではなく、どの能力を誰に開くかを制度として設計する段階に入った。

01.3モデル構成は価格と用途を分け、Solだけを特別扱いにしない02.Sol UltraはTerminal-Benchで91.9%、通常SolもClaude Mythos 5に迫る03.サイバー能力は「High」級だが、OpenAIはCritical未満と説明する04.政府要請は、モデル公開を「発売日」から「共有フロー」へ近づける05.商用面の勝負は、制限付き提供でも止まっていない3モデル構成は価格と用途を分け、Solだけを特別扱いにしない

GPT-5.6はSol、Terra、Lunaの3階層で導入される。Solは高度な推論やエージェント作業向けの旗艦モデル、Terraは日常的な作業に使うバランス型、Lunaは高速で低価格なモデルという位置づけだ。OpenAIはTerraについてGPT-5.5に競合する性能を2分の1のコストで提供し、LunaについてはGPT-5.6系で最も低いコストの選択肢になると説明している。

価格は100万トークンあたり、Solが入力5ドル・出力30ドル、Terraが入力2.50ドル・出力15ドル、Lunaが入力1ドル・出力6ドルである。プロンプトキャッシュも変わり、明示的なキャッシュ区切りと30分の最小保持時間に対応する。キャッシュ書き込みは通常入力単価の1.25倍で課金され、キャッシュ読み取りは従来通り90%割引になる。

この価格設計は、Solだけを「危険な最上位モデル」として切り離すよりも、GPT-5.6を用途別の製品群として出す意図を示している。制限付きで始まるのは3モデル全体だが、OpenAIはChatGPT、Codex、APIでのより広い提供を近く予定している。7月にはCerebras上でSolを最大毎秒750トークンで提供する計画もあり、アクセス制限の一方で、利用できる顧客には速度と費用の改善を同時に見せようとしている。

Sol UltraはTerminal-Benchで91.9%、通常SolもClaude Mythos 5に迫る
TerminalBench 2.1.webp

性能面でOpenAIが最も前面に出したのは、長い作業を計画し、コマンドラインで試行錯誤し、ツールを組み合わせるエージェント能力だ。Terminal-Bench 2.1では、GPT-5.6 Sol Ultraが91.9%、通常のSolが88.8%を記録した。比較対象として示されたClaude Mythos 5は88.0%、GPT-5.6 TerraとClaude Fable 5はいずれも84.3%、GPT-5.5は83.4%、Lunaは82.5%である。

GPT-5.6には、Solに長く考える時間を与えるmax推論努力と、複数のサブエージェントを使って複雑な作業を進めるultraモードが加わった。OpenAIが示しているのは、単一応答の賢さよりも、長い作業を分解して進める能力である。Sol Ultraの数字が通常Solを上回るのは、モデル本体だけでなく、計算時間とエージェント構成が成果を左右することを示している。

バイオ領域では、OpenAIはGeneBench v1でGPT-5.5より高い結果を少ないトークンで達成したと説明している。サイバー領域では、ExploitBenchでMythos Previewに競合しながら出力トークンを約3分の1に抑えたとしている。ExploitGymではSol、Terra、Lunaのいずれも推論努力を増やすほど結果が伸びた。性能向上がモデルサイズだけでなく、推論時間や作業の組み立て方に依存する構図がここでも出ている。

サイバー能力は「High」級だが、OpenAIはCritical未満と説明する

GPT-5.6 Solの発表文の大きな部分は、安全策に割かれている。OpenAIはSolについて、脆弱性を見つけて修正する作業では強いが、エンドツーエンドの攻撃を安定して実行する能力は同じようには出ていないと説明する。ChromiumとFirefoxを使った評価では、バグや悪用の足がかりになる要素は見つけたものの、テスト条件下で自律的なフルチェーンエクスプロイトは作れなかったという。

この説明は、OpenAIのPreparedness Frameworkにおける「Cyber Critical」の線引きと結びついている。同フレームワークでは、High capabilityは既存の深刻な被害経路を増幅し得る能力、Critical capabilityは深刻な被害へ至る新しい経路を作り得る能力として扱われる。High級の能力は導入前にリスクを十分に下げる安全策が必要になり、Critical級では開発中からより強い要件がかかる。OpenAIはSolをCritical未満と説明しつつ、能力の伸びと現実の組み合わせ方には不確実性が残るため、段階的な公開にするとしている。

安全策は、モデルの拒否訓練にとどまらない。GPT-5.6では、生成中にサイバーやバイオのリスクを判定するリアルタイム分類器、必要に応じて会話を評価する安全用の推論モデル、アカウント単位のレビュー、利用者や用途に応じたアクセス制御、監視と執行が組み合わされる。OpenAIは汎用的な脱獄手法を探す自動レッドチーミングに70万A100相当GPU時間以上を使ったとも説明している。

この構成は、誤用を防ぐと同時に、防御側の利用を止め過ぎない設計でもある。OpenAIはTrusted Access for CyberやTrusted Access to Biology Researchのような枠組みを使い、適格な研究者や防御担当者には、通常の提供範囲より広い二用途支援を認める余地を残す。GPT-5.6の安全策は、全員を同じ低い上限に置く発想ではなく、利用者の確認、用途、監視を組み合わせて開く範囲を変える方式に寄っている。

政府要請は、モデル公開を「発売日」から「共有フロー」へ近づける

今回の発表で最も政治的なのは、OpenAIが政府要請を明示したことだ。同社は、発表前に米政府へモデルの能力と計画を説明し、政府の要請を受けて、政府に共有済みの少数の信頼されたパートナーから提供を始めるとしている。そのうえで、この種のアクセスプロセスは長期的な標準になるべきではないと述べた。開発者、企業、サイバー防御側、国際的なパートナーが最良のツールに触れる機会を遅らせるからだ。

この動きは高度なAIモデルを公開前に最大30日間政府レビューへ出すよう求める米政権の動きとつながっている。既に知られているAnthropicのFable 5やMythos 5をめぐる制限も背景となるだろう。問題になるのは、危険な能力をどこで止めるかだけではない。政府が明確な安全基準を示さないまま、顧客ごとの承認や公開時期に影響を及ぼす場合、フロンティアAIの提供は事実上の許認可に近づいてしまうだろう。

OpenAIは今回の制限を、今後のサイバー関連の大統領令フレームワークと、将来のモデル公開に使える反復可能なプロセスを作るまでの短期措置だとしている。GPT-5.6が予定通り広い提供へ進むかどうかが、次のモデル公開ルールの試金石になる。数週間後に対象を広げられるなら、今回の制限は安全確認の例外的な段階として扱える。長引けば、モデル競争の主戦場は性能表ではなく、政府・企業・研究者のアクセス順をどう決めるかへ移る。

商用面の勝負は、制限付き提供でも止まっていない

アクセスが限られていても、OpenAIは商用面の材料を具体的に出している。Solは高価格帯だが、ExploitBenchのような長いサイバータスクで少ない出力トークンで競合できるなら、単価だけでは実際の作業コストを判断しにくくなる。TerraとLunaを同時に出したのも、旗艦モデルの提供が絞られる間に、より多くの作業を安い階層へ逃がす選択肢を示すためだ。

キャッシュ仕様の更新も、エージェント利用では大きい。長いコードベース、ポリシー文書、研究資料を繰り返し参照する作業では、キャッシュの寿命と区切り方が費用の予測しやすさに直結する。30分の最小保持時間と明示的な区切りは、単発のチャットよりも、反復する開発作業や調査作業で意味を持つ。Codexでの限定提供が先に来るのも、この種の長い作業を主要ユースケースとして見ているからだ。

Cerebrasで最大毎秒750トークンという計画も同じ方向を向いている。深い推論やサブエージェント構成は能力を上げる一方で、待ち時間とコストを増やしやすい。高速推論の選択肢を出すことは、Solを研究デモではなく、業務で使える道具として成立させるための条件になる。提供対象が当面限られるとしても、OpenAIはGPT-5.6を「使えるようになったら速い」製品として市場に見せている。

GPT-5.6 Solの評価は、ベンチマークでClaude Mythos 5をどれだけ上回ったかだけでは決まらない。OpenAIは、能力、安全策、価格、アクセス制御をひとつの発表にまとめた。次に問われるのは、同社が主張する短期的な制限が本当に短期で終わるのか、そして防御側や開発者が、必要な能力に必要なタイミングで届く仕組みを作れるのかである。

XenoSpectrum サポータープログラム 広告のない XenoSpectrum を。

月額¥580。広告が消え、ブックマーク無制限。独立した記事制作を支えられます。いつでも解約可。

サポーターになる(¥580/月)
まずは無料で。AI・半導体・先端技術の最前線を週1通でメール受信。
広告のない XenoSpectrum を。

月額¥580、ログイン済みなのですぐ始められます。

サポーターになる

まずは無料で。最新ニュースをメールで受け取る。

いつもありがとうございます。

あなたのご支援で、独立した記事を届け続けられています。広告は非表示です。

もう一度応援する