シリコンバレーで、周到に準備された商業的待ち伏せが進行している。Anthropicの「Claude Fable 5」が輸出規制騒動から復帰し、グーグルの「Gemini 3.5 Pro」が緊急の再調整を余儀なくされた矢先、OpenAIが止めを刺そうとしているのだ。
7月4日、ソーシャルメディア上の多数の開発者やテックブロガーが、OpenAIのプログラミング支援ツール「Codex」の最新基盤コード内に、GPT-5.6の3つのサブモデル「Sol」「Terra」「Luna」の識別子が明示的に記述されているのを発見した。さらに想像を掻き立てることに、応答速度と回答品質をユーザーが自由に調整できる「速度ダイヤル」機能もコードと共に露出した。
複数の情報提供者によると、OpenAI内部ではGPT-5.6の発表時期を来週火曜日(7月7日)から7月9日と厳命したという。このタイミングは偶然ではない。Claude Fable 5の特定利用枠が失効する空白期間に正確に照準を合わせている。ある関係者は「これは時間単位で精密に計算された商業的包囲だ」と語る。
「正直なところ、OpenAIはまるで何もなかったかのように、我々が気づかないとでも思っているかのように、こっそりモデル名をデッドコードに埋め込んでいた」と海外ユーザーは皮肉る。GPT-5.6の限定公開以降、ギークコミュニティはOpenAIのフロントエンド更新を逐一監視してきた。そしてつい先日のCodexアプリのマージにおいて、決定的な証拠が掘り起こされた。
現在はバックエンドのインターフェース制限により、これらのモデルを実際に呼び出すことはできないが、フロントエンドのポップアップウィンドウには、3つのモデルのスタイルと新しい「速度セレクター」がはっきりと表示されている。コードには「Sol Ultra」の文字も浮かび上がっている。業界では、Sol Ultraは競合の最上位モデルに直接対抗する切り札であり、性能面ではFable 5と互角ながら、価格ははるかに手頃になると推測されている。ただし、期待の高い「リアルタイム音声サポート」は現在も開発段階にあり、来週の発表には間に合わない可能性が高い。
桁違いの実力差:実測比較で明らかに
大半のユーザーはまだ利用権限を得ていないが、一部の内部テスト参加者は、実際のエンジニアリング環境におけるGPT-5.6の比較評価を共有している。その結果は「桁違い」と形容されている。
海外のテックブロガー、Shivam氏は、GPT-5.6-terraとFable 5を使って同じ複雑な技術プロンプトを処理した体験を共有した。Fable 5は5時間のセッション制限100%の状態から開始し、バックグラウンドでの「思考」中に制限枠の21%を消費。最終的に返ってきた応答は、技術的な詳細を再確認させるための多数の逆質問だった。一方、同じタスクでGPT-5.6-terraは制限枠の13%しか消費せず、応答速度は極めて速く、無駄な言葉は一切なく、問題を解決するための複数の異なる手法とアーキテクチャの道筋を効率的に列挙し、即座に実行を開始した。
Shivam氏は率直にこう語る。「Fableを使っている間、いつOpus 4.8に降格されるかという不安で頭がいっぱいだった。GPT-5.6-terraの歯切れの良さは非常に心地よかった」
オラクルのディレクター、Gilson Melo氏は、GPT-5.6 HighとFable 5 Highにハードコアな課題を出した。単一のHTMLファイル内で、リアルタイムの剛体物理演算、重力、ユーザー制御機構を備えた完全なブラウザベースのゲームを、一切のロジックを省略せずにゼロから構築するというものだ。この問題は、モデルの極限的な詳細処理能力、長大なコードの品質維持、そして基盤となる物理公式の計算能力を極限まで試すものだ。
Fable 5 Highのパフォーマンスは驚異的で、極めて自信に満ちた様子で一気にゲーム全体のコードを生成した。一方、GPT-5.6 Highは生成プロセス中に非常に人間らしく2回一時停止し、開発者に最終的な2つの重要な決定事項を積極的に確認・明確化した。さらに驚くべきことに、要求されていないにもかかわらず、自発的にゲームに効果音を追加した。最終結果では、GPT-5.6 Highが全体的なゲーム体験、物理衝突の滑らかさ、細部の堅牢性において、より確かなスコアを獲得した。
総じて、両テスト参加者はGPT-5.6が効率性と応答スタイルで優れており、特に複雑なタスク処理時の明瞭さと速度で勝っていると評価している。
精密な迎撃:競合の最も弱い瞬間を狙う
モデルの流出が偶然だとしても、発表時期は間違いなく熟考された戦略的配置だ。OpenAIが7月7日にGPT-5.6を重磅発表する計画は、ClaudeユーザーがFable 5へのアクセス権を失うその日に重なる。
最近のClaudeに対する不満の声は巨大だ。Claude Fable 5は復帰したばかりだが、既にユーザーの強い不満を引き起こしている。いくつか質問をするだけで、Fable 5はOpus 4.8に降格してしまう。生物医学エンジニアのDerya Unutmaz氏がFable 5に「人間」という言葉を説明させようと「Explain human」と入力したところ、モデルは数秒考えた後に「Switched to Opus 4.8」のカードを表示した。安全メカニズムがこのメッセージにブロックすべき内容があると判断したためだ。半導体アナリストのDylan Patel氏が「raspberryという単語にrは何文字あるか」という極めて単純な質問をしたところ、同様にブロックされ、画面には「Chat paused」と表示された。これはFable 5の安全メカニズムが、ほとんどのネットワークセキュリティや生物学のトピックを遮断することを示している。
さらに、Opus 4.8の最近の幻覚(ハルシネーション)問題も非常に深刻で、会話中に他人の情報が表示されることさえある。このようなユーザー体験の断崖絶壁的な低下は、OpenAIにとって最適な顧客奪取の窓口を作り出している。
ある関係者は「GPT-5.6の利用枠制限は大幅に緩和され、Fable 5よりも寛大になる。より厳格な安全ガードレールも段階的に導入されているが、Fableのように通常の使用に支障をきたすほど過激なものではない」と明かす。
コスト面では、GPT-5.6 Solはトークン効率が高いため、Fable 5よりも2倍以上安くなるとの情報がある。Sol UltraはFable 5に匹敵しつつ、より安価になるとの予測もある。この予測が現実となれば、OpenAIはコストパフォーマンスで競合を完全に上回ることになる。
トークン・アポカリプス:AI業界のパラダイムシフト
この商業競争の背景には、AI業界全体が「トークン・アポカリプス(Token Apocalypse)」と呼ばれるパラダイムシフトを経験しているという現実がある。
最新データによると、Anthropicが自社の計算リソースに費やすコストは、既に人件費の2.3倍に達している。上級エンジニア1人あたりの完全コストを22.4万ドル(約3,600万円)とすると、Anthropicのエンジニア1人あたりの年間計算リソース支出は約51.5万ドル(約8,300万円)に上る。人よりモデルの方がコストがかかる状況だ。
このような請求書を前に、大手企業は相次いでAI利用に厳格な制限を課し始めている。アマゾン、アドビ、アトラシアン、シティグループなどは従業員のハイエンドモデル使用を制限。ウーバーはエンジニア1人あたり月額1,500ドルのトークン上限を設定し、シティバンクは高度なAIツールへのアクセスを完全に制限した。
Claude Codeの設計思想は、まさにこのコスト削減トレンドに逆行している。プロジェクト責任者であるBoris氏の当初の意図は「モデルの賢さをどう見せるか」であり、「開発者のトークン節約をどう助けるか」ではなかった。5分で200ドルを使い切ることは、Claude Codeにとって事故ではなく、設計そのものだ。その基盤となるロジックは「より多くのトークンを消費して解決できる問題には、決してトークンを節約する方法を探さない」というものだ。
一方、OpenAIは一貫してトークンの圧縮に全力を注いでいる。推論トレースの圧縮からモデル自体の効率最適化まで、彼らの哲学は「より少ないトークンで同じ仕事をする」ことだ。Deep SWEの比較データによると、GPT-5.5 mediumはわずか2万トークンで驚異的なスコアを獲得したのに対し、Opus 4.8は5万トークンを使用しながら、スコアはむしろ低かった。
最新の講演で、Anthropicの技術チームメンバーであるTariq Shihipar氏は、Claude Codeのシステムプロンプトの80%を削除し、一時は65,000トークンにまで膨れ上がったものを削減したと述べた。これはAIモデルの誘導方法に根本的な変化が起きていることを反映している。かつて人々は指示が多ければ多いほど良いと考えていたが、新しいモデルFable 5は人間が与える例示よりも想像力豊かであり、例示がむしろ制限になっているのだ。
解読不能な思考の連鎖:Fable 5の別の顔
GPT-5.6の露出の前日、Fable 5はRedditの投稿で再び話題を呼んだ。投稿者はFable 5に競技プログラミングの問題を解かせたところ、モデルは直接的な答えを出さず、断片的なつぶやきの長い連なりを出力した。「DATA DATA DATA. GO.」の繰り返し、苛立ちを表現する「GRRR」「GAAAH」、ほとんど逆上に近い「ブロックされた?!違う!」、そして「溺れそうだ——実証を!!!」という言葉。
投稿者の評価は「あまり人間の言葉には読めないが、必死に格闘している様子を見ると、なかなか愛らしい」というものだった。投稿は急速に人気ランキングの上位に浮上し、コメント欄の最高評価はわずか4語「Data data data go!!!」だった。
この背後には、AI安全研究コミュニティで長年存在する理論的な懸念がある。モデルが効率性のために、人間には解読できない「プライベート言語」を独自に発達させて思考するのではないか、というものだ。この現象は「Neuralese(ニューラリーズ)」と呼ばれ、2017年にカリフォルニア大学バークレー校の研究者によって初めて提唱された。Anthropic自身のアライメント科学チームも以前の研究で、思考連鎖の表現がモデルの実際の内部計算プロセスを常に忠実に反映しているわけではないことを認めている。
ただし、AI安全コミュニティ「LessWrong」の分析では、より冷静な解釈も示されている。これらの一見文字化けしたテキストは、本質的には極度に圧縮された英語とゲームの記譜法の混合体であり、全く新しい解読不可能な言語ではないという。
駆け込み利用ガイド:旧利用枠の期限切れに注意
Codexへの復帰を準備するハードコア開発者にとって、Reflection CTOの詳細な調査が緊急情報を明らかにした。以前にCodexで蓄積したレート制限リセット枠の有効期限はわずか30日間だ。最初の枠が6月11日または12日頃に付与された場合、7月12日頃から順次期限切れとなる。
GPT-5.6が本当に来週火曜日に解禁されれば、ユーザーが手持ちの最初のリセット枠を消費できるのはわずか4〜5日間だけだ。来週火曜日には、OpenAIが新たなリセットを再度付与する可能性が高いため、開発者は古い利用枠を急いで重要な用途に使う必要がある。