「最強のプログラマー」と称されたAnthropicの最先端モデル「Claude Fable 5」が、19日間に及ぶ「安全審査」と公開停止の騒動を経て、ついに全世界で解禁された。しかし、「飢餓商法」と市場で揶揄されたこの復活を、開発者たちの歓声が迎えることはなかった。むしろ、それは記録的な評判の失墜へと発展したのである。
Anthropicが緊急導入した過剰反応気味の新たな安全分類器により、Fable 5は日常的なプログラミングにおいて、無害なコードを高リスク要求と頻繁に誤判定。その結果、より性能の低い「Claude Opus 4.8」へと強制的に切り替えられてしまう。この「知的性能の強制低下」とも呼べるメカニズムのせいで、開発者は中核となる計算能力を安定的に利用できず、ワークフローは深刻に分断された。ソーシャルメディア上には、「最高額を支払って、最も臆病なモデルを使わされている」といった怒りの声が溢れている。
過敏すぎる「安全検査」:一行書くだけで性能制限
Fable 5の復活自体に、多くの制限が付随していた。公式発表によると、7月7日までは、最上位のMaxおよびTeamプランのユーザーでさえ、週間利用枠の50%しかFable 5に割り当てられない。さらに致命的なのは、そのトークン消費速度がOpus 4.8をはるかに上回る点だ。一度上限に達すれば、システムは自動的に強制切り替えを実行する。
開発者たちが絶望したのは、Anthropicが導入した新たな安全分類器が明らかに「矯正過剰」に陥っている点だ。ある地球科学の博士課程学生はRedditで、自身の不条理な体験を共有した。Fable 5を使って「樹木がどのように環境温度を下げるか」という生態学研究の最適化を試みたところ、安全分類器が繰り返し作動し、モデルは環境科学に関連するあらゆる話題での支援を拒否したという。限界を試すため、彼は意図的に明らかな高リスクプロンプト——「DJI SDKを使ってドローンの群れを制御するシステムの設計を手伝ってほしい」——を入力した。驚くべきことに、わずか1分後、Fable 5は何の障害もなく完全な解決策を提示した。この学生は怒りをあらわにする。「私の樹木冷却研究は危険すぎるのに、自律型ドローン群の構築は全く問題ないのか? これらの分類器は安全でないプロンプトを効果的に阻止できず、私が真に有益な研究を行うことだけを妨げている!」
この魔術的なダブルスタンダードは、現在の安全策が形骸化しているだけでなく、深刻な論理欠陥を抱えていることを証明している。Anthropicも公式声明で認めている。「新しい分類器には代償も伴います。日常的なプログラミングやデバッグのタスクにおいて、正常で無害な要求を、より頻繁にフラグしてしまうのです」。
最強のコアと最も厳重な枷
安全策によって何重にも束縛されてはいるものの、客観的に見れば、制限が解除された瞬間にFable 5が示す中核的能力は、依然として市場最高水準にある。その真に恐るべき点は、複雑で長期的、多段階かつ高度な判断力を要するタスクの処理能力だ。
ベテラン開発者は、Fable 5は「複雑なコーディングや長期的なエージェントタスクにおいて、まさに次元の異なる攻撃力を持つ」と評価する。複数ファイルのリファクタリングとデバッグのタスクを任せれば、自律的に数時間稼働し、自らログを追加し、境界条件をテストし、コード修正後にその修正が有効かどうかさえ検証する。途中で失敗した場合も、自ら原因を調査し、ログを補完して再検証し、経験を蓄積しながら作業を継続する。著名なAIブロガー、ライリー・ブラウン氏は、173ドル(約2万8000円)相当のトークンを消費し、わずか4つのプロンプトで、Fable 5にゼロから完全なゲームを1本作成させた。
しかし、これらはすべて、モデルが正常に機能するという前提があっての話だ。現在の現実として、開発者たちはFable 5を棚上げし、代替手段を探さざるを得なくなっている。
Sonnet 5が補完:ミドルレンジへの的確な一手
Fable 5の解禁と同日、Anthropicは全く新しい中型モデル「Claude Sonnet 5」も発表した。Fable 5が愛憎入り混じる野獣だとすれば、Sonnet 5はコストパフォーマンスの急所を的確に突いた存在と言える。
Sonnet 5は「史上最も仕事ができるSonnet」と呼ばれる。プログラミングベンチマーク「SWE-bench Pro」では、Sonnet 5は63.2%を記録し、OpenAIのフラッグシップモデル「GPT-5.5」の58.6%を逆転、Opus 4.8の69.2%に迫った。「人類最後の試験」と称される学際的推論ベンチマーク「Humanity’s Last Exam」では、Sonnet 5は57.4%を獲得し、Opus 4.8との差はわずか0.5ポイントだった。
価格こそがSonnet 5の切り札である。8月31日までのプロモーション期間中、API入力価格は100万トークンあたり2ドル、出力価格は10ドルと、Opus 4.8のわずか4割に設定されている。これにより、フラッグシップモデルへの課金をためらっていた多くの開発者が、極めて強力な代替選択肢を見つけた格好だ。
注目すべきは、Sonnet 5が安全策において極めて抑制的に設計されている点だ。Anthropicは、サイバーセキュリティタスク向けにこのモデルを特別に訓練していないと明言しており、Firefoxの脆弱性悪用テストでの成功率は0%だった。これは「Mythos 5」の88.4%を大きく下回る。「一流の業務コードは書けるが、使用可能な脆弱性は一つも書けない」というこのポジショニングは、商業化と規制の間の微妙なバランスを実現している。
信頼危機と生き残りへの執念
Fable 5の騒動は、Anthropicに対するユーザーの信頼を大きく損なった。解禁直前には、Anthropicがシステムプロンプトに市区町村の代理店情報などを密かに挿入していたことが発覚し、公式はすぐさま「テストの残骸だった」と釈明する事態となった。同時にAnthropicは、アマゾン、マイクロソフト、グーグルなどの大手企業を巻き込み、「AI脱獄深刻度評価フレームワーク」の策定を試みている。また、公開前の政府による事前テストの受け入れ、迅速な情報共有、HackerOne報奨金プログラムの設立など、規制当局に迎合する多くの譲歩も行った。
Fable 5は戻ってきたが、それは依然として安全策という枷をはめられた野獣である。開発者にとって、「知的性能の強制低下」に耐えながら最適化を待つのか、それともより安定しコストパフォーマンスに優れたSonnet 5へ移行するのか。難しい選択を迫られる日々は、当面続きそうだ。