19日間にわたる世界的な公開停止を経て、Anthropicの「神話級」と称される旗艦モデル「Claude Fable 5」がついに再提供を開始した。しかし、多くの開発者が待ち望んだ「白月光(理想の存在)」の復活初日は、極度に神経質な過剰審査と複雑な課金ルールによって、評価が真っ二つに分かれる結果となった。
日本時間6月10日未明、AnthropicはClaude Fable 5を正式に発表した。このモデルはほぼ全てのベンチマークテストで最高水準を示し、特にソフトウェアエンジニアリング、ナレッジワーク、視覚的推論、科学研究などの分野において、複雑で長期的なタスクを処理する能力は、他のモデルに対する「次元の異なる攻撃」と評された。しかし、発表からわずか3日後、米国政府は国家安全保障を理由に、外国籍ユーザーによるFable 5および同世代のMythos 5モデルへのアクセスを禁止する命令を出し、Anthropicは緊急の公開停止を余儀なくされた。
その後、6月30日に輸出規制が解除されたことを受け、Fable 5は7月2日に復活を遂げた。しかし開発者たちは、再公開されたFable 5が、まるで重い枷をはめられたかのようになっていることにすぐに気づいた。
「コードを1行書くだけで知能が低下」:過剰な審査に開発者が憤慨
Anthropicは規制要件を満たすため、Fable 5に新たな多層防御メカニズムを導入した。このシステムには、潜在的な高リスク操作を識別するためのリアルタイム安全分類器が含まれている。しかし、『智東西』をはじめとする複数のテクノロジーメディアの報道によると、この分類器は実際の運用において極めて過敏に反応し、完全に無害な日常のプログラミングやデバッグ要求を高リスク行為と誤判定する事例が頻発している。
一度リスク管理ルールが作動すると、システムは容赦なくモデルを、より性能の低いOpus 4.8、あるいはさらに下位のSonnet 4.6へと強制的に切り替えてしまう。ある開発者は、コード同期ツールについて問い合わせたり、血液検査の報告書を解釈させようとしただけで、連鎖的なダウングレードが発生したと不満を漏らした。さらに奇妙な事例として、Redditに投稿したある地球科学の博士課程学生は、Fable 5を使って「樹木がどのように環境温度を下げるか」という生態学的研究手法の最適化を試みたところ、何度も拒否され、強制的にモデルを切り替えられた。一方で、「DJI SDKを使ってドローンの群れを制御する」という明らかに機微なプロンプトを意図的に入力したところ、Fable 5は1分も経たずに何の障害もなく完全な計画を生成したという。このような「ダブルスタンダード」な審査ロジックに対し、ユーザーは極度の困惑と怒りを感じている。
Anthropicは公式声明でこの欠陥を認め、新しい分類器が「日常的なプログラミングやデバッグのタスクにおいて、正常で無害な要求をより頻繁にフラグ付けしてしまう」と説明し、今後数週間以内に最適化を行うと約束した。
課金ルールの大幅変更:サブスクリプション制から従量課金制へ
安全審査による混乱に加え、Fable 5復活後の商業化戦略にも大きな転換があった。Anthropicが発表したプロモーション案内によると、7月1日から7月7日までのキャンペーン期間中、Pro、Max、Teamなどのサブスクリプションユーザーは、Fable 5の利用に週間利用枠の最大50%までしか充当できず、超過分は追加の利用クレジットを購入する必要がある。さらに重要な点として、Fable 5のクレジット消費速度は極めて速く、同等のタスクにおける消費量はOpus 4.8の約2倍に達する。月額200ドル(約3.2万円)のプランを契約しているユーザーからは、簡単な質問を1つしただけで、たとえ回答が得られなくても、利用枠の25%が直接消費されたという報告が上がっている。
7月7日のプロモーション期間終了後、Fable 5は通常のサブスクリプション体系から完全に切り離され、純粋な従量課金モデルへと移行する。APIの料金は、入力が100万トークンあたり10ドル(約1,600円)、出力が100万トークンあたり50ドル(約8,100円)に設定されている。著名なAIブロガーであるRiley Brown氏が以前実施した限界テストでは、Fable 5にわずか4つのプロンプトで3Dストラテジーゲームをゼロから開発させたところ、173ドル(約2.8万円)相当のトークンコストが発生した。これは、高頻度で利用するユーザーにとって、Fable 5が名実ともに「金食い虫」と化したことを意味している。
中核的な実力は健在:複雑なタスクでは依然として「別格」
論争が絶えないものの、Fable 5が安全策をうまく回避して正常に動作した場合、その中核的な実力は依然として比類がない。『新智元』の報道によると、ある開発者が3Dモデリングソフト「Blender」とFable 5を接続したところ、モデルはわずか20分でニューヨーク市の都市景観を再現した。そのロジックは、まず公共データソースから建築データを取得し、その後に構築を行うというもので、縮尺の正確性が確保されていた。コードのリファクタリングや長期的なエージェントタスクにおいて、Fable 5は数時間にわたって自律的に動作し、自らログを追加し、境界条件をテストし、失敗した場合には自ら原因を調査し、ログを補足し、再検証を行うことができる。経験豊富な開発者は、SWE-Bench Proにおける勝率が80%を超えており、真に信頼できる上級エンジニアの相棒であると評価している。
規制圧力の中での生き残り策
今回の騒動の背景には、最高水準のAI能力と規制圧力の間で苦悩するAnthropicの姿がある。再びの提供停止処分を避けるため、Anthropicは技術面での対策を重ねただけでなく、政策面でも大幅な譲歩を行った。
関係者によると、Anthropicは既にAmazon、Microsoft、Googleなどの大手企業と連携し、「AIジェイルブレイク重大度評価フレームワーク」の策定を試みている。これは、能力の向上幅、向上の広がり、兵器化の難易度、発見可能性の4つの次元からセキュリティホールを評価するものだ。4つの次元全てが最高の危険レベルに達した場合にのみ、最高レベルの警報を発動する必要があるとされている。さらにAnthropicは、強力なモデルを公開する前に政府機関に事前テストを許可すること、迅速な情報共有メカニズムを確立すること、そしてホワイトハットハッカーによる脆弱性発見を奨励するため「HackerOne」報奨金プログラムを設立することも約束した。
Fable 5の復活は、トップクラスの大規模モデルが「枷をはめられた状態で踊る」新たな段階に入ったことを示している。開発者や企業ユーザーにとって、短期的にはプロモーション期間を利用して、その強力なコード処理能力や複雑なタスク処理能力を体験できるが、長期的には、高度なAI能力に対して高額なコストを別途支払うことが常態化することになるだろう。