おかえり「Claude Fable 5」。Anthropicのフラグシップ利用可能に(PC Watch) – Yahoo!ニュース

【画像】分類器がリクエストを検知すると「Opus 4.8に切り替えました」と表示され、応答が「Opus 4.8」に引き継がれる

 Claude Fable 5は、6月10日(日本時間)にリリースされた最新モデル。限定パートナー向けに提供される「Mythos」クラスの能力を備えつつ、一般利用向けに安全性を確保したAIモデル。ソフトウェアエンジニアリング、知識労働、ビジョン、科学研究など、多くのベンチマークで最先端の性能を示した。特にタスクが長く複雑になるほど、ほかのモデルを大きくリードする性能を発揮できる。

 Fable 5がリリースされた3日後、Anthropicは米商務省から輸出規制指令を受け、アクセスを一時停止した。これは、Amazonの研究者がFable 5のセキュリティ対策を回避する方法を発見したという報告を受け、政府が発令したものだが、その後の検証により、報告書でFable 5が特定したものと同じソフトウェア脆弱性の発見は、下位のOpus 4.8やGPT-5.5、Kimi K2.7などでも可能だったとし、Mythosクラス独自の能力によるものではなかったという。

 それでも報告された回避策に対処するため、該当する動作を特定してブロックする改良型安全分類器を開発。これにより、特定の手法は99%以上のケースでブロックできるとしている。ただし、日常的なコーディングやデバッグ作業中に、本来問題のないリクエストが誤ってフラグをつけられるというデメリットが生じているとし、今後この分類器を改良して誤検出を減らしていく予定。

この安全対策は、実際の利用画面にも反映される。分類器がリクエストを検知すると、応答はFable 5ではなく下位モデルの「Opus 4.8」が引き継ぎ、モデルが切り替わったことがユーザーに通知される。通知では、日常的なコーディングやサイバーセキュリティ、生物学に関連する作業であっても、安全側に倒した設定によってフラグが立つ場合があると説明されている。

 ちなみにFable 5では、セキュリティ性を最大限に高めるために、分類器の適用範囲を広げている。分類器による安全のマージンをこれまでのどのモデルよりも拡大しており、これが多くの誤検出を生む原因となっているが、これは安全性とのトレードオフであるという。そしてこれがMythos 5との最大の違い(Mythos 5はソフトウェアの脆弱性の発見・悪用が可能な攻撃的機能を備える)でもあると説明している。

PC Watch,劉 尭