複雑なコーディング処理能力と指示遵守能力が向上

0

会員(無料)になると、いいね!でマイページに保存できます。

共有する

米Anthropicは2026年4月16日、大規模言語モデルの最新版「Claude Opus 4.7」を一般公開した。複雑なコーディングタスクの処理能力とユーザーの指示を正確に守る能力が向上し、画像認識の解像度も従来の約3.3倍に拡大した。従来モデルよりも厳密に指示を解釈するため、既存環境でのプロンプトの再調整が必要となる。

photo

(図版:ビジネス+IT)

 米Anthropicが公開した「Claude Opus 4.7」は、同社の最上位モデル群「Opus」の最新版に位置付けられる。前バージョンのOpus 4.6と比較して、ソフトウェアエンジニアリング分野における自律的なタスク処理能力が強化された。プログラミングのベンチマークテスト「SWE-bench Verified」で87.6%、「SWE-bench Pro」で64.3%のスコアを記録した。楽天グループの「Rakuten-SWE-Bench」においては、本番環境相当のタスク解決数が従来比で3倍に達した。

 新モデルは長時間の複雑なタスクを高い精度で実行し、自身の出力を検証するプロセスを持つ。従来モデルではユーザーの指示を緩やかに解釈したり一部を省略したりする傾向があったが、Opus 4.7では指示を厳格に順守する。過去のモデルに合わせて作成されたプロンプトをそのまま使用すると意図した結果が得られない事例が報告されており、本番環境へ移行する前にプロンプトの動作確認と再調整が求められる。

画像

【図版付き記事はこちら】AnthropicがClaud Opus 4.7を発表、推論能力や指示の遵守性が大幅向上AnthropicがClaud Opus 4.7を発表、推論能力や指示の遵守性が大幅向上

(図版:ビジネス+IT)

 視覚能力も刷新され、処理可能な画像の最大解像度が従来の1568ピクセル(1.15メガピクセル)から2576ピクセル(3.75メガピクセル)に引き上げられた。高密度のスクリーンショットや複雑な図表を含むタスクの認識精度が向上している。さらに、出力生成時の思考リソースを指定する機能に、計算資源をさらに割り当てる「xhigh」レベルが新たに追加された。

 安全性への取り組みとして、自動化されたリアルタイムのサイバーセキュリティ保護機能を搭載した。Anthropicは未公開の最上位モデル「Claude Mythos Preview」においてサイバー攻撃への悪用リスクを課題としていた。一般公開されるOpus 4.7ではこのリスクを抑制し、利用規約に違反するサイバーセキュリティ関連の要求を自動検知してブロックする。また、プラットフォームの安全性維持を目的とし、一部の環境において政府発行の身分証明書および顔スキャンによるユーザーの本人確認を導入する。

画像

難しいコーディングタスクや推論のパフォーマンスが4.6から大幅に向上

(図版:Anthropic)

 APIの利用料金は前モデルから据え置かれ、100万入力トークンあたり5ドル、100万出力トークンあたり25ドルに設定された。同モデルはClaude APIのほか、Amazon BedrockやGoogle Cloud Vertex AI、Microsoft Foundryなどのクラウドプラットフォーム経由で利用できる。

評価する

いいね!でぜひ著者を応援してください

会員(無料)になると、いいね!でマイページに保存できます。

自動車・モビリティのおすすめコンテンツ

関連タグ
タグをフォローすると最新情報が表示されます

Introducing Claude Opus 4.7