Anthropicは米国時間3月24日、コマンドラインツール「Claude Code」の新機能として、AIセーフガードに基づき権限レベルの判断を自律的に行う「auto mode」を発表した。開発者が長時間のコーディングセッションで利用する「dangerously-skip-permissions」オプションよりも安全な選択肢になるという。
Claude Codeは非常に強力なツールだ。単にコードを書くだけでなく、開発者が成果を出すために必要なシェルコマンドを実行できるからだ。これにはディレクトリーの作成、ファイルの移動、「GitHub」へのアップデートのチェックインなどが含まれるが、ファイルやディレクトリーの削除も実行できてしまう。
AIをコンピューター上で自由に走らせるのは恐ろしい懸念事項であるため、Claudeにはさまざまな権限システムが実装されている。その一つが、Claudeの作業範囲を指定したフォルダー階層内に制限する保護機能だ。筆者の場合、「Xcode」のプロジェクトでの作業に限定し、メインのドキュメントフォルダーやその他のファイルへのアクセスを禁止している。この保護機能はシステム全体の破滅を防ぐが、コードベース全体を破壊してしまう可能性までは排除できない。
もう一つの保護メカニズムは、問題が発生しそうな操作、特にシェルコマンドの実行に際してClaudeが許可を求める仕組みである。これは安全性に寄与する一方で、生産性を著しく低下させる。コード作成をClaudeに任せて昼食へ出かける代わりに、全てのコマンドを一つずつ承認しなければならない。これは非常に退屈な作業だ。
Claudeにはいくつかの権限階層が用意されており、ユーザーは許容できるレベルを設定できる。開発者の習性を考慮してか、「dangerously-skip-permissions」という文字通り危険な「最終手段」も存在する。これは権限チェックをスキップするものであり、当然ながらリスクを伴う。
ここには厳しいトレードオフがある。数分おきに作業を中断して許可を求めるか、あるいはClaudeに任せきりにして数カ月分の成果が破壊されるリスクを負うか、の二択を迫られるからだ。
そこで登場するのが、新しいauto modeだ。ただし、本稿執筆時点では「Team」プランのユーザーのみが利用できるリサーチプレビュー版だ。同社は、今後数日以内に「Enterprise」プランとAPIのユーザーにも提供を開始するとしている。
同社によると、auto modeは全ての権限をスキップするよりもリスクを抑えつつ、中断を減らして長時間のタスクを実行できる中間的な方法だという。各ツールが実行される前に、分類機能がファイルの一括削除、機密データの流出、悪意のあるコードの実行といった破壊的な動作がないかをレビューする仕組みだ。
安全と判断されたアクションは自動的に実行されるが、リスクがあると見なされたものはブロックされ、Claudeに別の手法を取るよう促す。Claudeがブロックされたアクションをしつこく実行しようとする場合は、最終的にユーザーへ権限確認のプロンプトが表示される。
auto modeの分類機能は、リスクを軽減するが、完全に排除するわけではない。そのため、同社は引き続き隔離された環境での作業を強く推奨している。他のAIによる活動と同様に、auto modeが混乱を来す可能性もある。文脈を正しく理解できずにリスクのあるアクションを許可したり、逆に無害なアクションをブロックしたりすることも考えられる。
現在、auto modeは「Claude 3.6 Sonnet」および「Claude 3.6 Opus」モデルと互換性がある。前述の通り、提供開始時点ではTeamプランのユーザーに限定されている。Anthropicは、auto modeの利用がトークン消費量、コスト、ツールの実行速度にわずかな影響を与える可能性があると指摘している。

提供:Bill Barfield/ Moment via Getty Images
この記事は海外Ziff Davis発の記事を4Xが日本向けに編集したものです。
ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)
