人間と同じようにコンピューターを操作してタスクを実行するように人工知能(AI)に指示できるとしたらどうだろう。ファイルを開いたり、アプリを起動したり、アイコンをクリックしたり、文字を入力したり、ウェブを閲覧したりといったことをAIが自分でこなせるようになるのだ。こうした機能は、AIエージェントの進化の最新段階を示すもので、AnthropicのAIである「Claude」で実際に試すことができる。
「リサーチプレビュー」モードで公開中のこの新機能は、Claudeがコンピューターの画面を移動して、アプリケーションやファイル、設定を操作し、ユーザーに割り当てられたタスクを実行するというものだ。
アプリを開くなど、Claudeが特定の操作を行うために許可を求めてきた場合を除き、ユーザーの介入は必要ない。
この新しい機能は、「Claude Cowork」と「Claude Code」で利用できる。Claude Coworkは、複雑なタスクを自律的に処理し、ユーザーの時間と手間を省いてくれるエージェント型AIだ。Claude Codeはエージェント型AIを使用して、コンピューターコードの作成やアプリ開発を支援してくれるツールだ。
本機能を使用する前に
コンピューター操作機能には、要件や条件、注意点がいくつかある。
まず、本機能は、「Pro」プランと「Max」プランの加入者しか利用できない。無料ユーザーや、「Team」プラン、「Enterprise」プランの加入者は、本稿執筆時点では対象外となっている。次に、「macOS」版のClaudeでしか提供されていない(ただし、「Windows」版でもサポート予定とのことだ)。
また、Claudeは特定のアプリや機密性の高いデータにはアクセスしないように設計されている。例えば、株式取引や投資取引、機密性の高い情報の入力、顔画像のスクレイピングなどは行わない。ただし、本機能はまだプレビュー段階であるため、基本的なプログラムに反した動作をする可能性もある。そのため、銀行や金融、医療、法律に関連するアプリへのアクセスは手動で拒否した方がいいだろう。
さらに、Claudeは画面をキャプチャーして操作方法を学習するため、画面上に表示されているあらゆる情報を閲覧・記録することができる。Claudeに指示を出すときは、機密情報や個人情報が含まれるアプリやファイルが画面に表示されていないか確認するようにしよう。
全体的に見て、コンピューター操作機能は大きな可能性を秘めていると言える。しかしその一方で、AIボットが想定外の動きをする可能性があることを考えると、思わぬ方向に進んでしまうおそれもある。Claudeに自分のコンピューターを自由に操作させることになるため、それだけリスクは大きくなる。こうした点を踏まえ、Anthropicは機密性の高いアプリへのアクセス許可を与えないよう推奨している。また、まずはシンプルなタスクから始め、誤解が生じないよう指示を細かく調整していくといいだろう。
ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)
