「Gemini Spark」は、あなたのことを何でも知る、通常のアシスタントを大幅に強化したAIエージェントである。グーグルが今年の開発者会議「Google I/O」で発表したもので、チャットボットアプリ「Gemini」のアップデートの一環として位置づけられている。
多くのソフトウェア企業がしばらく前からAIエージェントを大々的に宣伝していたが、1月にAnthropicのClaude Coworkを試すまで、わたしはこうしたツールにそれほど大きな可能性を感じていなかった。しかし、ボットがデスクトップに散らばったスクリーンショットをクリックひとつせずにラベル付けされたフォルダへ整理していくのを見て、これは人々がコンピューターを操作する方法の転機になるかもしれないと思ったのである。
サンフランシスコの多くのアーリーアダプターも、今年前半に爆発的に広まったOpenClawのボットを設定したとき、同じようなことを経験した。そうした人たちは、単にいくつかのタスクを片付けるためではなく、自分のオンライン上の活動のすべてをOpenClawに任せようとした。ヘビーユーザーたちは、OpenClawを通じて受信箱、カレンダー、テキストメッセージの管理を完全に自動化しようとし、成功の度合いはさまざまだったものの、自動販売機の運営まで試みたのである。
もちろん、リスクがないわけではない。こうしたエージェントを使うには、自分のデータとコンピューターの制御権を開け渡さなければならないからだ。実験的に使っていたメタ・プラットフォームズの従業員は、OpenClawに大量のメールをまるごと削除されそうになったと語っている。
指示を待たずに動くAI
Googleカレンダーに入れている日々の予定であれ、Gmailの予約確認メールに記されたデートで足を運ぶ予定のレストランの情報であれ、Gemini Sparkはサードパーティのサービスと接続しなくても、わたしの個人情報を細部まで把握できる。標準のGeminiアプリでもこうしたタスクの大部分はこなせるが、Gemini Sparkの違いは、ユーザーからの指示を待つのではなく、ユーザーが不在のあいだに自ら詳細を集め、行動に移せる点にある。
グーグルはGemini Sparkを、これまで人々が手作業で処理したり、別のアプリで済ませたりしていたタスクをまとめて片付けられるツールとして打ち出している。このエージェントはたとえば、クレジットカードの請求書を定期的に確認し、予想外の請求を見つけて知らせることができる。アプリ「RocketMoney」には悪いが、もう必要ないというわけだ。また、未就学児の子どもに関するあらゆるメールの内容を自動で把握し、重要な日付を抽出して、朝に目を通せる要約レポートにまとめることもできる。会議の議事録をGemini Sparkに渡し、Googleドキュメントの下書きと、適切な相手に送るフォローアップメールの作成を頼むこともできるのだ。
Gemini Sparkのロードマップ
このエージェントは段階的に提供される予定だ。今週、一部の早期テスター向けに提供が始まり、来週には月額100ドル超のグーグルのAIプラン加入者向けにベータ版として公開される。Gemini Sparkをいち早く試すユーザーになるには、それなりの費用がかかるというわけだ。
グーグルは今後数週間で、Gemini SparkがGeminiを介してOpenTableやInstacartなどのサードパーティのアプリと接続できるようにし、自動化できる作業の範囲をさらに広げる計画である。Gemini Sparkのロードマップでは、近日中にほかの機能の提供も予定されている。たとえば、エージェントがユーザーの端末上のブラウザを操作できるようにする機能や、テキストメッセージまたはメールでエージェントに指示を送れるようにする機能などだ。