Googleは現地時間5月19日のGoogle I/Oで、24時間365日稼働するAIエージェント「Gemini Spark」を発表した。GmailやGoogleドキュメントといったWorkspaceツールと連携し、ユーザーに代わってタスクを引き受ける常時オン型のエージェントとして提供する。今週から信頼できるテスター向けに展開を開始し、来週には米国の「Google AI Ultra」ユーザーに向けてベータ提供を始める。
最大の特徴は、Googleのクラウド上で動作し、ノートPCを閉じている間もバックグラウンドで作業を続けられる点だ。自律型AIエージェント「OpenClaw」が手元のMac Miniなどで動作するのに対し、Sparkはクラウドベースで端末のリソースを使わずに済むというわけだ。
同社が挙げた使用例では、近所のパーティの企画で「出欠から遊具のレンタル手配までを一括で引き受ける」といった、複数手順を伴う用途を想定する。Geminiアプリなどを統括するGoogleのJosh Woodward氏は、米CNETの取材に対し「(Gemini Sparkの使用感は)肩越しにタスクを放り投げても、Sparkがそれを受け止めて片付けてくれるような感覚だ」と説明している。
Woodward氏によると、テスターは現時点で、パーティの計画、子どもの学校スケジュールの追跡、受信トレイの質問監視といった用途に使っているという。Googleは夏にかけて連携先を拡大し、Chrome経由でより多様なサードパーティのアプリやウェブサイトを操作できるようにする計画も示した。
macOS上のローカルファイルの整理も
あわせてGoogleは、デスクトップ向けのアプリ「Gemini macOS」を全ユーザー向けに同日公開した。Gemini Sparkは同アプリ経由でも利用でき(当面は米国のAI Ultra向け)、Mac上のローカルファイルを整理したり、PDFからデータを抽出してGoogle SheetsやGmailに直接送ったりといった操作を行えるとしている。
macOSアプリには、新しい音声理解技術も搭載した。画面上の文脈を踏まえつつ、ユーザーが「えーっと」「ところで」といったつなぎ言葉を含めて思考を口に出すと、それを精緻なドラフトに整形し、カーソル位置に即座に反映するという。新音声体験は、今後数週間のうちに全世界の全ユーザーへ展開するという。
Amazonで現在開催中のセールを見る
Amazonのアソシエイトとして、CNET Japanは適格販売により収入を得ています