Geminiの「アバター」機能でつくったデジタルクローンは、不気味なほど自分そっくりだった

サンフランシスコのミッション・ドロレス・パークは暖かく穏やかな美しい午後を迎えていた。その公園でわたし、『WIRED』のライターであるリース・ロジャースが先史時代の恐竜に向かってバースデーソングを歌っている。歌い終えると、何も持っていなかったはずの手に、どこからともなくピンクのろうそくが立ったカップケーキが魔法のように現れた。炎を吹き消すと、CGでつくられた生き物は静かに満足そうな表情を浮かべる。

このAI動画に登場する男性は、見た目も声もわたしそのものだ。しかし、この動画は実際には、グーグルのGeminiアプリで利用できる新機能のひとつ、「アバター」を使って生成したものである。このように人物をデジタルで再現する機能は、すでに提供を終了したOpenAIの動画生成アプリ「Sora」の主要機能に似ている。AI動画のなかに登場させることができる、自分自身のデジタルクローンをつくれる機能だ。アバターは同社の新しい動画モデル「Gemini Omni」によって動作し、この機能は有料会員のみが利用できる。

わたしは米国で月20ドルの「Google AI Pro」プランに加入しているが、動画の生成機能を使ったところGeminiの利用上限にすぐに達してしまった。この上限は5時間ごとにリセットされる。いくつか質問をし、自分のアバターが登場する10秒の動画を2本生成しただけで、それ以上はしばらく待つよう求められたのである。

Video: Reece Rogers

それでも、生成した2本の動画からGemini Omniがわたしの姿を使って何ができるのかを垣間見ることができた。生成したのは、わたしがサンフランシスコの公園で恐竜に向かって歌う動画と、ゴールデンゲートブリッジの下でサーフィンをする短い動画である。それを見て、その精度に感心すると同時に、恐怖も感じた。内容は見ていて気恥ずかしくなるもので、ところどころ不自然な場面があり、服装にも違和感があった。それでも、動画のなかの男性は紛れもなくわたしだった。指で顔を拡大し、口の動きをじっくり見てみた。歯は少し違っていたが、それ以外はあごのもたつきに至るまで、まさにわたしそのものだったのである。

OpenAIは、自分の肖像を使ってほかの人がAI動画を生成できるようにするかどうかを利用者自身が選べる仕組みを採用していた。一方でグーグルでは、成人した利用者でも、自分自身のアバターを使った動画しか作成できない。

デジタルクローンを5分で作成

Geminiアプリで自分のアバターを作成するのにかかった時間は5分ほどである。明るい部屋に座り、スマートフォンのカメラを自分の顔に向け、2桁の数字の羅列を読み上げる。そして、ゆっくり右を向き、続けて左を向く。それで終わりだ。こうして“リース2.0”が誕生し、わたしそっくりのディープフェイクとして動画に出演する準備が整ったのである。（アバターの作成時に着る服には気をつけたほうがいい。そのときの服装がAI生成の結果に反映される可能性が高いからだ。この点については後述する）。

この奇妙な感覚をもう少し掘り下げるために、誕生日の動画を1場面ずつ見ていきたい。入力したプロンプトの全文はこうだ。「場所はドロレス・パークの丘の上。誕生日を迎えた恐竜にわたしがハッピーバースデーの歌を歌う動画を生成して」

AI-generated clip by Reece Rogers

動画の冒頭は、ミレニアル世代らしいカメラを気にする一瞬の間から始まる。AIのわたしでも、染みついた癖が出てしまうというわけだ。動画でまず目を引くのは、写真のようにリアルな背景である。グーグルのAIはわたしのアバターを、どこか知らない公園のやけに大きな丘の上に配置したわけではなかった。生成された動画の背景は、実際の景色に驚くほどよく似ていた。ヤシの木が並ぶ歩道から、遠くにそびえる高層ビル「セールスフォース・タワー」まで、映像は完璧ではないものの、どの公園を描いているのかがすぐにわかるほど正確だったのだ。地球を地図化してきたことで知られる企業なら、これくらいできても不思議ではない。

Geminiの「アバター」機能でつくったデジタルクローンは、不気味なほど自分そっくりだった | WIRED.jp