Google DeepMindは5月19日(現地時間)、マルチモーダルAIの新モデル「Gemini Omni Flash」を発表した。
Gemini Omni Flashは、画像、音声、動画、テキストを入力情報として組み合わせ、高品質な動画を生成できる点が特徴である。また、生成した動画も自然言語による指示で簡単に編集でき、編集作業は逐次的に内容を追加・修正できる。
同モデルは、GeminiアプリやGoogle Flow、YouTube Shortsで順次公開されており、AI Plus、Pro、Ultraの各種有料ユーザーには即日展開されている。YouTube ShortsおよびYouTube Createアプリのユーザーにも、今週より追加費用なしで提供される。今後数週間以内には、開発者や企業向けにAPIとしても展開される予定だ。