Google、リアルタイム音声対話モデルの最新版「Gemini 3.1 Flash Live」提供開始

最終更新日:2026/04/01

Gemini 3.1 Flash Live 提供開始

Googleは、リアルタイム音声対話モデルの最新版「Gemini 3.1 Flash Live」の提供を開始しました。音響的なニュアンスの認識精度が向上し、より自然な対話や複雑なタスク処理の対応が可能です。

このニュースのポイント

Google、リアルタイム音声対話モデルの最新版「Gemini 3.1 Flash Live」提供開始
音響的なニュアンスの認識精度が向上し、より自然な対話と複雑なタスク処理を実現
「Search Live」機能は多言語対応により200以上の国・地域へ拡大

米Googleは、リアルタイム音声対話の最新モデル「Gemini 3.1 Flash Live」の提供を開始しました。開発者、企業、そして一般ユーザーに、より直感的な体験を提供します。

本モデルは、Geminiのリアルタイム対話機能を進化させ、次世代の音声ファーストAIに必要なスピードと自然なリズムを実現しました。全体的な品質と信頼性の向上により、開発者や企業は、複雑なタスクを大規模に処理する音声ファーストのエージェントを構築できます。

さまざまな制約条件下で複数ステップの関数呼び出し能力を測るベンチマーク「ComplexFuncBench Audio」では、従来モデルを上回る90.8%のスコアを獲得しました。

Scale AIの「Audio MultiChallenge」では、思考機能をオンにした状態で36.1%のスコアを獲得しました。このテストは、実際の音声会話特有の中断やためらいがある状況下で、複雑な指示に従う能力や長期的な推論能力を測るものです。

本モデルは、より自然な対話のため、声のトーンやペースの認識精度が向上しています。法人向け「Gemini Enterprise for Customer Experience」では、従来モデル以上に音響的なニュアンスを認識し、ユーザーの不満や混乱にも臨機応変に応答します。

騒がしい環境でも複雑なタスクを処理できる音声対応エージェントを構築できるほか、音声を使ったコード入力や、素早い反復作業も可能です。

「Gemini Live」や「Search Live」機能では、日常の簡単な質問から複雑な会話まで、より有用で自然な応答を提供します。

Gemini Liveは本モデルの搭載により、従来モデルと比較してより速い応答を提供します。会話の流れを従来の2倍長く維持でき、長時間のブレインストーミングでも思考の流れを途切れさせることなく進めることができます。

「Search Live」がグローバル展開することも今週発表されました。この機能拡張は「Gemini 3.1 Flash Live」が多言語対応が標準装備であることによって実現しました。200以上の国と地域で、自分が好む言語で検索し、リアルタイムでマルチモーダルな会話ができるようになります。

なお、本モデルで生成されるすべての音声には、SynthIDの透かしが入っています。この目に見えない透かしは音声出力に直接埋め込まれており、AI生成コンテンツを確実に検出して誤情報の拡散を防ぐのに役立ちます。

「Gemini 3.1 Flash Live」は、Google製品全体で利用可能です。

出典：Google

株式会社アイスマイリーが運営するAIポータルメディア「AIsmiley」は、AIの専門家によるコンテンツ配信とプロダクト紹介を行うWebメディアです。AI資格を保有した編集部がDX推進の事例や人工知能ソリューションの活用方法、ニュース、トレンド情報を発信しています。

・Facebookでも発信しています @AIsmiley.inc
・Xもフォローください @AIsmiley_inc
・Youtubeのチャンネル登録もお願いいたします@aismiley
メルマガに登録する