Googleは、70以上の言語でリアルタイムの会話型翻訳をサポートするGemini 3.5 Live Translateをリリースしました。

Googleによると、Gemini 3.5 Live Translateは70以上の言語を認識し、話者のイントネーション、リズム、ピッチを維持しながら、滑らかで自然な音声の翻訳を生成できるとのことです。

ユーザーが話し終えるまで翻訳を開始するターン制翻訳ソリューションとは異なり、Gemini 3.5 Live Translateは会話全体を通して継続的に動作します。この技術は、精度を高めるための追加コンテキストの待機と、話者との同期を維持するための即時翻訳のバランスを取っています。その結果、翻訳された音声は元の音声からわずか数秒遅れるだけで済み、煩わしい中断を最小限に抑えます。

Google翻訳とGoogle Meetで利用可能です

Googleは、AndroidおよびiPhone向けGoogle翻訳アプリで、Gemini 3.5ライブ翻訳機能の提供を開始したと発表しました。ヘッドホン使用時に画面左下にある「ライブ翻訳」オプションをタップするだけで、ライブ翻訳機能を利用できます。

特筆すべきは、Android版には「リスニングモード」と呼ばれる新機能が搭載されている点です。この機能を使えば、ヘッドホンがない場合でも、スマートフォンのスピーカーを通して翻訳音声を聞くことができます。通常の通話時と同じように、スマートフォンを耳に当てるだけで翻訳内容を聞くことが可能です。

Google翻訳に加え、Gemini 3.5 Live TranslateもGoogle Meetオンライン会議プラットフォームで利用可能になります。従来、Google Meetの音声翻訳機能は5言語のみに対応していましたが、新しいモデルでは70以上の言語に対応し、従来のように主に英語との相互翻訳ではなく、1回の会議内で2,000種類以上の言語の組み合わせが可能になります。

Google Meetのウェブ版では、Googleは新しい操作ボタンを追加し、ユーザーがワンクリックで会議中に音声翻訳機能を有効にできるようにした。

Google Meet の Gemini 3.5 ライブ翻訳機能が、Google Workspace を利用している一部の企業顧客向けにプライベートプレビューとして展開され始めています。Google は近い将来、展開対象を拡大する予定です。

安全性に関して、GoogleはAIが生成したすべての音声にSynthIDというデジタルスタンプが付与されていると述べています。これは人間の耳には聞こえないデジタルスタンプで、音声に直接埋め込まれており、システムがAI生成コンテンツを検出できるようにすることで、誤情報の拡散を抑制し、デジタル環境における透明性を高めるのに役立ちます。

LE PHI（9to5googleによる）

出典: https://baocantho.com.vn/google-tung-ra-gemini-3-5-live-translate-ho-tro-phien-dich-dam-thoai-truc-tiep-hon-70-ngon-ngu-a207022.html