Googleは米国時間4月6日、オフラインで動作するAI音声入力アプリ「Google AI Edge Eloquent」を「iPhone」向けにリリースした。言いよどんだ部分を削除し、ほとんど編集の必要がない実用的なテキストに変換する高度な機能を備えている。現時点の対応言語は英語のみ。
Googleは、近年改善されつつもまだ残っている、不正確または不明瞭な音声の文字起こしという課題の解決に取り組んでいる。文字起こしの間違いは、アプリが発言を正しく変換できなかった場合や、話し手が躊躇したりとりとめもなく話したりして、一時の沈黙や「えー」「あー」といった言いよどみでテキストが乱れてしまう場合などに起きる。
この新しいアプリでは、ボタンをタップしてマイクに向かって話し、画面にテキストが表示されるのを眺めるだけでいい。話し終えると、Googleのオンデバイスモデル「Gemma」が自動的にテキストをブラッシュアップする。
「App Store」の説明によると、「うーん」「あー」といった言いよどみや、文中での言い直しはすべて削除され、綺麗なテキストだけが残るという。テキストをさらに調整することもできる。
AI Edge Eloquentは完全にオフラインで動作するため、データはすべてデバイス内にとどまる。また、アプリをGoogleアカウントに連携させて「Gmail」のデータに基づいた辞書を作成したり、クラウドに接続して「Gemini」による高度なテキスト修正機能を利用したりもできる。
アプリのレイアウトはシンプルで、画面下部には「録音」「履歴」「辞書」「設定」を示すアイコンが並ぶ。辞書セクションには手動で単語を追加できるほか、アプリが名前の綴りを間違えた場合など、ユーザーが修正した単語が自動的に登録される。
サブスクリプションは不要だ。
Googleはすでに多くの製品で音声文字起こし機能を提供しているが、無料で使えてテキストのブラッシュアップもできるスタンドアロンの選択肢を求めている人にとって、このアプリは有力な選択肢になるだろう。
このアプリはAndroidユーザー向けにはまだ提供されていないが、App Storeの説明文にはAndroid版の計画を示唆する記述がある。
Googleの担当者はコメントの依頼に対し、すぐには回答しなかった。
この記事は海外Ziff Davis発の記事を4Xが日本向けに編集したものです。
スマートフォン 売れ筋ランキング(Amazon)
Amazonで開催中のセールを見る
Amazonのアソシエイトとして、CNET Japanは適格販売により収入を得ています。
