Googleが無料で使える音声認識ツール「Google AI Edge Eloquent」をiOS向けにリリースしました。プレスリリースやブログ投稿など何の発表もなく静かにリリースされたため、実際にどんなアプリなのかを確かめてみました。

Google AI Edge Eloquentアプリ – App Store
https://apps.apple.com/jp/app/google-ai-edge-eloquent/id6756505519

iPhoneでApp Storeの「Google AI Edge Eloquent」のページを開き、インストールして「開く」をタップします。


利用規約やプライバシーポリシーの画面が出るので「Continue」をタップ。


モデルのダウンロードが始まります。


「Uh, yeah, well. For the meeting. Let’s do it 3pm? Thanks. Talk to you soon」と発音するよう指示されました。下部にあるマイクマークのボタンをタップします。


マイクへのアクセス権を求められるので「許可」をタップ。


できるだけ原文に忠実に、「Uh」や「well」なども丁寧に発音したところ、自動でテキストのクリーンアップが行われ「Yeah, for the meeting. let’s do it 3:00 p.m. Thanks. Talk to you soon」ときれいなテキストに整えられました。「Next」をタップします。


Googleアカウントと接続することで自分のアカウント内のデータから辞書を作成できるとのこと。今回は接続せずに「Next」をタップしました。


音声認識は常にローカル環境で行われますが、テキストのクリーンアップはクラウドとローカルのどちらで処理するかを選択可能とのこと。右上のスイッチが「Off」であればローカルで全ての処理が完結することになります。「Next」をタップ。


これでチュートリアルは完了です。「Finish onboarding」をタップします。


英語での威力は十分理解できたので、日本語の認識もできないかを試してみましたが、途中で「Google」と発音した部分しか聞き取ってもらえませんでした。記事作成時点では英語のみの対応となっているようです。


Google Playにも同様のツールがリリースされていないかチェックしてみましたが、記事作成時点では存在していないようでした。

この記事のタイトルとURLをコピーする