声色ごと70言語を同時通訳|Geminiの新AI

伊東雄歩
監修者 伊東 雄歩

株式会社ウォーカー CEO。東北大学卒。MENSA会員、JDLA認定講師、健全AI教育協会理事。生成AI×教育・学習科学を専門とし、2億円超のシステム開発プロジェクトを統括。

taolis.net X note Voicy YouTube
  • Googleが新しい音声翻訳AI「Gemini 3.5 Live Translate」を2026年6月9日に公開しました
  • 70以上の言語に対応し、話し手の声色や抑揚を保ったまま、ほぼ同時に翻訳します
  • 話し終わるのを待たずに少しずつ訳す「連続翻訳」で、会話のテンポが自然です
  • 「Google翻訳」アプリ、Google Meet、開発者向けAPIの3つで使えます
  • 日本語にも対応し、海外旅行やオンライン会議の言葉の壁が大きく下がります

海外の人と話すとき、言葉が通じなくて困った経験はありませんか。Googleが発表した「Gemini 3.5 Live Translate」は、その悩みをほぼ解消するかもしれません。話した声をそのまま、別の言語へリアルタイムで訳してくれます。しかも声の雰囲気まで残したまま。この記事では、何がすごいのか、いつ使えるのか、日本での影響まで、やさしく解説します。

Gemini 3.5 Live Translateとは何か

Gemini 3.5 Live Translate(ジェミニ・ライブ・トランスレート)は、Googleが2026年6月9日に公開した音声翻訳AIです。

かんたんに言うと、話した声をすぐに別の言語の音声に訳してくれるAIです。

文字ではなく「音声から音声へ」訳すのが特徴です。あなたが日本語で話すと、相手には英語の音声が届きます。

対応するのは70以上の言語です。もちろん日本語も含まれています。

しかも、どの言語で話しているかをAIが自動で見分けます。設定でいちいち言語を選ぶ必要がありません。

「同時通訳」に近い体験

これまでの翻訳アプリの多くは「ターン制」でした。話し終わってから、訳が返ってくる方式です。

Gemini 3.5 Live Translateは違います。話している途中から、少しずつ訳の音声を流し始めます

つまり、人間の同時通訳者に近いやり方です。話し手から数秒だけ遅れて、訳がついてきます。

Googleによると、会話の途中で不自然な「間」ができにくく、テンポよく話せるそうです。

何がすごいのか 3つのポイント

このAIの「すごさ」は、大きく3つにまとめられます。

1. 声色や抑揚を保ったまま訳す

一番の進化は、ここかもしれません。

これまでの音声翻訳は、訳した声が機械的で平坦になりがちでした。

Gemini 3.5 Live Translateは、話し手のイントネーション(声の上げ下げ)、話す速さ、声の高さを保ったまま訳します。

うれしそうに話せば、訳された音声もうれしそうに聞こえます。感情のニュアンスが伝わりやすくなるのです。

2. ほぼ遅れずに訳す「連続翻訳」

AIは「待って正確に訳す」か「すぐ訳してテンポを保つ」かのバランスをとっています。

その結果、話し手から数秒遅れるだけで訳の音声が流れ続けます。

長い沈黙を待つストレスが減り、会話が自然に進みます。

3. うるさい場所でも使える

このAIは、雑音に強く作られています。

駅や空港、にぎやかなレストランのような場所でも、声を聞き取って訳せるとされています。

旅行先のような「予測できない環境」での実用性を意識した設計です。

どこで使えるのか 3つの提供形態

Gemini 3.5 Live Translateは、3つのルートで提供されます。利用者のタイプごとに分かれています。

一般ユーザー向け:Google翻訳アプリ

ふつうのユーザーが一番使いやすいのが、これです。

AndroidとiPhoneの「Google翻訳」アプリに、世界中へ順次提供されます。

さらにAndroidには新しい「リスニングモード」が加わります。イヤホンがなくても、スマホ本体のスピーカーから訳した音声を聞けます。

ビジネス向け:Google Meet

オンライン会議ツールの「Google Meet」にも入ります。

一部の法人向けGoogle Workspace顧客で、2026年6月からプライベートプレビュー(限定先行公開)が始まります。年内にもっと広く提供される予定です。

注目すべきは言語の組み合わせです。1つの会議で70以上の言語、2000以上の言語の組み合わせに対応します。

9か月前まで、Google Meetの翻訳は5言語ほどで、すべて英語を経由していました。そこからの大きな進歩です。

開発者向け:APIとAI Studio

アプリやサービスを作る人向けには、「Gemini Live API」と「Google AI Studio」で公開プレビューが始まっています。

自社のアプリにこの翻訳機能を組み込めます。チャットアプリや配信サービスへの応用が期待されます。

すでに企業も実験中 Grabの事例

このAIは、すでに実際の現場でテストが始まっています。

東南アジアの配車・配達大手Grab(グラブ)が、その一例です。

Grabでは、運転手と乗客が言葉の違いで困る場面があります。とくに待ち合わせのときです。

Grabのユーザーは、アプリ経由で月1000万件以上の音声通話をしています。ここにLive Translateを使い、運転手と外国人旅行者がスムーズに連絡を取れるか試しています。

ほかにも、韓国のメディア大手CJ ENMや、配信技術の企業LiveKitなどがフィードバックを寄せています。

他のサービスと何が違う? 競合との比較

リアルタイム音声翻訳は、Googleだけのものではありません。主なライバルと比べてみましょう。

DeepL Voice

翻訳精度に定評のあるDeepLも、「DeepL Voice」という音声翻訳を出しています。

こちらはMicrosoft TeamsやZoomで使える、ビジネス会議向けが中心です。文脈を読んだ自然な翻訳が強みです。

ポケトーク

日本でおなじみの専用翻訳機「ポケトーク」も健在です。アプリ版は74言語に対応しています。

専用ハードウェアで、シンプルに使える点が魅力です。1対多の一斉通訳に対応する新機種も予定されています。

Samsung Galaxy AI

サムスンのスマホには、電話の通話をリアルタイムで通訳する機能が入っています。

ただし、こちらは自社スマホ「Galaxy」シリーズが中心です。

Gemini 3.5 Live Translateの立ち位置

Gemini 3.5 Live Translateの強みは、「声色の保持」と「対応言語の多さ」、そして提供の広さです。

無料のGoogle翻訳アプリ、会議ツール、開発者向けAPIまで一気にカバーします。多くの人がすぐ触れられる点が、他と大きく違います。

日本市場への影響

この発表は、日本に住む私たちにも関係が深いです。

日本語はもともと対応言語に含まれています。Google翻訳アプリは無料で、多くの日本人がすでに使っています。

たとえば、訪日外国人観光客(インバウンド)の対応を考えてみましょう。

飲食店やホテルのスタッフが、スマホ1台で世界中の客と会話できます。専用の通訳機を買わなくても始められます。

また、海外とオンライン会議をする日本企業にもメリットがあります。Google Meetの翻訳が強化されれば、英語が苦手でも会議に参加しやすくなります。

個人の海外旅行でも便利です。空港やレストランで、相手の声色まで伝わる翻訳が手元のスマホで使えます。

一方で注意点もあります。AIが生成した音声には、SynthID(シンスID)という見えない電子透かしが入ります。AIが作った音声だと後から判別できる仕組みで、悪用を防ぐ狙いです。

よくある質問(FAQ)

Q1. 料金はかかりますか?

一般ユーザー向けの「Google翻訳」アプリは無料で使えます。開発者向けAPIや法人向けGoogle Meetは、利用プランによって異なります。

Q2. 日本語は使えますか?

はい、使えます。日本語は70以上の対応言語に含まれています。

Q3. 完全に同時、つまり遅れゼロで訳されますか?

遅れはゼロではありません。話し手から数秒だけ遅れて訳が流れます。ただし従来のような長い「間」は減っています。

Q4. イヤホンは必要ですか?

必須ではありません。Androidの新しい「リスニングモード」なら、スマホ本体のスピーカーから訳した音声を聞けます。

Q5. これまでのGoogle翻訳と何が違うのですか?

大きな違いは「声色を保つこと」と「話している途中から連続で訳すこと」です。より人間の同時通訳に近づきました。

まとめ

Gemini 3.5 Live Translateの要点を振り返ります。

  • Googleが2026年6月9日に公開した、音声から音声への翻訳AI
  • 70以上の言語に対応し、日本語も含まれる
  • 話し手の声色や抑揚を保ったまま、数秒遅れで連続翻訳する
  • Google翻訳アプリ、Google Meet、開発者向けAPIの3ルートで提供
  • 訪日対応やオンライン会議など、日本でも言葉の壁を下げる効果が期待できる

まずはお使いのスマホで「Google翻訳」アプリを最新版に更新し、音声翻訳を試してみましょう。

参考文献

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です