Gemini Omni流出|Google新動画AIの正体

伊東雄歩
監修者 伊東 雄歩

株式会社ウォーカー CEO。東北大学卒。MENSA会員、JDLA認定講師、健全AI教育協会理事。生成AI×教育・学習科学を専門とし、2億円超のシステム開発プロジェクトを統括。

taolis.net X note Voicy YouTube
  • Googleの新AI「Gemini Omni(ジェミニ・オムニ)」が正式発表の直前にリークしました
  • テキスト・画像・動画を1つのAIでまとめて作れる「統合モデル」です
  • 動画の編集を、チャットの言葉だけで指示できます(専用ソフト不要)
  • 画質は世界トップのSeedance 2.0に一歩譲りますが、使いやすさで勝負します
  • 正式発表は、本日開幕のGoogle I/O 2026(5月19〜20日)が有力です

動画を作るのに、もう専用ソフトはいらないかもしれません。Googleの新しいAI「Gemini Omni」が、正式発表の前にうっかり姿を見せました。テキストも画像も動画も、たった1つのAIで作れる時代がやってきます。この記事では、リーク情報からわかったOmniの正体と、私たちへの影響をやさしく解説します。

Gemini Omni(ジェミニ・オムニ)とは?リーク内容まとめ

Gemini Omniは、Googleが開発中とみられる新しい動画生成AIです。

事の発端は2026年5月2日でした。あるユーザーが、GeminiアプリのなかにOmniの表示を見つけたのです。

その後、Redditには新しい「モデルカード(AIの説明書き)」のスクリーンショットが流出しました。

そこにはこう書かれていました。「Gemini Omniで作ろう。新しい動画モデルです。動画をリミックスし、チャットで直接編集し、テンプレートも試せます」。

つまり、うっかり一部のユーザーに公開されてしまったか、こっそりテスト中だった可能性が高いです。

ただし注意点があります。Googleはまだ正式には認めていません。あくまでリーク段階の情報です。

正式発表は、本日開幕の「Google I/O 2026」が有力とみられています。会期は5月19〜20日、基調講演は米国時間19日の午前10時です。

なぜ「1本のパイプライン」がすごいのか

Omniの一番のポイントは、すべてを1つのAIで作れることです。

これまでGoogleは、動画は「Veo 3.1」、画像は「Nano Banana(ナノバナナ:Googleの画像生成AI)」と、別々のAIを使い分けていました。

Omniは、文章も画像も動画も、ひとつの流れ(パイプライン)でまとめて作ります。

トップクラスのAIで動画を直接出せるのは、これが初めてだと言われています。

生成できるのは、いまのところ約10秒のクリップです。

すごいのは、映像と音が最初からそろっている点です。足音は着地のタイミングで鳴り、セリフは口の動きと合い、部屋の環境音もシーンに合っています。

さらに、場面(ショット)が変わっても、登場人物の顔や衣装が変わらないと言われています。長い文脈を引き継ぐ仕組みのおかげです。

チャットで動画を編集できる——具体的な使い方

Omniの便利さは、実際の場面で考えるとよくわかります。3つの例を見てみましょう。

1つ目。YouTube用の短い動画を作る個人クリエイターさん。完成した動画に「透かしを消して」とチャットで打つだけで、透かしが消えます。編集ソフトを開く必要はありません。

2つ目。小さな会社の広報担当者さん。商品紹介動画で「赤い車を黒い車に変えて」と入力します。撮り直しゼロで、車の色だけが差し替わります。

3つ目。オンライン教室の先生。黒板に数式を書く解説動画を作ります。リークでは、Omniは数式の中身を正しく理解し、リアルに描けたと評判でした。

こうした「透かし消し」や「物の差し替え」のような作業で、編集時間を30〜50%短縮できると言われています。

一方で、夕食シーンのような複雑な指示では、物が突然わいて出るような不自然さも残っていたそうです。まだ発展途上の部分もあります。

ライバルとの比較(Seedance 2.0・Veo 3.1・Sora 2)

動画AIの競争は、いま激しさを増しています。主なライバルを整理します。

  • Seedance 2.0(バイトダンス):画質が世界トップ。動画生成の実力ランキング(Eloスコア)で1位です(テキスト→動画1,269、画像→動画1,351)。
  • Veo 3.1(Google DeepMind):Googleの現行の主力動画AI。映画のようなカメラワークと、音声の同期が得意です。ただし地域制限があります。
  • Sora 2(OpenAI):2026年4月29日に一般向けアプリを終了。いまはAPI経由でしか使えません。
  • Gemini Omni(Google):生の画質はSeedanceに一歩譲りますが、チャット編集と使い勝手で差別化します。

つまり、画質で選ぶならSeedance、編集のしやすさや使い勝手で選ぶならOmni、という住み分けになりそうです。

勝者は1つではなく、用途によって選ぶ時代になってきました。

Google I/O 2026で他に何が発表される?

Omniは、Google I/O 2026の数ある発表のひとつにすぎません。ほかにも注目の発表が予想されています。

  • Gemini 4.0(または3.5):目玉となる大型アップデート。OpenAIのGPT-5.5に対抗します。
  • Gemini Spark:複雑な多段階の作業をこなす、常駐型のAIエージェントです。
  • Android XRグラス:表示なし版と画面付き版の2種類。Samsungなどが協力します。
  • Aluminium OS:AndroidとChromeOSを統合した新しいOSです。
  • Googlebook:この秋に登場予定の、AIファーストなノートパソコンです。

Googleは「Geminiを生活に欠かせない基盤にする」という姿勢を強めています。Omniはその一手なのです。

日本のユーザー・企業への影響

日本に住む私たちには、どう関係するのでしょうか。

まず言語の面です。Geminiはすでに日本語に対応しています。そのためOmniも、日本のGeminiユーザーが日本語で使える見込みです(公式発表待ち)。

ただし、すぐ全員が使えるわけではありません。広い一般公開は基調講演の2〜4週間後になる見込みです。Geminiの有料プランに応じて、段階的に開放されると言われています。

もうひとつ注意点があります。動画生成はクレジット(利用枠)の消費が早いそうです。動画を2本作ると、AI Proプランの1日分をほぼ使い切ったという報告もあります。

とはいえ、影響は大きいです。中小企業のSNS動画、学校の教材づくり、個人のVlog——専門ソフトなしで作れる時代が近づいています。

日本では国産の動画AIはまだ少ないのが現状です。Omniが普及すれば、動画制作のハードルが一気に下がるかもしれません。

よくある質問(FAQ)

Q1. Gemini Omniはもう使えますか?

A. まだです。現在はリーク段階で、正式発表はGoogle I/O 2026が有力です。広い一般公開は基調講演の2〜4週間後の見込みです。

Q2. 無料で使えますか?

A. Flash(軽量版)とPro(高性能版)の2段階が用意されるとみられます。Geminiの有料プランに紐づく可能性が高く、無料枠は限定的かもしれません。

Q3. 何秒の動画が作れますか?

A. リークでは約10秒のクリップでした。今後、長くなる可能性もあります。

Q4. 画質はSoraやSeedanceより上ですか?

A. 生の画質はSeedance 2.0が上です。Omniは画質よりも、編集のしやすさと統合性で勝負しています。

Q5. 日本語で使えますか?

A. Geminiは日本語に対応済みなので、Omniも日本語で使える見込みです(正式発表待ち)。

まとめ

  • Gemini Omniは、文章・画像・動画を1つのAIで作れる統合モデルです
  • 2026年5月2日に存在がリークし、正式発表はGoogle I/O 2026が有力です
  • 動画の編集を、チャットの言葉だけで指示できるのが最大の特徴です
  • 画質はSeedance 2.0に譲りますが、使いやすさで差別化します
  • 日本でも日本語で使える見込みですが、一般公開はまだ先になりそうです

まずはGoogle I/O 2026の基調講演で、Omniが正式に発表されるかをチェックしてみましょう。

参考文献

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です