Gemini Omni流出｜Google新動画AIの正体

監修者伊東雄歩

株式会社ウォーカー CEO。東北大学卒。MENSA会員、JDLA認定講師、健全AI教育協会理事。生成AI×教育・学習科学を専門とし、2億円超のシステム開発プロジェクトを統括。

Googleの新AI「Gemini Omni（ジェミニ・オムニ）」が正式発表の直前にリークしました
テキスト・画像・動画を1つのAIでまとめて作れる「統合モデル」です
動画の編集を、チャットの言葉だけで指示できます（専用ソフト不要）
画質は世界トップのSeedance 2.0に一歩譲りますが、使いやすさで勝負します
正式発表は、本日開幕のGoogle I/O 2026（5月19〜20日）が有力です

動画を作るのに、もう専用ソフトはいらないかもしれません。Googleの新しいAI「Gemini Omni」が、正式発表の前にうっかり姿を見せました。テキストも画像も動画も、たった1つのAIで作れる時代がやってきます。この記事では、リーク情報からわかったOmniの正体と、私たちへの影響をやさしく解説します。

Gemini Omni（ジェミニ・オムニ）とは？リーク内容まとめ

Gemini Omniは、Googleが開発中とみられる新しい動画生成AIです。

事の発端は2026年5月2日でした。あるユーザーが、GeminiアプリのなかにOmniの表示を見つけたのです。

その後、Redditには新しい「モデルカード（AIの説明書き）」のスクリーンショットが流出しました。

そこにはこう書かれていました。「Gemini Omniで作ろう。新しい動画モデルです。動画をリミックスし、チャットで直接編集し、テンプレートも試せます」。

つまり、うっかり一部のユーザーに公開されてしまったか、こっそりテスト中だった可能性が高いです。

ただし注意点があります。Googleはまだ正式には認めていません。あくまでリーク段階の情報です。

正式発表は、本日開幕の「Google I/O 2026」が有力とみられています。会期は5月19〜20日、基調講演は米国時間19日の午前10時です。

なぜ「1本のパイプライン」がすごいのか

Omniの一番のポイントは、すべてを1つのAIで作れることです。

これまでGoogleは、動画は「Veo 3.1」、画像は「Nano Banana（ナノバナナ：Googleの画像生成AI）」と、別々のAIを使い分けていました。

Omniは、文章も画像も動画も、ひとつの流れ（パイプライン）でまとめて作ります。

トップクラスのAIで動画を直接出せるのは、これが初めてだと言われています。

生成できるのは、いまのところ約10秒のクリップです。

すごいのは、映像と音が最初からそろっている点です。足音は着地のタイミングで鳴り、セリフは口の動きと合い、部屋の環境音もシーンに合っています。

さらに、場面（ショット）が変わっても、登場人物の顔や衣装が変わらないと言われています。長い文脈を引き継ぐ仕組みのおかげです。

チャットで動画を編集できる——具体的な使い方

Omniの便利さは、実際の場面で考えるとよくわかります。3つの例を見てみましょう。

1つ目。YouTube用の短い動画を作る個人クリエイターさん。完成した動画に「透かしを消して」とチャットで打つだけで、透かしが消えます。編集ソフトを開く必要はありません。

2つ目。小さな会社の広報担当者さん。商品紹介動画で「赤い車を黒い車に変えて」と入力します。撮り直しゼロで、車の色だけが差し替わります。

3つ目。オンライン教室の先生。黒板に数式を書く解説動画を作ります。リークでは、Omniは数式の中身を正しく理解し、リアルに描けたと評判でした。

こうした「透かし消し」や「物の差し替え」のような作業で、編集時間を30〜50%短縮できると言われています。

一方で、夕食シーンのような複雑な指示では、物が突然わいて出るような不自然さも残っていたそうです。まだ発展途上の部分もあります。

ライバルとの比較（Seedance 2.0・Veo 3.1・Sora 2）

動画AIの競争は、いま激しさを増しています。主なライバルを整理します。

Seedance 2.0（バイトダンス）：画質が世界トップ。動画生成の実力ランキング（Eloスコア）で1位です（テキスト→動画1,269、画像→動画1,351）。
Veo 3.1（Google DeepMind）：Googleの現行の主力動画AI。映画のようなカメラワークと、音声の同期が得意です。ただし地域制限があります。
Sora 2（OpenAI）：2026年4月29日に一般向けアプリを終了。いまはAPI経由でしか使えません。
Gemini Omni（Google）：生の画質はSeedanceに一歩譲りますが、チャット編集と使い勝手で差別化します。

つまり、画質で選ぶならSeedance、編集のしやすさや使い勝手で選ぶならOmni、という住み分けになりそうです。

勝者は1つではなく、用途によって選ぶ時代になってきました。

Google I/O 2026で他に何が発表される？

Omniは、Google I/O 2026の数ある発表のひとつにすぎません。ほかにも注目の発表が予想されています。

Gemini 4.0（または3.5）：目玉となる大型アップデート。OpenAIのGPT-5.5に対抗します。
Gemini Spark：複雑な多段階の作業をこなす、常駐型のAIエージェントです。
Android XRグラス：表示なし版と画面付き版の2種類。Samsungなどが協力します。
Aluminium OS：AndroidとChromeOSを統合した新しいOSです。
Googlebook：この秋に登場予定の、AIファーストなノートパソコンです。

Googleは「Geminiを生活に欠かせない基盤にする」という姿勢を強めています。Omniはその一手なのです。

日本のユーザー・企業への影響

日本に住む私たちには、どう関係するのでしょうか。

まず言語の面です。Geminiはすでに日本語に対応しています。そのためOmniも、日本のGeminiユーザーが日本語で使える見込みです（公式発表待ち）。

ただし、すぐ全員が使えるわけではありません。広い一般公開は基調講演の2〜4週間後になる見込みです。Geminiの有料プランに応じて、段階的に開放されると言われています。

もうひとつ注意点があります。動画生成はクレジット（利用枠）の消費が早いそうです。動画を2本作ると、AI Proプランの1日分をほぼ使い切ったという報告もあります。

とはいえ、影響は大きいです。中小企業のSNS動画、学校の教材づくり、個人のVlog——専門ソフトなしで作れる時代が近づいています。

日本では国産の動画AIはまだ少ないのが現状です。Omniが普及すれば、動画制作のハードルが一気に下がるかもしれません。

よくある質問（FAQ）

Q1. Gemini Omniはもう使えますか？

A. まだです。現在はリーク段階で、正式発表はGoogle I/O 2026が有力です。広い一般公開は基調講演の2〜4週間後の見込みです。

Q2. 無料で使えますか？

A. Flash（軽量版）とPro（高性能版）の2段階が用意されるとみられます。Geminiの有料プランに紐づく可能性が高く、無料枠は限定的かもしれません。

Q3. 何秒の動画が作れますか？

A. リークでは約10秒のクリップでした。今後、長くなる可能性もあります。

Q4. 画質はSoraやSeedanceより上ですか？

A. 生の画質はSeedance 2.0が上です。Omniは画質よりも、編集のしやすさと統合性で勝負しています。

Q5. 日本語で使えますか？

A. Geminiは日本語に対応済みなので、Omniも日本語で使える見込みです（正式発表待ち）。

まとめ

Gemini Omniは、文章・画像・動画を1つのAIで作れる統合モデルです
2026年5月2日に存在がリークし、正式発表はGoogle I/O 2026が有力です
動画の編集を、チャットの言葉だけで指示できるのが最大の特徴です
画質はSeedance 2.0に譲りますが、使いやすさで差別化します
日本でも日本語で使える見込みですが、一般公開はまだ先になりそうです

まずはGoogle I/O 2026の基調講演で、Omniが正式に発表されるかをチェックしてみましょう。

参考文献

こんな時代だから遊んで学びたい

AIを学ぶオンラインサロン「AIフレンズ」では、生成AIを楽しく、どこよりも優しく学べる環境をご用意しております。

毎週開催されるオンラインセッションでは、リアルタイムで学び合える機会を提供しています。さらに、月に一度のオフラインイベントでは、メンバー同士が直接交流し、アイデアや知識を深めることができます。

「AIフレンズ」の仲間とともに、新しい価値を創造し、可能性を広げてみませんか？

一緒に学び、成長しながら、生成AIを使いこなす力を身につけましょう！

今すぐAIフレンズに参加して、未来への第一歩を踏み出そう！！