Google Nano Banana 2/Pro正式版|動画から画像も作れる

伊東雄歩
監修者 伊東 雄歩

株式会社ウォーカー CEO。東北大学卒。MENSA会員、JDLA認定講師、健全AI教育協会理事。生成AI×教育・学習科学を専門とし、2億円超のシステム開発プロジェクトを統括。

taolis.net X note Voicy YouTube
  • Googleが2026年5月29日、画像生成AI「Nano Banana 2」「Nano Banana Pro」の一般提供(GA)を開始した
  • 「Nano Banana 2」は動画ファイルをそのままプロンプトとして読み込み、文脈を理解した画像を生成できる新機能を搭載
  • 料金は1枚あたりNano Banana 2が約0.045ドル、Proが約0.134ドルから。4Kはまだプレビュー段階
  • Adobe Firefly EnterpriseやShopify、WPPなど大手企業がすでに業務に組み込み、広告・EC・3D制作で活用
  • すべての生成画像にはGoogleの電子透かし「SynthID」が埋め込まれ、AI生成物の識別が可能

画像生成AIは「文字から絵を作る」段階を超え、ついに「動画を見て静止画を作る」時代に入りました。Googleが2026年5月29日に正式公開したNano Banana 2は、動画を読み込ませて文脈に合った画像を生成できる初の汎用モデルです。広告制作やECサイトの商品画像、SNSコンテンツの作り方が一変する可能性があります。本記事では、何が変わったのか、料金はいくらか、日本企業はどう使えるのかを、わかりやすく整理します。

Nano Banana 2/Proが正式版に:何が起きたのか

2026年5月29日、GoogleはGoogle Cloud公式ブログで2つの画像生成モデルの一般提供(GA、Generally Available)開始を発表しました。

正式名称はそれぞれ「Gemini 3.1 Flash Image(通称Nano Banana 2)」「Gemini 3 Pro Image(通称Nano Banana Pro)」です。

これまでは「Preview(試験提供)」というラベルが付き、本番業務での利用が推奨されていませんでした。GAになったことで、企業向けの品質保証(SLA)が適用され、ビジネスの中核業務にも安心して組み込めるようになりました。

「Nano Banana」シリーズとは

Nano Bananaは、GoogleのAIアシスタント「Gemini(ジェミニ)」が裏側で使う画像生成エンジンの開発コードネームです。

シリーズは大きく3段階あります。

  • Nano Banana(初代):軽量・高速モデル。1枚約0.039ドルと低価格
  • Nano Banana 2:第二世代。動画入力に対応し、解像度も最大4Kへ
  • Nano Banana Pro:上位モデル。文字を含む画像(スライド・チラシなど)の生成に強い

つまり、用途や予算に応じて3つから選べる体系が整ったということです。

提供プラットフォーム

正式版は「Gemini Enterprise Agent Platform」という法人向けクラウドで提供されます。月額契約のGoogle Cloud顧客が主な対象です。

個人開発者でも、Gemini APIを直接呼び出せば1枚単位の従量課金で使えます。ただしAPI経由はSLA対象外となる点に注意が必要です。

最大の進化:動画から画像を生成できる

今回最も注目されているのが、Nano Banana 2が動画ファイルをプロンプトとして受け取れるようになったことです。

これまでの画像生成AIは、テキスト・PDF・画像までしか入力できませんでした。動画への対応は業界初に近い試みです。

具体的に何ができるのか

たとえば、企業の研修動画を1本アップロードして「この動画の要点を1枚のインフォグラフィックにまとめて」と頼むことができます。

AIが動画内の人物の動き、登場するモノ、シーンの切り替わりを「深く理解」した上で、文脈に合った静止画を生成します。

想定される使い方は次の通りです。

  • 商品紹介動画から、ECサイト用の高品質サムネイル画像を自動生成
  • YouTube動画から、ブログ記事のアイキャッチを1クリックで作成
  • 研修動画から、社内資料向けのまとめスライドを自動デザイン
  • イベント動画から、SNS投稿用のハイライト画像を量産

従来は人が動画を視聴して、「ここがキメの瞬間だな」と判断し、スクリーンショットを撮って加工する作業が必要でした。Nano Banana 2はこの工程をまるごと自動化します。

なぜこれが革新的なのか

静止画から静止画を作るのは、すでに多くのAIができます。

しかし「時間軸を持つ動画を理解して、それを1枚の絵に凝縮する」のは、まったく別次元の難しさです。動画内のストーリーやキャラクターの感情、構図の変化を読み取る能力が必要だからです。

Googleはこれを実現するために、動画理解AI「Veo」シリーズの技術を画像生成側に応用したとみられます。

解像度・アスペクト比・出力品質

Nano Banana 2は512px〜4Kまで4段階、14種類のアスペクト比に対応しています。

具体的には、1Kと2Kは正式版(GA)で利用可能、4K出力は現時点ではプレビュー版として提供されています。

4K対応の意味

4K解像度(約3840×2160)に対応したことで、印刷物やテレビCMの素材としても使えるようになりました。

これまでの画像生成AIは1K〜2K程度が主流で、印刷ポスターには物足りない解像度でした。4K対応により、広告代理店や出版社が業務素材として使う選択肢に入ってきます。

SynthID(電子透かし)が必ず入る

Nano Bananaシリーズで生成された画像には、すべてSynthID(シンスID)と呼ばれるGoogle独自の電子透かしが埋め込まれます。

SynthIDは肉眼では見えませんが、専用ツールで検査するとAI生成物だと識別できます。著作権保護やフェイク画像対策の観点で、企業利用には心強い仕様です。

一方で、SynthIDを除去するOSSツールがGitHubで公開されるなど、いたちごっこの側面もあります。

料金:Nano Banana 2とProはいくら違うのか

気になる料金体系は、解像度とモデルによって細かく分かれています

API料金(1枚あたり)

  • Nano Banana 2(1K):約0.045ドル(約7円)
  • Nano Banana 2(4K):約0.151ドル(約23円)
  • Nano Banana Pro(1K/2K):約0.134ドル(約20円)
  • Nano Banana Pro(4K):約0.24ドル(約36円)
  • 初代Nano Banana:約0.039ドル(約6円)
  • Imagen 4 Fast(参考):約0.02ドル(約3円)

つまり、用途別に最適なモデルを選ぶことでコストを大幅に下げられます。SNS用のサムネイルなら初代Nano Bananaで十分、印刷物や広告ならProの4Kといった使い分けです。

個人向けプラン

個人ユーザーは「Google AI Pro」(月額2,900円)で、Nano Banana Proの高度な機能にアクセスできます。1枚ごとに課金されないため、毎日大量に生成するクリエイターはこちらが割安です。

競合との比較:Midjourney・DALL-Eと何が違うか

2026年現在、画像生成AIの主要プレイヤーはGoogle・OpenAI・Midjourneyの3社です。

それぞれの強みを整理すると、選び方が見えてきます。

Nano Banana 2/Proの強み

  • 動画入力対応:他社にはない独自機能
  • 文字入り画像が綺麗:スライド・チラシ・ポスターを直接生成可能
  • Google Cloud連携:BigQueryやWorkspaceとシームレスに統合
  • SynthID透かし:著作権・コンプライアンス面で安心

DALL-E 3(OpenAI)の強み

  • ChatGPT Plus(月20ドル)に追加料金なしで含まれる
  • 文字付き画像の正確性が高い
  • 会話の流れで自然に画像を生成できる

Midjourneyの強み

  • 芸術性・世界観の表現力が圧倒的
  • クリエイティブな素材作りに最適
  • Webアプリ版が登場し、Discord不要で使える

業務効率重視ならNano Banana、対話の流れで作るならDALL-E、作品性重視ならMidjourneyという棲み分けが定着しつつあります。

日本企業はどう使えるのか

正式版(GA)になったことで、日本企業にとっての導入ハードルが大きく下がりました。

海外の先行事例

すでにグローバル大手が業務に組み込んでいます。

  • Adobe Firefly Enterprise:Adobeの画像生成サービスにNano Banana 2を統合
  • WPP(広告大手):Verizon、L’Oreal、Unileverのクライアント向け広告制作で活用
  • Shopify:ECサイトの商品画像生成、バーチャル試着、カタログ充実化
  • URBN(Urban Outfitters):商品企画の初期段階で素材生成を加速
  • Magnopus:空間インテリジェンス基盤に組み込み、3Dコンテンツ制作に活用

日本での具体的な活用シーン

日本企業でも、次のような使い方が想定できます。

シーン1:地方の中小ECサイト運営者

商品撮影に毎月10万円かけていた小売店が、商品紹介動画1本からEC用の高品質画像を10種類生成。撮影コストをほぼゼロにしつつ、SNS投稿用バリエーションも自動で増やせます。

シーン2:広告代理店のクリエイティブ部

クライアントの新製品発表動画を読み込ませて、ポスター・バナー・SNS広告用のクリエイティブを一括生成。提案資料の作成スピードが3倍に上がります。

シーン3:研修動画を作る人事部

1時間の社内研修動画から、要点をまとめた1枚インフォグラフィックを自動作成。新入社員向けの復習資料を毎月量産できます。

導入時の注意点

便利な反面、いくつか気をつけたいポイントがあります。

  • API経由の利用はSLA対象外のため、業務用途ではGemini Enterprise Agent Platformの契約が望ましい
  • SynthID透かしが入るため、AI生成物だと識別される前提で運用する
  • 生成画像の商用利用は基本的にOKだが、著作権が侵害されないかは要確認
  • 動画入力プレビュー機能は今後仕様変更の可能性あり

よくある質問(FAQ)

Q1. Nano Banana 2とNano Banana Pro、どちらを選べばいい?

用途次第です。SNS用やブログのアイキャッチならNano Banana 2で十分。文字入りのチラシ・スライド・ポスターを作るならNano Banana Proが適しています。Proの方が文字レンダリングの精度が高いためです。

Q2. 個人で試すには、いくらかかる?

個人ならGoogle AI Pro(月額2,900円)で使い放題に近い形で試せます。試しに使ってみたい人は、まずGemini APIの無料枠から始めるのもいいでしょう。

Q3. 動画入力機能はどんな動画でも使える?

現時点ではプレビュー機能のため、対応形式やファイルサイズに制限があります。一般的なMP4ファイル(数十秒〜数分程度)であれば問題なく処理できると報告されています。長尺動画は分割が必要な場合があります。

Q4. SynthIDの透かしは消せる?

2026年5月にはSynthIDを除去するOSSツールも公開されており、技術的には可能とされています。ただし、透かしを意図的に除去してAI生成物だと隠す行為は、各種ガイドラインや規制で問題視される可能性があります。業務利用では透かしが入る前提で運用しましょう。

Q5. 日本語のプロンプトでも使える?

はい、Geminiは日本語プロンプトに高い精度で対応しています。ただし、より細かいニュアンスを出したい場合は英語プロンプトの方が制御しやすい傾向があります。プロンプトのコツは日本語と英語を併記することです。

まとめ:画像生成AIは「動画理解」時代へ

Nano Banana 2/Proの正式リリースで、画像生成AIは新しいステージに入りました。

  • Googleが2026年5月29日にNano Banana 2/Proを正式版(GA)で公開
  • 動画ファイルをそのまま読み込んで画像を生成できる業界初の機能
  • 料金は1枚7円〜36円。用途別にモデルを選び分けられる体系に
  • 4K出力にも対応し、印刷物・広告素材としても使える品質に
  • Adobe・Shopify・WPPなど大手企業がすでに業務に組み込み済み
  • すべての画像にSynthID透かしが入り、AI生成物の識別が可能

次のアクションとしては、まずGoogle AI Pro(月額2,900円)に登録して動画入力機能を実際に試してみるのがおすすめです。手持ちの商品紹介動画やイベント動画から、どんなクリエイティブが出来上がるか体験してみると、自社業務への適用イメージがつかめます。

参考文献

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です