Googleが拡散型AI公開|文章を4倍速で生成

伊東雄歩
監修者 伊東 雄歩

株式会社ウォーカー CEO。東北大学卒。MENSA会員、JDLA認定講師、健全AI教育協会理事。生成AI×教育・学習科学を専門とし、2億円超のシステム開発プロジェクトを統括。

taolis.net X note Voicy YouTube
  • Googleが2026年6月10日、文章を「一気にまとめて」作る新しいAI「DiffusionGemma」を公開しました
  • 1文字ずつ書く従来のAIと違い、最大4倍速い生成スピードが特徴です
  • 誰でも無料で使えるオープンモデル(Apache 2.0ライセンス)で、自分のパソコンでも動かせます
  • 速さと引き換えに、文章の品質は通常版より少し落ちるという正直な弱点もあります
  • 競合のMercury 2やGemini Diffusionとの違い、日本のユーザーへの影響もやさしく解説します

AIに文章を頼んだとき、答えが1文字ずつ表示されるのを待った経験はありませんか?実は今までのAIは、文章を「左から順番に」書いていました。ところがGoogleの新しいAIは、文章を絵を描くように「一気に」作ります。この記事では、話題の新技術「DiffusionGemma」が何者で、どれくらいすごいのか、ライバルや日本への影響まで、やさしく解説します。

DiffusionGemmaとは?何が新しいのか

DiffusionGemma(ディフュージョン・ジェマ)は、Googleが2026年6月10日に公開した新しい文章生成AIです。

開発したのはGoogle DeepMind(グーグルのAI研究部門)で、半導体大手のNVIDIA(エヌビディア)も協力しています。

名前にある「Diffusion(拡散)」がこのAIの最大の特徴です。これまでの文章AIとは、文章の作り方そのものが違います。

普通のAI(ChatGPTやGeminiなど)は、文章を「1単語ずつ、左から右へ」順番に書いていきます。タイプライターで打つようなイメージです。

一方DiffusionGemmaは、256単語ぶんをまとめて一度に作り、それを何度も磨いて仕上げます。絵をぼんやりした状態から少しずつくっきりさせていく感覚に近いです。

この作り方のおかげで、生成スピードが大きく上がりました。

「拡散」で文章を作るとはどういうこと?

少しだけ仕組みをのぞいてみましょう。むずかしくないので安心してください。

スタートは「ノイズだらけの下書き」

DiffusionGemmaはまず、意味のないランダムな単語(ノイズ)をたくさん並べた「下書き」から始めます。

そこから何度もやり直しを繰り返し、少しずつ意味の通る文章へと変えていきます。

これが「拡散モデル」と呼ばれる仕組みです。もともとは画像生成AIで使われていた技術を、文章に応用したものです。

なぜ速くなるの?

従来のAIが「1単語ずつ」なのに対し、DiffusionGemmaは256単語を同時に処理します。

同じ作業を1人でやるか、256人で手分けするかの違いと考えるとイメージしやすいです。

だからこそ、文章が完成するまでの時間を大きく短くできるのです。

どれくらい速い?スペックと数字

気になるスピードを具体的な数字で見てみましょう。

Googleによると、生成速度は従来方式の最大4倍。高性能GPU「NVIDIA H100」では1秒あたり1,000単語以上を生み出します。

個人向けの高性能ビデオカード「RTX 5090」でも、1秒あたり700単語以上のスピードが出ます。

モデルのサイズは合計260億パラメータ(AIの脳細胞のようなもの)の「MoE」という設計です。実際に動くときは38億パラメータだけを使うため、軽快に動きます。

データを圧縮すれば18GBのメモリに収まり、ハイエンドの個人パソコンでも動かせます。さらに一度に約26万単語ぶんの長い文章も扱えます。

そして大きいのが、Apache 2.0という自由なライセンスで無料公開されたこと。誰でもダウンロードして、商用利用や改造もできます。

競合との比較:Mercury 2・Gemini Diffusion・LLaDA

実はDiffusionGemmaは、この分野で「初めて」ではありません。テキスト拡散モデルにはすでにライバルがいます。

Mercury 2(インセプション・ラボ)

スタートアップのInception Labsが出すMercury(マーキュリー)は、2025年2月に登場した商用初の拡散型AIです。

最新のMercury 2はスピードでDiffusionGemmaに並び、ベンチマーク(性能テスト)ではむしろ上回ったと報じられています。

Gemini Diffusion(Google)

Google自身も2025年5月にGemini Diffusionを発表済みです。1秒あたり1,479単語という高速さで、コーディング能力も通常版にほぼ並びました。

ただしこちらは非公開のサービス。今回のDiffusionGemmaは「誰でも使える公開版」という点で意味が違います。

LLaDA(オープン研究の先駆け)

2025年2月のLLaDAは、80億パラメータで従来AIとの差をぐっと縮め、AIの国際学会NeurIPS 2025でも高く評価されました。

つまりDiffusionGemmaは、「オープン公開」「大規模」「自由なライセンス」の3つを初めて1つにまとめた点が新しいのです。

弱点・トレードオフ:速いけど品質は?

いいことばかりに見えますが、Googleは正直な弱点も認めています。

それは、文章の品質が通常版「Gemma 4」より少し低いこと。スピードを優先したぶん、賢さでは一歩ゆずります。

Google自身も「最高品質が必要な仕事には通常版のGemma 4を使ってください」と案内しています。

また、速さのメリットが活きるのは主に「自分のパソコンで1人が使う」ような場面です。大勢が同時に使うクラウドサービスでは、従来方式のほうが効率的な場合もあります。

とはいえ、得意分野もあります。数独パズルを解かせる実験では、調整版が80%の正解率を出しました(通常のAIはほぼ0%)。前後の文脈を同時に見られる拡散型の強みが出た例です。

日本のユーザー・企業にどう関係する?

「海外の技術でしょ?」と思うかもしれませんが、日本にも関係があります。

まず、DiffusionGemmaは無料で公開されているので、日本の企業も自由に使って自社向けに改造できます

Hugging Face(AIモデルの配布サイト)からダウンロードでき、vLLMやNVIDIA NeMoなど多くの開発ツールに対応します。

ある日本のメーカーが、社内文書を要約するAIを自社サーバーで動かす場面を想像してみてください。データを外に出さず、しかも高速。こうした「AIの内製化」を後押しします。

近年、日本ではPLaMoやELYZAなど国産AIの開発も進んでいます。Googleの高速モデルが無料で手に入ることは、開発の参考にも刺激にもなります。

一方で、現時点で日本語にどこまで強いかは公式に明言されていません。日本語の長文をまかせる場合は、実際に試して品質を確かめるのが安心です。

よくある質問(FAQ)

Q1. DiffusionGemmaは無料で使えますか?
はい。Apache 2.0という自由なライセンスで公開されており、ダウンロードも商用利用も無料です。

Q2. 自分のパソコンで動かせますか?
データを圧縮すれば18GBのメモリで動くため、RTX 5090などハイエンドのGPUを積んだパソコンなら動かせます。一般的なノートパソコンでは難しいです。

Q3. ChatGPTやGeminiの代わりになりますか?
用途しだいです。スピード重視の作業には向きますが、文章の品質は通常版より少し低めです。じっくり書く仕事には従来モデルが安心です。

Q4. なぜ「拡散」だと速いのですか?
1単語ずつではなく、256単語をまとめて同時に作るからです。手分けして作業するイメージで、完成までの時間を短縮できます。

Q5. 日本語にも対応していますか?
多言語の文章を学習していますが、日本語性能の詳細は公式に示されていません。日本語で使うなら実際に試して確認するのがおすすめです。

まとめ

DiffusionGemmaのポイントを振り返ります。

  • Googleが2026年6月10日に公開した、文章を「一括生成」する新型AI
  • 1単語ずつではなく256単語を同時に作り、最大4倍速い
  • Apache 2.0で無料公開され、自分のパソコンでも動かせる
  • 速さと引き換えに、品質は通常版Gemma 4よりやや低い
  • 無料・改造自由なので、日本企業のAI内製化にも役立つ

まずはHugging Faceで公開ページをのぞき、どんなことができるのか触れてみるところから始めてみましょう。

参考文献

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です