- Googleが2026年5月19日のI/Oで「Gemini 3.5 Flash」の一般提供を開始
- 競合フロンティアモデルの4倍速、毎秒289トークン出力という業界トップクラスの速度
- 価格は100万トークンあたり入力$1.50・出力$9.00、前世代Flashの3倍に値上げ
- Terminal-Bench 2.1で76.2%、Gemini 3.1 Proを上回るコーディング・エージェント性能
- Shopify・Salesforce・XeroなどがすでにAIエージェント基盤として採用を開始
「Geminiの新モデルが発表されたけど、自分の仕事に関係あるの?」と思った方も多いはず。今回登場したGemini 3.5 Flashは、ただの軽量モデルではありません。前世代のフラッグシップGemini 3.1 Proを上回るコーディング能力を、Flashクラスの速度で実現したGoogleの新たな主役です。価格・速度・エージェント能力の3つの観点から、何が変わるのかをわかりやすく解説します。
Gemini 3.5 Flashとは?2026年5月19日に一般提供開始
Googleは2026年5月19日、開発者向けカンファレンス「Google I/O 2026」でGemini 3.5 Flashの一般提供開始を発表しました。
Flashは「高速・低コスト」のモデルラインです。
しかし今回の3.5 Flashは、これまでとは方向性が違います。
「速いだけの軽量モデル」から「エージェント特化モデル」へ
従来のFlashは「とにかく安く、速く返してくれるモデル」でした。チャットボットや簡単な分類タスク向けです。
3.5 FlashはこれをAIエージェント(人間の代わりに作業を進めるAI)の実行基盤に変えました。
Google DeepMindのブログによれば、3.5 Flashは「コーディングとエージェントタスクで前世代の上位モデルGemini 3.1 Proを上回る」とされています。LLM(人間みたいに文章を書けるAI)の常識では、軽量版が上位版を超えるのは異例です。
どこで使えるのか
提供チャネルは大きく5つに分かれます。
- Geminiアプリ(スマホ・Web、無料ユーザーも利用可能)
- Google検索のAIモード(検索結果の上にAIが要約を生成)
- Google Antigravity(Googleの新しいエージェント向けIDE)
- Gemini API(Google AI Studio・Android Studio経由)
- Gemini Enterprise(法人向けエージェント基盤)
日本からも各サービス経由で利用できます。
毎秒289トークン――競合の4倍速はどれくらい?
3.5 Flashの一番の売りは速度です。具体的な数字を見てみましょう。
「4倍速」の正体
Googleによれば、3.5 Flashは出力トークン数で測定したとき競合フロンティアモデルの4倍速で動作します。
具体的には毎秒289トークンを出力します。
比較対象として、Claude Opus 4.7は毎秒67トークン、GPT-5.5は毎秒71トークン程度です。
つまり、同じ文章量を返すのに4分の1の時間しかかからない計算になります。
速度がエージェントに与える影響
「速い」と言われてもピンとこないかもしれません。
AIエージェントが何かを実行するとき、内部では「考える→道具を呼ぶ→結果を読む→また考える」というループを何十回も回します。
1回のループが1秒違うだけで、30回のループでは30秒の差になります。
たとえば長文の契約書をAIに読ませて要点を抽出させる場面。3.5 Flashなら数秒で結果が返ってきますが、競合モデルなら数十秒待つ必要があります。
これは「使えるか使えないか」の境界線を引く違いです。
価格は$1.50/$9.00――前世代の3倍に値上げ
速度と性能の話題に隠れがちですが、価格面には大きな変化があります。
具体的な料金体系
Gemini 3.5 Flashの料金は次の通りです。
- 入力トークン: 100万あたり$1.50(約230円)
- 出力トークン: 100万あたり$9.00(約1,400円)
- キャッシュ済み入力: 100万あたり$0.15(約23円)
- 非グローバルリージョン: $1.65 / $9.90(1割増し)
キャッシュ済み入力はAPI呼び出しを繰り返しても安く済むしくみです。同じシステムプロンプトを毎回送るような用途で大きな差が出ます。
前世代との価格差
前世代のGemini 3 Flash Previewは$0.50/$3.00でした。3.5 Flashは入出力ともにちょうど3倍の値上げです。
さらに前の世代のGemini 3.1 Flash-Liteと比較すると、6倍にもなります。
これは異例の値上げ幅です。Googleは「フロンティア級の性能を半分以下の価格で提供する」と説明していますが、ここでの比較対象は競合モデルであり、自社の前世代ではありません。
なぜ値上げしたのか
業界アナリストのSimon Willison氏は「Flashは『速くて安いモデル』から『速くて高性能なエージェント実行モデル』に再定義された」と指摘しています。
つまりGoogleは3.5 FlashをFlashブランドの後継ではなく、新しい中核モデルとして位置づけた可能性があります。
ちなみに、それでも競合のClaude OpusやGPT-5.5の半額以下です。
ベンチマークが示す実力――Pro超えの軽量版
「軽量モデルが上位モデルを超える」という主張は、ベンチマーク結果で裏付けられています。
コーディング・エージェント性能
主要ベンチマークでの3.5 Flashのスコアは以下の通りです。
- Terminal-Bench 2.1(ターミナル操作の自律実行): 76.2%
- MCP Atlas(複雑なツール呼び出し): 83.6%
- CharXiv Reasoning(科学論文の図表理解): 84.2%
- GDPval-AA(実務タスク): 1656 Elo
- MMMU-Pro(マルチモーダル理解): 84%(過去最高)
Terminal-Bench 2.1は、AIが実際にターミナルでコマンドを打ちながらタスクを完遂できるかを測るテストです。76.2%は、4回中3回は人間の手を借りずに目的を達成できるという水準です。
なぜFlashがProを超えられたのか
Googleはアーキテクチャの詳細を明かしていません。
ただし注目すべき新機能として、マルチターン会話での中間推論の自動保持があります。
これまでは、長い会話の途中で「さっきの推論結果」を再利用するには、開発者が手動で前のやり取りをプロンプトに含める必要がありました。
3.5 Flashは内部で勝手にそれを保持するため、繰り返しのデバッグやコードリファクタリング(既存コードの整理)で精度が大幅に上がります。
採用企業――Shopify・Salesforce・Xeroが実装中
3.5 Flashは一般提供開始の時点で、すでに大手企業による導入事例が公表されています。具体的な使われ方を見てみましょう。
eコマース・金融・会計の現場
ある中小企業の経理担当者が月末に行う作業を想像してみてください。数百件の請求書を1枚ずつ確認し、勘定科目を判別し、税区分を仕分けする――これに丸一日かかります。
会計SaaSのXeroは、3.5 Flashで税申告書の作成を含む数週間規模の業務フローを自動化する取り組みを始めています。
同様の事例として:
- Shopify: サブエージェントを並列実行し、複雑な販売データから出店者の成長予測を生成
- Macquarie Bank: 100ページ以上の顧客書類を低レイテンシで処理し、口座開設の審査を高速化
- Salesforce: 複数のサブエージェントを連携させて、企業の業務自動化を実現
- Databricks: 大規模データセット全体をリアルタイムで監視し、異常検知
- Ramp: 複雑な請求書のOCR(画像から文字を読み取る技術)精度を向上
Google Antigravityとの統合
もう一つ重要なのがGoogle Antigravityとの連携です。Antigravityは、AIエージェント自身が「住んで、働き、実行する」ための環境として作られた新しい開発IDE(統合開発環境)です。
Googleの社内デモでは、複数のエージェントが分担して動作し、それぞれが別のコンポーネントを開発しながら最終的にOSを構築する様子が披露されました。
3.5 FlashはAntigravityと共同設計されているため、IDE上で複雑なタスクを並列実行する性能に特化しています。
競合比較――Claude・GPTとの違い
3.5 Flashの位置を理解するには、競合モデルとの比較が役立ちます。
速度・価格・知能の三角関係
主要モデルの2026年5月時点の比較は以下の通りです。
| モデル | 入力価格(/1Mトークン) | 出力価格(/1Mトークン) | 出力速度 |
|---|---|---|---|
| Gemini 3.5 Flash | $1.50 | $9.00 | 289 tok/s |
| Claude Opus 4.7 | $15.00 | $75.00 | 67 tok/s |
| GPT-5.5 | $10.00前後 | $30.00前後 | 71 tok/s |
3.5 Flashは出力価格でClaude Opus 4.7の約8分の1、速度は約4倍です。
使い分けの実際
とはいえ「安くて速いから3.5 Flashだけ使えばいい」とはなりません。
用途別に整理すると次のようになります。
- 高速で大量のエージェント実行: 3.5 Flashが最適
- 長文の創造的執筆・複雑な推論: Claude Opus 4.7など上位モデルが優位
- ChatGPTエコシステムとの統合: GPT-5.5シリーズが有利
- マルチモーダル理解(画像・図表): 3.5 FlashのMMMU-Pro 84%が最強水準
業務によってモデルを切り替える「マルチモデル戦略」が現実解になっています。
日本市場への影響――業務自動化のコストが激変
日本国内のAI活用に3.5 Flashが与える影響は小さくありません。
エンタープライズ導入の追い風
日本企業のAI導入で大きな壁となっていたのが、運用コストと処理速度でした。
たとえば全社員が毎日10回ずつAIを呼び出す企業を考えてみましょう。1人あたり月300回、1,000人の企業なら月30万回です。
1回あたりの平均出力が500トークンとすると、3.5 Flashでも月額約1,350ドル(約20万円)かかります。
これでもClaude Opus 4.7の8分の1ですが、絶対値としては小さくありません。
ただし速度が4倍ということは、同じ時間で4倍の業務を回せる計算になります。投資対効果(ROI)の計算が大きく好転します。
中小企業・個人開発者にとっての意味
Google AI Studio経由なら、個人開発者でも従量課金で気軽に試せます。
キャッシュ済み入力なら100万トークンあたり23円というレベルなので、副業でAIアプリを開発したい人にも現実的です。
これまで「ChatGPTのAPIは高くて手が出ない」と感じていた層にも選択肢が広がりました。
国内SaaSへの波及
Salesforce・Xero・Shopifyが3.5 Flashで業務エージェントを構築しているということは、これらのサービスを使う日本企業も恩恵を受けるということです。
とくに会計・人事・営業の分野では、AIエージェントが請求書処理や日報入力を「人間が触らずに完結する」世界が目前まで来ています。
よくある質問(FAQ)
Q1. 無料で試せますか?
はい。Geminiアプリ(gemini.google.com)から無料アカウントで利用できます。API経由で本格的に開発したい場合も、Google AI Studioで一定の無料枠が設けられています。
Q2. ChatGPTやClaudeとどう使い分けるべきですか?
大量のエージェント処理や高速応答が必要な業務は3.5 Flashが最適です。一方、長文の創造的執筆や深い推論ではClaude Opus 4.7が優位な場面があります。両方を併用する企業が増えています。
Q3. 日本語の精度はどうですか?
Geminiシリーズは英語に次いで日本語を強くサポートしており、3.5 Flashでも同等の品質が期待できます。マルチモーダル理解(画像・図表)も日本語UIで利用可能です。
Q4. 旧Gemini 3.0や3.1モデルはどうなりますか?
Google AI Studio・Vertex AIでは旧モデルも引き続き利用可能ですが、新規開発は3.5 Flashが推奨されています。3 Flash Previewの$0.50/$3.00料金は当面維持されると見られますが、いずれ非推奨化される可能性があります。
Q5. エージェント開発を始めるには何から手をつければいいですか?
まずGoogle AI Studioでプロンプトを試し、感触をつかむのが第一歩です。本格的に作るなら、Google Antigravity IDEを試すと3.5 Flashの並列エージェント機能を体感できます。
まとめ――AIエージェント時代の中核モデル
Gemini 3.5 Flashの登場で、AIモデルの選択肢が大きく変わりました。
- 2026年5月19日に一般提供開始、価格は$1.50/$9.00 per 1Mトークン
- 競合フロンティアモデルの4倍速、毎秒289トークンを出力
- 前世代Gemini 3.1 Proを上回るコーディング・エージェント性能
- Shopify・Salesforce・Xeroなど大手SaaSが業務エージェント基盤として採用
- 日本企業のエンタープライズAI導入の運用コストを大きく押し下げる可能性
まずはGeminiアプリで無料体験し、自分の業務でどこに使えるかを試してみるのが次の一歩です。

