Gemini 3.5 Proが6月登場｜200万トークンとDeep Thinkで何が変わる？

監修者伊東雄歩

株式会社ウォーカー CEO。東北大学卒。MENSA会員、JDLA認定講師、健全AI教育協会理事。生成AI×教育・学習科学を専門とし、2億円超のシステム開発プロジェクトを統括。

この記事でわかること

Googleが6月に「Gemini 3.5 Pro」を一般公開する予定であること
200万トークンという圧倒的な文脈処理能力の意味
Deep Think推論モードで複雑な問題を解けるようになる仕組み
これまでのUltraモデルとの違いと、今後の影響

Gemini 3.5 Proが6月中に登場

Googleが開発するAI「Gemini」の最上位モデル「Gemini 3.5 Pro」が、いよいよ6月中に一般提供される見通しです。5月19日に開催されたGoogle I/Oで発表され、CEOのスンダー・ピチャイ氏は「あと1ヶ月待ってほしい」と語っていました。複数の海外メディアは、6月22日から26日の間にリリースされる可能性が高いと報じています。

Gemini 3.5シリーズでは、すでに軽量モデルの「Gemini 3.5 Flash」が公開されています。Flashはスピードとコストを重視した設計で、従来の「3.1 Pro」を上回る性能を発揮します。一方、今回のProモデルは、より高度なタスクに対応する最上位版として位置づけられています。

Googleは企業向けプラットフォーム「Vertex AI」を通じて、一部の大口顧客に早期アクセスを提供しています。つまり、すでに内部では実用段階に入っており、あとは一般公開を待つばかりという状況です。

200万トークンで何ができるのか

Gemini 3.5 Proの最大の特徴は、「200万トークン」という巨大なコンテキストウィンドウです。トークンとは、AIが文章を理解するための単位のこと。日本語なら1文字が約1～2トークンに相当します。つまり、200万トークンは約100万文字分の情報を一度に記憶できる計算です。

たとえば、長編小説1冊が約10万～15万文字ですから、Gemini 3.5 Proは6～10冊分の小説を同時に記憶しながら会話できることになります。これは、プログラミングの大規模コードベース、企業の契約書の束、複数の会議の議事録といった膨大な情報を扱う場面で威力を発揮します。

従来のモデルでは、長い文章を要約したり分析したりする際に、何度も分割して処理する必要がありました。しかし、200万トークンあれば、すべてを一度に読み込んで答えを出せます。時間の節約だけでなく、文脈を見失わないため、より正確な回答が期待できます。

Deep Think推論モードとは

もうひとつの注目機能が「Deep Think」推論モードです。これは、すぐに答えるのではなく、じっくり時間をかけて考えるモードです。OpenAIの「o1」シリーズのように、複雑な問題に対して推論のステップを踏みながら解答を組み立てます。

たとえば、数学の証明問題や、法律の条文を解釈する作業、複数の条件を満たすプログラムの設計など、単純な知識だけでは解けないタスクに有効です。AIが「答えを思い出す」のではなく、「論理的に考える」プロセスを経ることで、より信頼性の高い結果が得られます。

Googleはこれまで、スピード重視のFlashモデルと、精度重視のProモデルを使い分けてきました。Deep Thinkモードの搭載により、Proはさらに「難題を解くAI」としての役割を強めることになります。

Ultraモデルを統合した新体制

従来のGeminiシリーズでは、「Ultra」という最上位モデルが存在しました。しかし今回のGemini 3.5では、Ultraの機能がProに統合される形になっています。これにより、モデルのラインナップがシンプルになり、ユーザーは「軽量版のFlash」か「高性能版のPro」の2択で選べるようになります。

この背景には、GoogleがAIの提供方法を「モデル単体」から「エージェント基盤」へと転換している事情があります。Google I/O 2026では、Geminiを単なるチャットボットではなく、複数のタスクを自律的に実行する「AIエージェント」として活用する構想が示されました。

つまり、Gemini 3.5 Proは、メールの下書き作成、スケジュール調整、データ分析といった複数の作業を連携して行う「仕事のパートナー」としての役割を担うことになります。Ultraの高度な推論能力を引き継ぎつつ、より実用的な形で提供されるわけです。

料金と競合他社との比較

気になる料金ですが、Gemini 3.5 ProのAPI利用料は、入力が100万トークンあたり約15ドル、出力が約60ドルと見られています。これはFlashモデルの約10倍のコストです。個人向けのサブスクリプションプランは月額約20ドル（日本円で約3000円）と予想されています。

競合するOpenAIの「GPT-4o」やAnthropicの「Claude Opus」と比べると、200万トークンという文脈容量は圧倒的です。GPT-4oが12万8000トークン、Claude Opusが20万トークンであることを考えると、Gemini 3.5 Proは10倍以上の記憶力を持つことになります。

ただし、料金が高いため、すべての用途でProを使う必要はありません。日常的なチャットや簡単な要約にはFlashで十分です。大規模なドキュメント分析や、複雑な推論が必要な場面でProを使う、という使い分けが賢い選択になるでしょう。

日本市場への影響は

日本国内でも、GeminiはGoogle WorkspaceやGoogle検索と連携する形で広く使われています。とくに企業向けでは、議事録の自動作成、契約書のレビュー、顧客対応の自動化など、さまざまな業務効率化に活用されています。

Gemini 3.5 Proの登場により、これまで人間が時間をかけて行っていた「複数の資料を読み込んで分析する」作業が、数分で完了するようになります。たとえば、法律事務所が過去の判例を調べる、コンサルティング会社が業界レポートを整理する、といった場面で大幅な時間短縮が見込めます。

一方で、料金がFlashの10倍であることから、中小企業や個人事業主にとっては導入のハードルが高いかもしれません。Googleが今後、日本向けの特別プランや、円建て価格での提供を行うかどうかが注目されます。

他社の動きと今後の展望

AI業界では、文脈容量の拡大競争が激化しています。AnthropicのClaudeも、最新の「Claude Opus 4.6」で100万トークン以上の処理能力を備えています。OpenAIも次期モデル「GPT-5」で大幅な性能向上を予告しています。

Googleが200万トークンという数値を打ち出したことで、競合他社も追随する可能性があります。ただし、単にトークン数を増やすだけでなく、「どれだけ正確に長文を理解できるか」という品質が問われます。Deep Think推論モードの実力が、実際のリリース後に試されることになるでしょう。

また、Googleは6月15日にSalesforceと提携し、Gemini 3.5 Flashを営業支援ツール「Agentforce」に組み込むことを発表しました。このように、他社のサービスにGeminiが組み込まれる動きも加速しています。Proモデルも、今後さまざまなビジネスツールに統合されていくと予想されます。