GPT-5.5衝撃｜1Mトークン×コーディング王の全貌

公開日: 2026-04-26最終更新: 2026-05-12

監修者伊東雄歩

株式会社ウォーカー CEO。東北大学卒。MENSA会員、JDLA認定講師、健全AI教育協会理事。生成AI×教育・学習科学を専門とし、2億円超のシステム開発プロジェクトを統括。

taolis.net X note Voicy YouTube

2026年4月23日発表：OpenAIがGPT-5.5（コードネーム『Spud』）を公開、API展開は4月24日
フル再訓練ベース：GPT-4.5以来1年ぶりに事前学習からやり直した新世代モデル
1Mトークン文脈：OpenAI APIで初の100万トークン対応、長文書類や巨大コードベースを丸ごと読み込み可能
性能：Terminal-Bench 2.0で82.7%（世界最高）、SWE-Bench Verified 88.7%、出力トークン40%削減
料金：API入力5ドル／出力30ドル（100万トークンあたり）、GPT-5.4の2倍、GPT-5.5 Proは6倍

『AIモデルが、また1段賢いを更新した』——2026年4月23日、OpenAIはGPT-4.5以来1年ぶりとなるフル再訓練ベースモデル『GPT-5.5』（社内コードネームSpud＝じゃがいも）を公開しました。

1Mトークン（小説5冊分相当）の超巨大コンテキスト、Terminal-Bench 2.0で世界最高82.7%、API料金は前世代の2倍——強気の値付けと派手なベンチマーク結果が話題沸騰。

なぜいまフル再訓練が必要だったのか、Claude Opus 4.7やGemini 3.1 Proとどう違うのか、日本のユーザーにとって何が変わるのかを中学生にもわかる言葉でほどいていきます。

何が起きた？｜OpenAIがGPT-5.5を公開

まず発表の中身を3分で整理します。

2026年4月23日｜ChatGPT Plus／Pro／Business／Enterpriseで即日提供

2026年4月23日、OpenAIは公式ブログ『Introducing GPT-5.5』でGPT-5.5を正式発表し、即日でChatGPTのPlus／Pro／Business／Enterprise／Eduプラン向けに展開。翌4月24日にはAPIにも展開され、開発者は『Responses』『Chat Completions』エンドポイントから利用可能になりました。

『新作スマホをまずお店で展示した翌日、ネット販売も解禁する』ような連続リリース。

消費者向けと開発者向けを24時間以内に揃えるスピード感が、今回の発表の特徴です。

GPT-5.4から1〜2ヶ月での後継モデル登場というOpenAIの加速ぶりに、業界各社が驚きの声を上げました。

コードネームは『Spud』｜じゃがいもの愛称が物語る再訓練

社内開発時のコードネームは『Spud（スパッド）』——じゃがいもを意味する英語のスラング。

『地道に育てて、ホクホクの中身を仕上げた』というニュアンスを感じさせる愛称です。

『派手な料理よりも、まずベースの素材を一から育て直した』という開発思想の表れ。

GPT-5.1〜5.4は同じベースモデルの上にチューニングを重ねたシリーズだったのに対し、GPT-5.5は事前学習データもアーキテクチャも全て作り直したのが大きな違い。

GPT-4.5以来およそ1年ぶり、満を持してのベースモデルから再構築プロジェクトの成果物が、このSpud（GPT-5.5）です。

エージェント特化の『GPT-5.5 Pro』も同時公開

標準モデル『GPT-5.5』に加え、より深い推論を担う上位モデル『GPT-5.5 Pro』も同日発表。

『普通のスーパーカーと、サーキット仕様の競技モデルが同時に発売される』ような兄弟ラインナップです。

GPT-5.5 Proは長時間のエージェント作業や、深い推論が必要なリサーチに最適化されています。

ChatGPTでは『GPT-5.5 Thinking』として表示され、Plus／Pro／Business／Enterprise利用者が選択可能。

GPT-5.5 Proに限ってはPro／Business／Enterpriseの上位プランのみという棲み分けで、用途と予算に合わせた選択肢が広がりました。

なぜフル再訓練？｜AI開発の最大コスト

『なぜ既存モデルを微調整するのではなく、ゼロから作り直すの？』を3つの観点から見ます。

事前学習は『データのプリン』を一から作り直す作業

事前学習（プリトレーニング）とは、インターネット規模のテキストデータをAIに大量に読ませて、言語の基礎能力を身につけさせる工程。

『プリンを家庭で作るとき、卵・砂糖・牛乳を最初から混ぜて加熱する手間』と同じくらい、土台が出来栄えを左右するのが特徴です。

一度作った土台モデルに、後から微調整（ファインチューニング）を重ねるのが普通。

GPT-5.1〜5.4は同じプリンの上に違うソースをかけたバリエーションだったのに対し、GPT-5.5はプリン自体を新レシピで作り直した。

事前学習には数千枚のGPUと数ヶ月の計算時間、数百億円の費用が必要とされ、AI開発の中で最大級の挑戦です。

エージェント時代に最適化された新アーキテクチャ

OpenAIによれば、GPT-5.5の事前学習コーパスとアーキテクチャ、エージェント志向の学習目的は全て刷新。

『モデルが自分でツールを使い、計画を立てて、長時間の作業をやり抜く』ことを最初から想定して設計されています。

『新人社員に上司から逐一指示するのではなく、目的だけ伝えて任せられる人材を採用する』考え方。

長文の文脈を保ち続け、曖昧な失敗から立ち直り、ツールで仮説検証する能力が強化された結果、実装・リファクタ・デバッグ・テスト・検証まで一気通貫でこなせるようになりました。

OpenAIが2026年に注力するエージェント基盤の中核モデルとして位置づけられています。

なぜじゃがいも？｜社内ジョークと開発文化

『Spud』は英語圏でじゃがいもを指す気軽な呼び名で、OpenAI開発陣のジョーク的なコードネーム。

地味だが栄養価が高く、いろんな料理に使える万能食材というイメージが、ベースモデルとしての汎用性と重なるのが粋なところです。

『目立たないけれど、なくてはならない食卓の主役』を狙った命名。

OpenAIは過去にも食べ物にちなむコードネームを使ってきた（GPT-6は『Spud』ではなく別の食材コードネームと噂）。

派手なマーケティング名より、社内文化の遊び心が表れる愛称が業界で話題になっています。

何ができる？｜1Mトークン×80%超ベンチマーク

『具体的に何が強くなった？』を3つのポイントで掘ります。

1Mトークン｜小説5冊分の文脈を一気に処理

GPT-5.5はOpenAI APIで初めて『1Mトークン（100万トークン）』のコンテキストウィンドウに対応。日本語に換算すると約60〜70万文字、文庫本5冊分以上の文章を一度に読み込める計算です。

『分厚い辞書を一気に頭の中へ取り込んで、即座に質問に答える』ような能力。

巨大なコードベース（社内システム全体のソースコード）や長期間にわたるチャット履歴も丸ごと与えて、その全体を踏まえた回答が可能。

Codex（ChatGPTのコーディング機能）でも400Kトークン対応に拡張され、エンジニアの実用性が一段上がりました。

Terminal-Bench 2.0で82.7%｜ターミナル王に

Terminal-Bench 2.0は、AIが実際のコマンドラインで複雑なワークフロー（計画・反復・ツール連携）をこなせるかを測る業界標準ベンチマーク。GPT-5.5は82.7%の正解率で世界最高記録を樹立しました。

『新人エンジニアが、難しい構築作業を自分で計画し、エラーを直しながら最後までやり遂げる』レベルの自律性。

SWE-Bench Verified（GitHub上の現実バグ修正テスト）でも88.7%を記録し、前世代GPT-5.4の87.6%を上回る。

Codexで同じタスクを処理するのに、GPT-5.4より約40%少ないトークンで済むという効率性も特徴。

賢くなりつつ、無駄な出力が減ったのが実用面での最大の進化です。

エージェント能力｜計画・回復・完遂をこなす

OpenAIは『GPT-5.5で構築されたエージェントは、計画立案・文脈収集・ツール呼び出し・曖昧さからの回復・長期ワークフロー完遂をより少ない指示でこなせる』と公式発表。

『分厚い手順書を読まずに、目的だけ伝えれば自分で考えて動ける部下』のような変化。

GDPval（経済価値タスク評価）で84.9%、OSWorld（PC操作エージェント）で78.7%という、エージェント分野での独走を実現。

知識業務・初期段階の科学研究・コンピュータ操作で特に強さを発揮と、OpenAIは強調しています。

ChatGPTを質問に答えるツールからタスクをやり切る相棒へ進化させる節目になる発表です。

競合との比較｜Claude Opus 4.7・Gemini 3.1 Proとの違い

『他社モデルと比べてどうなの？』を3つの切り口で整理します。

Artificial Analysis Intelligence Indexで首位奪還

第三者ベンチマーク機関『Artificial Analysis』の総合知能指数で、GPT-5.5は60ポイントを獲得して首位。2位のClaude Opus 4.7とGemini 3.1 Proは57ポイントで同率2位、3ポイント差でOpenAIがトップです。

『3教科の合計点で、惜しくもライバル2人に3点差で勝った学年1位』のような僅差。

1年前に首位の座を譲り渡したOpenAIが、GPT-5.5で再び総合トップに返り咲いた。

ただし単一指標で勝つ時代は終わり、用途別に最適なモデルを使い分ける時代に移行しているのが現代AI市場の本質です。

コード支援はClaudeが一歩リード｜推論はGemini

SWE-Bench Pro（実世界GitHubイシュー解決）ではClaude Opus 4.7が64.3%、GPT-5.5が58.6%と5.7ポイント差でClaudeがリード。

難易度が高いコード修正タスクでは、Anthropicの最新モデルがやや優勢。

『専門資格試験では同僚に負けたが、日常業務では自分の方が早い』状況。

一方、ARC-AGI-2（77.1%）やGPQA（94.3%）といった抽象的推論ではGoogleのGemini 3.1 Proが首位。

GPT-5.5＝エージェント、Claude＝コーディング、Gemini＝推論という3モデル使い分けが2026年の業界スタンダードになりつつあります。

価格は2倍｜知能の対価は高いか妥当か

API料金は入力100万トークンあたり5ドル、出力30ドルで、GPT-5.4（入力2.50ドル／出力15ドル）の正確に2倍。

『前モデルから値段が倍になったが、性能と効率も向上した』バランスをどう評価するかが分かれ目です。

GPT-5.5 Proに至っては入力30ドル／出力180ドルとさらに6倍の価格設定。

ただし出力トークンが40%削減されるため、実質的なコスト増は20%程度との分析も。

最新フロンティアモデルを使うコストを正当化できるかは、業務の付加価値次第と業界アナリストはコメントしています。

日本市場への影響｜ChatGPTユーザーと開発者の変化

『日本のユーザーにとって何が変わる？』を3つの切り口で見ます。

国内ChatGPT利用者は即日アップグレード

日本でもChatGPT Plus／Pro／Business／Enterpriseの契約者は4月23日から自動的にGPT-5.5にアクセス可能。

追加料金なし、設定変更なしで、モデル選択メニューに『GPT-5.5』『GPT-5.5 Thinking』が出現する仕組みです。

『定額制動画サービスで、契約はそのままに新作映画が追加された』ような体験。

日本語の翻訳・要約・文章生成精度も、前世代GPT-5.4からさらに向上したとの早期レビュー。

国内で月額3000円のPlusユーザー約数十万人が、世界最先端モデルを即時に利用できる環境が整っています。

日本企業の開発者にとってのコスト見直し

API利用ベースで動くSaaS製品やAIアシスタントを提供する日本企業にとって、GPT-5.5への切り替えはコスト構造の見直しが必要。

出力トークンが40%減るため単価×量での総額は意外と上がらない一方、1リクエストあたりの上限コストは増加するのがポイント。

『電気料金が値上がりしたが、新型エアコンが省エネになった』状況に近い。

ベンチャーや個人開発者は、用途に応じてGPT-5.4／5.5／5.5 Proを使い分ける『モデル・ルーティング』設計が現実解。

NTT・富士通・サイバーエージェントなど国内大手も、GPT-5.5の業務活用評価を即座に開始したと業界では報じられています。

国産LLMとの差は再び拡大の懸念

NEC『cotomi』、サイバーエージェント『CALM2』、PFN『PLaMo』など国産LLMが進化を続ける中、GPT-5.5の登場でフロンティア性能の差が再び拡大。

『国内チームが完成度を上げるたびに、海外勢がさらに高みに行く』追いかけっこの構図。

ただし国産LLMは日本語の専門領域やデータ主権で独自の強みを持つ。

GPT-5.5の1Mコンテキストとフロンティア性能を借りつつ、機微情報は国産モデルで処理するハイブリッド設計が国内エンタープライズの主流。

2026年後半、政府AI『源内』との連携シナリオも議論される段階に入っています。

わたしたちの暮らしはどう変わる？｜3つの活用シーン

シーン1｜ベンチャーCTO 加藤さん（34歳）の社内移行検討

都内SaaS企業のCTO・加藤さんは、自社プロダクトのAIアシスタント基盤に使うモデルをGPT-5.4からGPT-5.5に切り替えるか検討中。

『出力トークンが40%減るので、月間API費用は現状維持で性能だけ底上げできる試算』を社内会議に提出しました。

1Mコンテキストでお客様の長い問い合わせ履歴を一気に参照できるため、サポート対応の精度も向上する見込み。

『契約価格を据え置きで、サービス品質だけ底上げする攻めの判断』。

AI市場では、新モデル登場のたびにこういう移行判断を素早く行える企業が競争優位を取るのが現代の実情です。

シーン2｜大学生美樹さん（21歳）の卒論執筆活用

関西の私立大学で経済学を専攻する美樹さんは、卒業論文のテーマ研究にChatGPT Plusを活用中。

『100ページ超の英語論文5本を、GPT-5.5に同時に与えて、共通点と相違点を整理させる作業』に挑戦しました。

1Mコンテキストのおかげで、論文を分割せずに一括で読み込ませられるようになり、文脈の取り違えが激減したと実感。

『分厚い参考書を全部頭に入れた家庭教師に、何度でも質問できる』利便性。

学術領域での生成AI活用が、長文文脈の制約から解放されて新しい段階に入った象徴的な事例です。

シーン3｜エンジニア諏訪さん（41歳）のCodex連携検証

金融系SIerでバックエンド設計を担当する諏訪さんは、社内開発でCodexのGPT-5.5対応を試験運用。

『約50万行の社内Javaコードベースを丸ごと与え、リファクタ案と単体テストを自動生成させた』結果、過去のGPT-5.4比で完了時間が約3割短縮されました。

Terminal-Bench 2.0の82.7%という数字が、現実の業務でも体感できるレベルで効いてくる。

『先輩エンジニアにレビューを頼むのと同じ感覚で、AIに設計判断を相談できる職場』。

2026年後半にはCodexで自律的に動くAIペアプロが日本のIT現場の常識になると諏訪さんは見ています。

よくある質問（FAQ）

Q. 無料プランでもGPT-5.5は使えますか？

A. 2026年4月時点でChatGPTの無料プランでは利用できません。Plus（月20ドル）／Pro／Business／Enterprise／Eduの有料プランでGPT-5.5が解放されています。

GPT-5.5 ProはさらにPro／Business／Enterpriseの上位プランのみ。

『新作映画は有料会員エリアだけで先行公開、人気が出てから一般公開される』流れ。

なお、Codex経由ではPlus／Pro／Business／Enterprise／Edu／Goプランでも利用可能（コンテキストは400Kに制限）。

予算次第でアクセス先を選ぶ階層構造になっています。

Q. GPT-5.5とGPT-5.5 Proはどう使い分けるべき？

A. 標準のGPT-5.5は日常的な質問応答・文章生成・コーディングに最適、GPT-5.5 Proは複雑な推論・長時間のリサーチ・大規模設計判断に向く。

APIコストは6倍違うため、簡単な作業にProを使うのは軽自動車で十分な街乗りに大型トラックを使うのと同じ無駄遣い。

『状況に応じて道具を使い分ける職人の感覚』が大事。

ChatGPT上では『GPT-5.5 Thinking』として表示され、選択肢として手動切り替え可能。

まずは標準GPT-5.5で試して、複雑さが必要な場面だけProに切り替える運用が推奨されます。

Q. 日本語の精度はどれくらい上がりましたか？

A. OpenAIは日本語固有のベンチマーク数値を公開していませんが、早期ユーザーレビューでは長文要約・専門用語の誤訳・敬語の使い分けで改善を実感する声が多い。

1Mコンテキストの恩恵で、日本語の長文を分割せずに処理できるのが実用面での大きな進歩。

『英語並みに自然な日本語を出すモデルへ、また一歩近づいた』感覚。

ただし業界・企業独自の専門用語については、ファインチューニングなしでは対応に限界があるのは従来通り。

正確性が求められる業務では人間レビューを併用する設計が引き続き重要です。

Q. ハルシネーション（事実誤認）は減りましたか？

A. OpenAIは『推論時の知識整合性が向上した』と発表していますが、第三者検証では依然としてハルシネーションは頻発するという指摘も。

ベンチマークで高スコアを取りつつ、現実の細かい事実誤認は残るという現代LLMの普遍的課題。

『試験では満点でも、日常会話で人の名前を間違える先生』のような構造的ジレンマ。

重要な意思決定や公式文書では、AIの出力を必ず人間が裏取りする運用が必須。

信頼性が求められる業務では、複数モデル比較や引用元検証ツールとの併用が推奨されるのが2026年現在のベストプラクティスです。

Q. 次のGPT-6はいつ出ますか？

A. OpenAIは公式に発表していませんが、2026年4月時点で『GPT-6（コードネームSpud2など）』の事前学習が完了した噂が業界で流れている。

GPT-5.5発表からおよそ半年〜1年後に正式公開される可能性が高いと業界アナリストは予測。

『次世代スマホの噂が新作発売直後から流れ始める』のと似た先取り情報。

ただしGPT-5.5自体の改良（5.5.1、5.5.2など）も並行して続く見込み。

ユーザーはいつ最新を追いかけるかの判断軸を、自身の業務サイクルに合わせて設計するのが現実的です。

まとめ

2026年4月23日：OpenAIがGPT-5.5（コードネームSpud）を発表、API展開は翌4月24日
技術：GPT-4.5以来初のフル再訓練ベース、1Mトークンコンテキスト、Terminal-Bench 2.0で82.7%の世界記録
料金：API入力5ドル／出力30ドル（前世代の2倍）、GPT-5.5 Proは入力30ドル／出力180ドル
競合との比較：総合首位はGPT-5.5、コーディングはClaude Opus 4.7、推論はGemini 3.1 Proが優勢
日本市場：Plus／Pro／Business／Enterprise契約者は即日アップグレード、国産LLMとのハイブリッド設計が主流に
次のアクション：OpenAI公式『Introducing GPT-5.5』でモデル仕様と価格を確認し、自分の業務での費用対効果を試算するのが第一歩

『ベースモデルから作り直す』という大規模な再訓練は、AI開発コスト・時間・リスクの全てが最大級になる重い決断です。OpenAIがGPT-4.5以来1年ぶりにこの選択肢を取った背景には、エージェント時代に対応した新アーキテクチャを土台から組み直す必要があった。

1Mトークンの巨大文脈、Terminal-Benchの世界記録、出力トークン40%削減——どれも単発の機能追加ではなく、ベースの設計思想から見直したからこそ実現できた成果。

API価格2倍という強気の値付けは、知能の対価を社会がどう評価するかを問う実験でもある。

『GPT-5.5を使う側が、その2倍の付加価値を生み出せるか』——これが2026年後半のAI活用の主戦場になります。日本のユーザー・企業・開発者にとっても、最新フロンティアモデルをいつ・どこで・どれだけ使うかを戦略的に設計する力が、AI競争の勝敗を分ける時代——そう捉えると、この発表の重さが見えてきます。