OpenAI初の自社チップ|推論コスト半減の衝撃

伊東雄歩
監修者 伊東 雄歩

株式会社ウォーカー CEO。東北大学卒。MENSA会員、JDLA認定講師、健全AI教育協会理事。生成AI×教育・学習科学を専門とし、2億円超のシステム開発プロジェクトを統括。

taolis.net X note Voicy YouTube
  • OpenAIが初の自社設計AIチップ「Jalapeño(ハラペーニョ)」をBroadcomと発表しました
  • AIの「推論(質問に答える処理)」専用で、コストを約50%下げられると公表しています
  • 設計から製造直前まで、わずか9カ月という異例の速さで開発されました
  • 狙いはNVIDIA(エヌビディア)への依存を減らし、計算コストを下げることです
  • 製造はTSMCが担当。日本の半導体・データセンター業界にも追い風になります

ChatGPTを動かすのに、どれだけのお金がかかっているか考えたことはありますか?AIの裏側では、莫大な計算コストが毎日積み上がっています。2026年6月24日、OpenAIがその常識をひっくり返す発表をしました。自社で設計したAIチップ「Jalapeño」です。この記事を読めば、なぜこのチップが業界を揺らしているのか、そして私たちの使うAIがどう安くなるのかがわかります。

OpenAIが発表した自社チップ「Jalapeño」とは

OpenAIが、半導体大手Broadcom(ブロードコム)と組んで初めての自社チップを公開しました。

名前は「Jalapeño(ハラペーニョ)」。あの辛い唐辛子と同じ名前です。

このチップは、AIの「推論」だけに特化しています。推論とは、すでに学習を終えたAIが、ユーザーの質問に答える処理のことです。

つまり、私たちがChatGPTに話しかけたとき、裏側で答えを作る部分を専門に担当します。

OpenAIはこれを「Intelligence Processor(知能を生み出す専用チップ)」と呼んでいます。同社にとって初めての本格的な計算チップです。

最大のニュースは「推論コスト50%削減」

今回いちばん注目されているのが、コストの話です。

OpenAIによると、Jalapeñoは推論にかかる費用を1トークンあたり約50%も下げられると言われています。トークンとは、AIが文章を処理するときの最小単位(単語のかけら)のことです。

なぜそんなに安くできるのでしょうか。

理由は「専用設計」にあります。NVIDIAのGPU(画像処理から発展した万能チップ)は、何にでも使える便利な道具です。一方Jalapeñoは、AIの言語モデルが行う計算だけに形を合わせて作られています。

必要な機能だけに絞り込むことで、ムダな電力を使わず、性能あたりの電気代も最先端品より優れているとされます。

料理に例えるなら、何でも切れる万能ナイフよりも、刺身専用の包丁のほうがきれいに速く切れる、という発想です。

わずか9カ月で完成した異例のスピード

開発の速さも驚きをもって受け止められています。

普通、新しいチップを一から作るには数年かかります。ところがJalapeñoは、設計図の段階から製造の準備が整うまでたった9カ月でした。

このスピードの秘密は、OpenAI自身のAIモデルを開発に使ったことです。

チップの設計やソフトとハードの調整に、自社のAIを活用して作業を加速させました。AIがAIのためのチップ作りを手伝った、というわけです。

OpenAIのグレッグ・ブロックマン社長は「自分たちでより多くの部分を設計することで、より少ない電力で多くの知能を届けられる」と語っています。

中身はどうなっている?技術のポイント

少し専門的な話も、やさしく見ていきましょう。

Jalapeñoは、半導体の最先端工場であるTSMC(台湾積体電路製造)が、3nm(ナノメートル)プロセスという最新技術で製造します。nmは回路の細かさを表す単位で、数字が小さいほど高性能・省電力です。

チップの中身は、計算を担う大きな部品の周りに、HBM(高速で大量のデータを扱える特殊メモリ)を6個並べた構成です。

設計には「シストリックアレイ」という方式を採用しています。これは、同じ計算を大量に繰り返すAIの処理にぴったりの仕組みです。

サイズは「レチクルサイズ」と呼ばれる、製造できる限界に近い大きな1枚のチップになっています。

NVIDIAやGoogleとどう違う?AIチップ競争の今

では、ライバルたちと比べてどうなのでしょうか。今のAIチップ市場を整理します。

これまでAI用チップは、NVIDIAがほぼ独占してきました。世界シェアは9割以上とも言われます。

しかし最近、大手各社が「自分専用チップ」を作り始めています。主な顔ぶれを比べてみましょう。

  • NVIDIA:万能型GPU「Vera Rubin」が主力。何にでも使えるが価格が高い
  • Google:TPUという自社チップを持ち、外部企業への販売も開始
  • Amazon:Trainium・Inferentiaを開発。AWSのAI処理の6割以上が自社チップ
  • Microsoft:「Maia」シリーズを自社開発中
  • OpenAI:今回のJalapeñoで、ついにこの競争に参戦

背景には、AIの使われ方の変化があります。今やAIの計算の3分の2は「推論」が占めるようになりました。

学習用の高価な万能チップより、推論に絞った専用チップのほうが安く効率的、という流れが強まっているのです。

ある調査では、NVIDIAの推論市場でのシェアは、2028年までに9割超から2〜3割まで下がる可能性も指摘されています。

いつ使える?今後の展開と気になる課題

気になるのは、いつ実際に動き出すのかという点です。

OpenAIは、まず2026年末に小規模な試験運用を始める計画です。

本格的な大量導入は2027〜2028年にかけて、MicrosoftなどのパートナーのデータセンターでGW(ギガワット)規模に広げていきます。

ただし、課題もあります。Broadcomが資金を出す条件として、Microsoftがチップ生産量の約40%を買うことが前提だと報じられています。

つまり、計画が予定通り進むかどうかは、これからの動き次第という面もあります。最初の世代は推論専用で、学習用にはまだNVIDIAが必要です。

日本にはどんな影響がある?

遠い海外の話に思えるかもしれませんが、日本にも深く関わります。

まず製造を担うTSMCは、熊本に工場(JASM)を持っています。日本の半導体産業にとって、こうした最先端チップの需要増は追い風です。

さらにJalapeñoには、大量のHBMメモリが使われます。メモリ分野ではキオクシアなど日本企業も供給に関わる可能性があり、AIブームの恩恵を受けます。

私たち利用者にとっての影響も見逃せません。推論コストが半分になれば、ChatGPTのAPI(外部サービスがAIを呼び出す仕組み)の利用料も将来下がる可能性があります。

たとえば、AIで顧客対応を自動化している日本の中小企業を考えてみましょう。月々のAI利用料が安くなれば、これまでコストで諦めていた使い方にも手が届きます。

AIがより安く、より身近になる。その第一歩が、このチップなのです。

よくある質問(FAQ)

Q. Jalapeñoは一般の人も買えますか?

A. いいえ。これはOpenAIが自社のデータセンターで使うためのチップです。店頭で売られるものではありません。私たちは、安くなったChatGPTなどのサービスを通じて間接的に恩恵を受けます。

Q. NVIDIAはもう不要になるのですか?

A. いいえ。Jalapeñoは「推論」専用です。AIを賢く育てる「学習」には、引き続きNVIDIAの高性能GPUが必要です。当面は使い分けが続きます。

Q. なぜ「ハラペーニョ」という名前なのですか?

A. OpenAIは正式な理由を明かしていません。唐辛子のように「ピリッと効く」存在を目指した、遊び心のある社内コードネームだと見られています。

Q. このチップでChatGPTは速くなりますか?

A. 可能性はあります。推論に特化しているため、応答が効率化されると期待されます。ただし本格導入は2027年以降なので、すぐに体感できるわけではありません。

まとめ

OpenAIの自社チップ「Jalapeño」のポイントを振り返ります。

  • OpenAI初の自社設計チップで、Broadcomと共同開発、TSMCの3nmで製造
  • AIの「推論」専用で、コストを約50%削減できると公表
  • 自社AIを活用し、わずか9カ月のスピード開発を実現
  • 狙いはNVIDIA依存からの脱却と計算コストの引き下げ
  • 本格導入は2027〜2028年。日本の半導体・メモリ業界にも追い風

まずは2026年末の試験運用がどんな成果を出すか、ニュースを追ってみましょう。AIの「裏側」を知ると、毎日使うサービスの見え方が少し変わるはずです。

参考文献

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です