Meta×AWS衝撃|Graviton5数千万コア採用の全貌

伊東雄歩
監修者 伊東 雄歩

株式会社ウォーカー CEO。東北大学卒。MENSA会員、JDLA認定講師、健全AI教育協会理事。生成AI×教育・学習科学を専門とし、2億円超のシステム開発プロジェクトを統括。

taolis.net X note Voicy YouTube
  • 2026年4月24日発表:MetaがAWS Graviton5を数千万コア規模で採用、複数年・数十億ドル契約
  • Graviton5の中身:192コア/3nmプロセス/キャッシュ前世代5倍/コア間遅延33%削減/性能25%向上
  • 用途はAIエージェント推論:リアルタイム推論・コード生成・検索・マルチステップ司令塔のCPU仕事に特化
  • 脱Nvidia×脱x86の象徴:GPU独占崩しに加え、ArmベースがクラウドAIの新標準へ
  • 日本でも実績:NTTドコモがGraviton2で5Gコア消費電力72%削減、Graviton5で第二波が来る

『AIといえばGPU、と思っていたら、いつのまにかCPUが主役の側にも回ってきた』——2026年4月24日、MetaとAmazon Web Services(AWS)が発表した提携は、まさにそんな転換点を象徴するニュースです。Metaが採用するAWS Graviton5は数千万コア規模、契約は複数年で総額数十億ドル超。

『なぜGPUじゃなくCPUなの?』『Armって何がすごい?』『日本企業に関係ある?』という疑問を、中学生でもわかる言葉でほぐしていきます。

何が起きた?|Meta×AWS提携の全体像

まずは発表内容を5分で整理します。

2026年4月24日|複数年・数十億ドル契約を同時公表

2026年4月24日、AmazonとMetaは公式ブログ・プレスリリースで提携を一斉公表しました。

『Metaが、AWS Graviton5プロセッサを数千万コア規模で導入する』『契約は複数年・数十億ドル(multibillion-dollar)規模』という2点が骨子です。

『Graviton5=AWSが自社設計したArmベースのサーバー用CPU』で、いま市場最強クラスのクラウド向けArmチップ。

『大手ITが他社のCPUを大量に長期契約で買う』という事例は、業界でも一気に話題になりました。

GPU争奪戦の裏で進んでいたCPUの陣取り合戦が、表舞台に出た瞬間と言えます。

Meta側の言葉|「コンピュート多様化は戦略的命題」

Metaのインフラ責任者Santosh Janardhan氏は、『コンピュートソースの多様化は、いまや戦略的命題(strategic imperative)だ』とコメント。

『たった1社のチップに依存していたら、価格交渉も供給リスクも全部相手まかせ』という危機感が背景にあります。

『高速道路に頼らず、新幹線・飛行機・船もぜんぶ用意する』物流戦略と同じ発想。

1強Nvidia時代の不安を、Arm系CPUで分散吸収しようとする企業判断が、はっきり読み取れる発言になりました。

AWS側の言葉|「AI推論基盤としてのCPUの重要性」

AWSのVP兼Distinguished EngineerのNafea Bshara氏は、『理解し、予測し、効率的にスケールするAIを作るための基盤を提供する』と語りました。

『学習はGPUが主役、でも動かす(推論する)段階は別物』という認識を、AWS自ら明言した格好です。

『新しいレシピを開発するシェフ(GPU)と、毎日大量に料理を出すホールスタッフ(CPU)は別の能力が要る』という捉え方。

クラウドAIの稼働費の8割は推論と言われる時代の、論理的な選択として位置づけられます。

なぜCPUがAI時代の主役に?|エージェントが変えたゲーム

GPU一強ではなくなった理由を3つの角度から見ていきます。

学習はGPU、推論はCPU|役割分担が明確化

大規模AIモデルの学習(トレーニング)では、いまもNvidia系GPUが圧倒的な強さを持ちます。しかし、できあがったAIを使う段階=推論では、CPUが主役になる場面が急増しています。

『料理を覚えるのは台所での修行(GPU)、でも実際に毎日お客様に出すのは厨房のオペレーション(CPU)』という分業。

数兆パラメータのモデル学習という派手な世界の裏で、何億回も繰り返される推論という地味な仕事の総量が、実は学習の何倍にも膨らんでいるのが現状です。

エージェントの登場|司令塔はCPU仕事

AIエージェント(自律的にタスクをこなすAI)の特徴は、複数のツールやAPIを順番に呼び出す司令塔役。

『今日の天気を調べて、レストランを予約して、移動経路を計算する』ような連続した判断と実行が必要です。

『料理1品の盛り付けはシェフの腕(GPU)でも、コース全体の進行を仕切るのはホール責任者(CPU)』という構図。

GPUは行列計算が得意だが、複雑な分岐・状態管理・スケジューリングはCPUの本領という分業が、エージェント時代の新しい常識になりつつあります。

経済性の転換|ピークFLOPSから持続TCOへ

これまでAIインフラ投資は『ピーク性能(FLOPS)』を競う世界でした。しかし推論が常時稼働するエージェント時代では、24時間365日動かしたときの総所有コスト(TCO)と電力効率が決定打になります。

『最高速のスポーツカーより、燃費とメンテ性に優れるトラック』が選ばれる物流業界の論理と一緒。

高価なGPUを推論に使い倒すより、安くて省電力なCPUに振り分けたほうが経済的という計算が、Meta規模の企業ではっきり成立した結果が今回の契約です。

Graviton5の中身|192コア×3nmの実力

いま市場最強級のクラウドArm CPUの中身を、わかりやすく分解します。

192コア|Arm Neoverse V3ベースの巨大プロセッサ

Graviton5はArm Neoverse V3コアを192個搭載しています。これは高性能Pコア(パフォーマンスコア)192本ぶん——一般的な家庭用PCのCPUが8〜16コアであることを考えると、24倍以上の規模。

『家のキッチンが1人用なら、Graviton5は192人ぶんのコックが同時に動くホテルの厨房』のサイズ感。

1台でAIエージェント数百セッションを並列にさばける物量で、推論の同時接続数を一気に引き上げるのが特徴です。

3nmプロセス|キャッシュ5倍・コア間遅延33%減

Graviton5は3ナノメートル(3nm)の最先端プロセスで製造され、キャッシュ容量は前世代の5倍、コア間通信の遅延は最大33%削減されました。

『192人のコックが、めいめいに巨大なメモ帳(キャッシュ)を持ち、隣のコックへの伝言が3割速い』状態。これにより、複数の推論ジョブが同時並行で動くマルチテナント環境でも、性能の落ち込みが小さいのが利点。

スループットも応答時間もバランスよく出るという、サーバー用CPUの理想形に近づいたと評価されています。

前世代比+25%|DDR5-8800/PCIe Gen6で次世代対応

性能は前世代Graviton4比で最大25%向上、メモリは超高速のDDR5-8800、I/OはPCIe Gen6に対応。

『AIエージェントが必要とするデータの読み込み・書き出しの帯域が、桁違いに広がる』設計です。

『山道(DDR4)から高速道路(DDR5-8800)に乗り換える』感覚で、データの待ち時間が短縮。

CPU性能が上がっても、データ供給が追いつかなければ意味がないボトルネックを、最先端のメモリ・I/Oで一気に解消した世代と位置づけられます。

x86比のコスト・電力優位|エネルギー最大60%減

従来のArm系GravitonはIntel/AMDのx86系比でコスト約20%安、電力最大60%減という実績を持ちます。Graviton5はその系譜の最新進化で、AI推論のような常時稼働ワークロードではTCOで圧倒的に有利。

『同じ仕事を、半分の電気代で、安いチップでこなせる』という性質。

データセンターの電力供給が逼迫している現在、CPU選定でデータセンター全体の運営費が変わる時代が到来しています。

競合との位置取り|Arm CPU三国志

クラウド3大手の自社Arm CPU戦略を整理します。

vs Google Axion|Genoa級スループットの俊足

Googleの自社Arm CPU『Axion』は、Neoverse V2/V3ベースで、AMD EPYC Genoa級のスレッド性能を実現。ベンチマークでは、Graviton4比で項目によっては最大47%速いという結果もあります。

『俊足の中距離ランナー(Axion)vs 大型バスのドライバー(Graviton)』のような関係。

軽量な推論ジョブでは速さが効く、エージェント大量並列ではコア数が効くという棲み分け。用途次第で勝者が入れ替わる激戦区で、いまのところAxionは性能リーダー、Gravitonは規模リーダーという位置づけです。

vs Microsoft Cobalt 200|TCO最適化の刺客

Microsoftの自社Arm CPU『Cobalt 200』もNeoverse V3ベースで、Cobalt 100比50%性能向上。2026年初頭からAzureの一部VMファミリーで提供開始と発表されています。

『データベース系の単スレッド処理に強く、TCO(総所有コスト)最適化を全面に出す』戦略。

AWSの規模、Googleの俊足、MicrosoftのTCOという三者三様の戦略が、Arm CPU市場を多極化させています。

Nvidia GPU独占の話題の陰で、CPU側でも凄絶な技術競争が進行中です。

vs Intel/AMD(x86)|防衛側の戦い方

x86陣営のIntelとAMDは、シェア防衛のために専用AIアクセラレータ(Gaudi、Instinct)と高効率コア(E-core)に投資しています。

『街の老舗ラーメン店が、新興チェーンの攻勢にメニュー改革で対抗する』構図。

互換性・既存資産の活かしやすさでいえばx86が優位、新規ワークロード・大規模スケールでいえばArmが優位という色分け。

今後5年の勢力図は、AIエージェントワークロードがどちらに最適化されるかで決まる重要な転換期に入っています。

日本市場への影響|国内導入の波と打ち手

『海外の話、日本にどう関係する?』という疑問に答えます。

NTTドコモの先行事例|Graviton2で消費電力72%減

NTTドコモはNECとの共同実験で、AWS Graviton2を採用した5Gコアネットワーク基盤の消費電力を、x86環境比で平均72%削減することに成功。2026年3月にはAWS上での5Gコアの商用運用を国内で初めて開始しました。

『国内の重要インフラがArmベースに移った』という意味で、極めて象徴的な事例です。

Graviton5のさらなる高効率を生かせば、5G/6G時代の電力ひっ迫に直接効くという追い風として、通信業界の評価が高まっています。

国産AIエージェント開発への波及|CPU推論が日本でも本流に

国産LLM・AIエージェント開発の現場でも、推論コストの最適化は最大の課題。

『東大松尾研、CyberAgent、PFN、ELYZAなどの開発チームが、Graviton系での推論ベンチマークを進めている』状況が業界では知られています。

『日本でしか出せないモデル』と『安く使い倒せるインフラ』の組み合わせが、競争力の決め手。

Nvidia GPUを取り合うレッドオーシャンに対し、Arm CPU推論というブルーオーシャンへ動く国産AIの地殻変動が、今回の発表で加速する見立てです。

中堅企業のクラウド戦略|Graviton標準化が始まる

大手以外の日本企業でも、AWS東京リージョンで提供されるGraviton系インスタンスへの移行は進行中。

『コスト20%減、電力60%減』というx86比のスペック差は、決算インパクトに直結します。

『社内の主力Webサーバーから順番にArm化していく』のが現実的なロードマップ。

Graviton5世代を使ったAIエージェント機能の実装が日本企業の差別化要素になる、という読みが広がり始めています。

わたしたちの仕事はどう変わる?|3つの活用シーン

シーン1|EC企業のSREエンジニア 永田さん(38歳)の請求書激減

中堅ECサイトのSRE担当・永田さんは、毎月のAWS請求書に頭を抱えていました。

『商品レコメンド用の小型LLMをGPUインスタンスで動かしていたら、月額300万円超え』という状況。提携を機に、推論サーバーをGraviton5系インスタンスに段階移行する検討を開始しました。

『高級寿司を毎日食べていた状態から、家庭料理にレベル下げしても満足度はほぼ同じ』という発見。

GPUを使うべき場所と、CPUで十分な場所を切り分ける設計力が、SRE職の新しい競争領域として浮かび上がっています。

シーン2|スタートアップのCTO 黒木さん(32歳)のエージェント開発

業務自動化スタートアップのCTO・黒木さんは、社内タスク自動化エージェントを開発中。

『複数SaaSのAPIを連続呼び出し、結果を解釈して次の動作を決める』という典型的なエージェント設計です。このワークロードは、ほとんどがCPU仕事——推論コア部分はGPUを使うが、司令塔ロジックはCPUで十分。

『Graviton5なら、同じ予算で2倍の同時接続を捌ける』という試算が出ました。

競合より安く速いエージェントを提供する差別化材料として、Arm CPU選定がスタートアップの成長戦略の中心になっています。

シーン3|製造業の情シス課長 福原さん(45歳)の社内AI構想

大手製造業の情シス課長・福原さんは、社内向けAIアシスタントを構築中。

『日々の問い合わせ対応で常時推論を回す』タイプの社内SaaSです。提携を踏まえ、推論基盤をGraviton5に統一した試算では、3年TCOで45%削減という結果に。

『削減原資で社内AI教育の専属チームを増員できる』戦略変更につながったそうです。

電気代と寒空のデータセンター冷却費が経営課題になる時代、CPU選定が情シス部長の評価指標になる動きが広がっています。

よくある質問(FAQ)

Q. Graviton5は、Nvidia GPUをまるごと置き換えるのですか?

A. いいえ、置き換えではなく役割分担です。大規模モデルの学習(トレーニング)はNvidia系GPUが圧倒的に有利、推論やエージェントの司令塔はCPUが効率的。

『新車の組み立てはロボット、お客への引き渡しは人間』のような分業。

GPUの代わりではなく、GPUが苦手な仕事を引き受けるパートナーという位置づけ。Meta自身もNvidia GPU、自社ASIC、Graviton5の三つを併用するハイブリッド戦略を明言しています。

Q. ArmベースCPUって、自分のソフトはそのまま動きますか?

A. 多くの主要言語・フレームワークはArm対応済み。Python、Node.js、Go、Java、Rustなどは公式サポート、Docker・Kubernetesも問題なく動作します。

『パスポートの種類が違うだけで、行ける国は同じ』感覚。ただし、x86バイナリだけのレガシーアプリや、特定のドライバー依存のソフトは検証が必要。

移行前にCI/CDでクロスビルドを確認、本番前にステージングでベンチを取るという標準的な手順を踏めば、多くのケースで滑らかに移行できます。

Q. AWS Graviton5は、いつから誰でも使えますか?

A. 2026年内に主要EC2インスタンスファミリー(M8g、C8g、R8gなど)として一般提供開始の見込み。東京リージョンへの展開時期は段階的で、米国主要リージョンが先行する見通しです。

『新型iPhoneが日本に少し遅れて来る』感覚。

まずは米国リージョンで開発・検証、提供開始後に東京リージョンへ移行という戦略が、日本企業の現実的な進め方として推奨されます。

Q. 日本企業がいま準備すべきことは何ですか?

A. 3ステップが現実的。第1にCI/CDのArm対応(クロスビルド・テスト整備)、第2にAWS Compute Optimizerで現行ワークロードのGraviton適合度を可視化、第3にAI推論層をGPUで残すべき部分とGraviton5に移すべき部分に切り分ける設計。

『荷物の中身を整理してから引っ越し業者を呼ぶ』のと同じ手順。

いきなり全移行を狙わず、新規開発から先にGraviton標準化が王道のロードマップです。

Q. この提携で、Nvidiaの株価や立ち位置はどうなりますか?

A. 短期的にはGPUの寡占崩しの象徴として警戒される動きはあります。ただしNvidia自身も学習用GPUのトップであり続け、推論専用チップ(GB200/GB300、Rubin系)でも勝負を仕掛けている点は変わりません。

『コーラ1強の市場に新しい飲料が登場しても、コーラが倒れるわけではない』状況。

GPU独占からマルチチップ時代へ移行する過程で、Nvidiaのシェアはやや薄れるが、市場全体が拡大しているため売上は伸び続けるという見方が業界の主流です。

まとめ

  • 2026年4月24日:MetaがAWS Graviton5を数千万コア規模で採用、複数年・数十億ドル契約を締結
  • Graviton5の実力:192コア/3nm/キャッシュ5倍/コア間遅延33%減/前世代比性能25%向上
  • 用途はAIエージェント推論:CPUがリアルタイム推論・コード生成・司令塔役を担う時代に
  • 競合状況:Google Axion・Microsoft Cobalt 200と三つ巴、x86陣営は防衛戦へ
  • 日本への影響:NTTドコモのGraviton2成功事例から、Graviton5世代の本格導入が始まる
  • 次のアクションAWS公式発表Meta公式ブログに目を通し、自社のAIインフラ戦略を再検討するのが第一歩

『AIといえばGPU』だった常識が、Meta×AWSの提携を境に書き換わり始めています。数千万コアという物量、3nm/192コアの技術、複数年・数十億ドルという契約規模——いずれもCPUがAIエージェント時代の主役の一角に躍り出た証拠。

脱Nvidiaを狙う多様化、脱x86を進めるArmシフト、ピークFLOPSから持続TCOへの経済性転換——この3つの潮流が、ひとつの契約に凝縮されています。日本企業にとっても、NTTドコモが先陣を切ったGravitonの省電力革命を、AIエージェント時代へ拡張する好機。

『AIインフラ選定が、決算に直結する経営判断になる時代』の入り口を、私たちはいま渡っている——そう捉えると、この発表の重みが見えてきます。

参考文献

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です