- 2026年4月24日発表:MetaがAWS Graviton5を数千万コア規模で採用、複数年・数十億ドル契約
- Graviton5の中身:192コア/3nmプロセス/キャッシュ前世代5倍/コア間遅延33%削減/性能25%向上
- 用途はAIエージェント推論:リアルタイム推論・コード生成・検索・マルチステップ司令塔の“CPU仕事”に特化
- 脱Nvidia×脱x86の象徴:GPU独占崩しに加え、ArmベースがクラウドAIの新標準へ
- 日本でも実績:NTTドコモがGraviton2で5Gコア消費電力72%削減、Graviton5で第二波が来る
『AIといえばGPU、と思っていたら、いつのまにかCPUが主役の側にも回ってきた』——2026年4月24日、MetaとAmazon Web Services(AWS)が発表した提携は、まさにそんな転換点を象徴するニュースです。Metaが採用するAWS Graviton5は数千万コア規模、契約は複数年で総額数十億ドル超。『なぜGPUじゃなくCPUなの?』『Armって何がすごい?』『日本企業に関係ある?』という疑問を、中学生でもわかる言葉でほぐしていきます。
何が起きた?|Meta×AWS提携の全体像
まずは発表内容を5分で整理します。
2026年4月24日|複数年・数十億ドル契約を同時公表
2026年4月24日、AmazonとMetaは公式ブログ・プレスリリースで提携を一斉公表しました。『Metaが、AWS Graviton5プロセッサを“数千万コア”規模で導入する』『契約は複数年・数十億ドル(multibillion-dollar)規模』という2点が骨子です。『Graviton5=AWSが自社設計したArmベースのサーバー用CPU』で、いま市場最強クラスのクラウド向けArmチップ。『大手ITが他社のCPUを大量に長期契約で買う』という事例は、業界でも一気に話題になりました。“GPU争奪戦”の裏で進んでいた“CPUの陣取り合戦”が、表舞台に出た瞬間と言えます。
Meta側の言葉|「コンピュート多様化は戦略的命題」
Metaのインフラ責任者Santosh Janardhan氏は、『コンピュートソースの多様化は、いまや戦略的命題(strategic imperative)だ』とコメント。『たった1社のチップに依存していたら、価格交渉も供給リスクも全部相手まかせ』という危機感が背景にあります。『高速道路に頼らず、新幹線・飛行機・船もぜんぶ用意する』物流戦略と同じ発想。“1強Nvidia”時代の不安を、Arm系CPUで分散吸収しようとする企業判断が、はっきり読み取れる発言になりました。
AWS側の言葉|「AI推論基盤としてのCPUの重要性」
AWSのVP兼Distinguished EngineerのNafea Bshara氏は、『理解し、予測し、効率的にスケールするAIを作るための基盤を提供する』と語りました。『学習はGPUが主役、でも“動かす(推論する)”段階は別物』という認識を、AWS自ら明言した格好です。『新しいレシピを開発するシェフ(GPU)と、毎日大量に料理を出すホールスタッフ(CPU)は別の能力が要る』という捉え方。“クラウドAIの稼働費の8割は推論”と言われる時代の、論理的な選択として位置づけられます。
なぜ“CPU”がAI時代の主役に?|エージェントが変えたゲーム
“GPU一強”ではなくなった理由を3つの角度から見ていきます。
学習はGPU、推論はCPU|役割分担が明確化
大規模AIモデルの学習(トレーニング)では、いまもNvidia系GPUが圧倒的な強さを持ちます。しかし、できあがったAIを“使う段階=推論”では、CPUが主役になる場面が急増しています。『料理を覚えるのは台所での修行(GPU)、でも実際に毎日お客様に出すのは厨房のオペレーション(CPU)』という分業。“数兆パラメータのモデル学習”という派手な世界の裏で、“何億回も繰り返される推論”という地味な仕事の総量が、実は学習の何倍にも膨らんでいるのが現状です。
エージェントの登場|“司令塔”はCPU仕事
AIエージェント(自律的にタスクをこなすAI)の特徴は、複数のツールやAPIを順番に呼び出す“司令塔役”。『今日の天気を調べて、レストランを予約して、移動経路を計算する』ような連続した判断と実行が必要です。『料理1品の盛り付けはシェフの腕(GPU)でも、コース全体の進行を仕切るのはホール責任者(CPU)』という構図。“GPUは行列計算が得意だが、複雑な分岐・状態管理・スケジューリングはCPUの本領”という分業が、エージェント時代の新しい常識になりつつあります。
経済性の転換|“ピークFLOPS”から“持続TCO”へ
これまでAIインフラ投資は『ピーク性能(FLOPS)』を競う世界でした。しかし推論が常時稼働する“エージェント時代”では、24時間365日動かしたときの総所有コスト(TCO)と電力効率が決定打になります。『最高速のスポーツカーより、燃費とメンテ性に優れるトラック』が選ばれる物流業界の論理と一緒。“高価なGPUを推論に使い倒すより、安くて省電力なCPUに振り分けたほうが経済的”という計算が、Meta規模の企業ではっきり成立した結果が今回の契約です。
Graviton5の中身|192コア×3nmの実力
“いま市場最強級のクラウドArm CPU”の中身を、わかりやすく分解します。
192コア|Arm Neoverse V3ベースの巨大プロセッサ
Graviton5はArm Neoverse V3コアを192個搭載しています。これは“高性能Pコア(パフォーマンスコア)”192本ぶん——一般的な家庭用PCのCPUが8〜16コアであることを考えると、24倍以上の規模。『家のキッチンが1人用なら、Graviton5は192人ぶんのコックが同時に動くホテルの厨房』のサイズ感。“1台でAIエージェント数百セッションを並列にさばける”物量で、推論の同時接続数を一気に引き上げるのが特徴です。
3nmプロセス|キャッシュ5倍・コア間遅延33%減
Graviton5は3ナノメートル(3nm)の最先端プロセスで製造され、キャッシュ容量は前世代の5倍、コア間通信の遅延は最大33%削減されました。『192人のコックが、めいめいに巨大なメモ帳(キャッシュ)を持ち、隣のコックへの伝言が3割速い』状態。これにより、複数の推論ジョブが同時並行で動くマルチテナント環境でも、性能の落ち込みが小さいのが利点。“スループットも応答時間もバランスよく出る”という、サーバー用CPUの理想形に近づいたと評価されています。
前世代比+25%|DDR5-8800/PCIe Gen6で次世代対応
性能は前世代Graviton4比で最大25%向上、メモリは超高速のDDR5-8800、I/OはPCIe Gen6に対応。『AIエージェントが必要とするデータの“読み込み・書き出し”の帯域が、桁違いに広がる』設計です。『山道(DDR4)から高速道路(DDR5-8800)に乗り換える』感覚で、データの待ち時間が短縮。“CPU性能が上がっても、データ供給が追いつかなければ意味がない”ボトルネックを、最先端のメモリ・I/Oで一気に解消した世代と位置づけられます。
x86比のコスト・電力優位|エネルギー最大60%減
従来のArm系GravitonはIntel/AMDのx86系比でコスト約20%安、電力最大60%減という実績を持ちます。Graviton5はその系譜の最新進化で、AI推論のような“常時稼働ワークロード”ではTCOで圧倒的に有利。『同じ仕事を、半分の電気代で、安いチップでこなせる』という性質。“データセンターの電力供給が逼迫している現在、CPU選定でデータセンター全体の運営費が変わる時代”が到来しています。
競合との位置取り|Arm CPU三国志
クラウド3大手の自社Arm CPU戦略を整理します。
vs Google Axion|“Genoa級スループット”の俊足
Googleの自社Arm CPU『Axion』は、Neoverse V2/V3ベースで、AMD EPYC Genoa級のスレッド性能を実現。ベンチマークでは、Graviton4比で項目によっては最大47%速いという結果もあります。『俊足の中距離ランナー(Axion)vs 大型バスのドライバー(Graviton)』のような関係。“軽量な推論ジョブでは速さが効く、エージェント大量並列ではコア数が効く”という棲み分け。用途次第で勝者が入れ替わる激戦区で、いまのところAxionは性能リーダー、Gravitonは規模リーダーという位置づけです。
vs Microsoft Cobalt 200|“TCO最適化”の刺客
Microsoftの自社Arm CPU『Cobalt 200』もNeoverse V3ベースで、Cobalt 100比50%性能向上。2026年初頭からAzureの一部VMファミリーで提供開始と発表されています。『データベース系の単スレッド処理に強く、TCO(総所有コスト)最適化を全面に出す』戦略。“AWSの規模、Googleの俊足、MicrosoftのTCO”という三者三様の戦略が、Arm CPU市場を多極化させています。“Nvidia GPU独占”の話題の陰で、CPU側でも凄絶な技術競争が進行中です。
vs Intel/AMD(x86)|“防衛側”の戦い方
x86陣営のIntelとAMDは、シェア防衛のために専用AIアクセラレータ(Gaudi、Instinct)と高効率コア(E-core)に投資しています。『街の老舗ラーメン店が、新興チェーンの攻勢にメニュー改革で対抗する』構図。“互換性・既存資産の活かしやすさ”でいえばx86が優位、“新規ワークロード・大規模スケール”でいえばArmが優位という色分け。“今後5年の勢力図は、AIエージェントワークロードがどちらに最適化されるかで決まる”重要な転換期に入っています。
日本市場への影響|国内導入の波と打ち手
『海外の話、日本にどう関係する?』という疑問に答えます。
NTTドコモの先行事例|Graviton2で消費電力72%減
NTTドコモはNECとの共同実験で、AWS Graviton2を採用した5Gコアネットワーク基盤の消費電力を、x86環境比で平均72%削減することに成功。2026年3月にはAWS上での5Gコアの商用運用を国内で初めて開始しました。『国内の重要インフラがArmベースに移った』という意味で、極めて象徴的な事例です。“Graviton5のさらなる高効率を生かせば、5G/6G時代の電力ひっ迫に直接効く”という追い風として、通信業界の評価が高まっています。
国産AIエージェント開発への波及|“CPU推論”が日本でも本流に
国産LLM・AIエージェント開発の現場でも、推論コストの最適化は最大の課題。『東大松尾研、CyberAgent、PFN、ELYZAなどの開発チームが、Graviton系での推論ベンチマークを進めている』状況が業界では知られています。『日本でしか出せないモデル』と『安く使い倒せるインフラ』の組み合わせが、競争力の決め手。“Nvidia GPUを取り合うレッドオーシャンに対し、Arm CPU推論というブルーオーシャンへ動く国産AI”の地殻変動が、今回の発表で加速する見立てです。
中堅企業のクラウド戦略|Graviton標準化が始まる
大手以外の日本企業でも、AWS東京リージョンで提供されるGraviton系インスタンスへの移行は進行中。『コスト20%減、電力60%減』というx86比のスペック差は、決算インパクトに直結します。『社内の主力Webサーバーから順番にArm化していく』のが現実的なロードマップ。“Graviton5世代を使ったAIエージェント機能の実装”が日本企業の差別化要素になる、という読みが広がり始めています。
わたしたちの仕事はどう変わる?|3つの活用シーン
シーン1|EC企業のSREエンジニア 永田さん(38歳)の請求書激減
中堅ECサイトのSRE担当・永田さんは、毎月のAWS請求書に頭を抱えていました。『商品レコメンド用の小型LLMをGPUインスタンスで動かしていたら、月額300万円超え』という状況。提携を機に、推論サーバーをGraviton5系インスタンスに段階移行する検討を開始しました。『高級寿司を毎日食べていた状態から、家庭料理にレベル下げしても満足度はほぼ同じ』という発見。“GPUを使うべき場所と、CPUで十分な場所を切り分ける設計力”が、SRE職の新しい競争領域として浮かび上がっています。
シーン2|スタートアップのCTO 黒木さん(32歳)のエージェント開発
業務自動化スタートアップのCTO・黒木さんは、社内タスク自動化エージェントを開発中。『複数SaaSのAPIを連続呼び出し、結果を解釈して次の動作を決める』という典型的なエージェント設計です。このワークロードは、ほとんどがCPU仕事——推論コア部分はGPUを使うが、司令塔ロジックはCPUで十分。『Graviton5なら、同じ予算で2倍の同時接続を捌ける』という試算が出ました。“競合より安く速いエージェントを提供する”差別化材料として、Arm CPU選定がスタートアップの成長戦略の中心になっています。
シーン3|製造業の情シス課長 福原さん(45歳)の社内AI構想
大手製造業の情シス課長・福原さんは、社内向けAIアシスタントを構築中。『日々の問い合わせ対応で常時推論を回す』タイプの社内SaaSです。提携を踏まえ、推論基盤をGraviton5に統一した試算では、3年TCOで45%削減という結果に。『削減原資で“社内AI教育”の専属チームを増員できる』戦略変更につながったそうです。“電気代と寒空のデータセンター冷却費が経営課題になる時代”、CPU選定が情シス部長の評価指標になる動きが広がっています。
よくある質問(FAQ)
Q. Graviton5は、Nvidia GPUをまるごと置き換えるのですか?
A. いいえ、置き換えではなく“役割分担”です。大規模モデルの学習(トレーニング)はNvidia系GPUが圧倒的に有利、推論やエージェントの司令塔はCPUが効率的。『新車の組み立てはロボット、お客への引き渡しは人間』のような分業。“GPUの代わりではなく、GPUが苦手な仕事を引き受けるパートナー”という位置づけ。Meta自身もNvidia GPU、自社ASIC、Graviton5の三つを併用するハイブリッド戦略を明言しています。
Q. ArmベースCPUって、自分のソフトはそのまま動きますか?
A. 多くの主要言語・フレームワークはArm対応済み。Python、Node.js、Go、Java、Rustなどは公式サポート、Docker・Kubernetesも問題なく動作します。『パスポートの種類が違うだけで、行ける国は同じ』感覚。ただし、x86バイナリだけのレガシーアプリや、特定のドライバー依存のソフトは検証が必要。“移行前にCI/CDでクロスビルドを確認、本番前にステージングでベンチを取る”という標準的な手順を踏めば、多くのケースで滑らかに移行できます。
Q. AWS Graviton5は、いつから誰でも使えますか?
A. 2026年内に主要EC2インスタンスファミリー(M8g、C8g、R8gなど)として一般提供開始の見込み。東京リージョンへの展開時期は段階的で、米国主要リージョンが先行する見通しです。『新型iPhoneが日本に少し遅れて来る』感覚。“まずは米国リージョンで開発・検証、提供開始後に東京リージョンへ移行”という戦略が、日本企業の現実的な進め方として推奨されます。
Q. 日本企業がいま準備すべきことは何ですか?
A. 3ステップが現実的。第1にCI/CDのArm対応(クロスビルド・テスト整備)、第2にAWS Compute Optimizerで現行ワークロードのGraviton適合度を可視化、第3にAI推論層を“GPUで残すべき部分”と“Graviton5に移すべき部分”に切り分ける設計。『荷物の中身を整理してから引っ越し業者を呼ぶ』のと同じ手順。“いきなり全移行を狙わず、新規開発から先にGraviton標準化”が王道のロードマップです。
Q. この提携で、Nvidiaの株価や立ち位置はどうなりますか?
A. 短期的には“GPUの寡占崩しの象徴”として警戒される動きはあります。ただしNvidia自身も学習用GPUのトップであり続け、推論専用チップ(GB200/GB300、Rubin系)でも勝負を仕掛けている点は変わりません。『コーラ1強の市場に新しい飲料が登場しても、コーラが倒れるわけではない』状況。“GPU独占からマルチチップ時代へ移行する過程で、Nvidiaのシェアはやや薄れるが、市場全体が拡大しているため売上は伸び続ける”という見方が業界の主流です。
まとめ
- 2026年4月24日:MetaがAWS Graviton5を数千万コア規模で採用、複数年・数十億ドル契約を締結
- Graviton5の実力:192コア/3nm/キャッシュ5倍/コア間遅延33%減/前世代比性能25%向上
- 用途はAIエージェント推論:CPUがリアルタイム推論・コード生成・司令塔役を担う時代に
- 競合状況:Google Axion・Microsoft Cobalt 200と三つ巴、x86陣営は防衛戦へ
- 日本への影響:NTTドコモのGraviton2成功事例から、Graviton5世代の本格導入が始まる
- 次のアクション:AWS公式発表とMeta公式ブログに目を通し、自社のAIインフラ戦略を再検討するのが第一歩
『AIといえばGPU』だった常識が、Meta×AWSの提携を境に書き換わり始めています。数千万コアという物量、3nm/192コアの技術、複数年・数十億ドルという契約規模——いずれもCPUがAIエージェント時代の主役の一角に躍り出た証拠。“脱Nvidia”を狙う多様化、“脱x86”を進めるArmシフト、“ピークFLOPSから持続TCOへ”の経済性転換——この3つの潮流が、ひとつの契約に凝縮されています。日本企業にとっても、NTTドコモが先陣を切ったGravitonの省電力革命を、AIエージェント時代へ拡張する好機。『AIインフラ選定が、決算に直結する経営判断になる時代』の入り口を、私たちはいま渡っている——そう捉えると、この発表の重みが見えてきます。
参考文献
- Meta signs agreement with AWS to power agentic AI on Amazon’s Graviton chips(AWS公式 2026年4月24日)
- Meta Partners With AWS on Graviton Chips to Power Agentic AI(Meta公式ニュースルーム)
- MetaがAmazonの『AWS Graviton』を大量採用(GIGAZINE 2026年4月25日)
- Meta Buys Tens of Millions of AWS Graviton Arm Cores in a CPU Land Grab(ServeTheHome)
- Meta signs multibillion-dollar deal to use Amazon’s Graviton chips for agentic AI(GeekWire)
- ドコモとNECがAWSを活用しGraviton2利用による5Gコアネットワーク消費電力7割削減(NEC プレスリリース)

