Grok V9-Medium完成｜1.5兆規模で6月公開、現行3倍

監修者伊東雄歩

株式会社ウォーカー CEO。東北大学卒。MENSA会員、JDLA認定講師、健全AI教育協会理事。生成AI×教育・学習科学を専門とし、2億円超のシステム開発プロジェクトを統括。

xAIが新基盤モデル「Grok V9-Medium」の学習を完了、6月中旬に一般公開予定
パラメータ数は1.5兆と現行モデルの3倍、コーディング王座を本気で狙う
AIエディタCursorの実データを学習素材に使い、現場のプログラミング作業に強い
競合のClaude Opus 4.7は87.6%、Grok 4は75%。差を埋められるかが焦点
日本ではX Premium（月980円）またはSuperGrok（月30ドル）で利用可能

「Grok（グロック）はChatGPTやClaudeに追いつけるの？」と思ったことはありませんか。5月25日、イーロン・マスク氏が次世代モデルGrok V9-Mediumの学習完了を発表し、いよいよ6月中旬に一般公開される見込みです。本記事では何が変わるのか、ライバルとの差はどこまで縮まるのかを、最新の数字を交えながら整理します。

Grok V9-Mediumとは？1.5兆パラメータの新基盤モデル

現行モデルの3倍規模に拡張

Grok V9-Mediumは、xAI（現SpaceXAI）が開発した新しい大規模言語モデルです。

パラメータ数は1.5兆（1.5 trillion）。Grokサービスの裏で実際に動いている現行モデル「v8-small」が約5000億（0.5兆）なので、ちょうど3倍の規模になります。

パラメータとは、AIが文章を理解したり予測したりするときに使う「重み」のようなものです。数が多いほど複雑なタスクに対応しやすくなる傾向があります。

マスク氏は5月25日に「学習を完了し、評価結果は良好」とX（旧Twitter）で発表しました。続いて教師ありの微調整と強化学習を行ったうえで、2026年6月中旬の一般公開を目指しています。

「蒸留なし」のゼロからの学習

注目すべきは、V9-Mediumが他社モデルの出力をマネる「蒸留（じょうりゅう）」なしで、ゼロから学習されている点です。

蒸留は学習コストを抑えられる代わりに、教師モデルの性能を超えにくいという弱点があります。V9-Mediumは独自路線を選び、自前で頂点を狙いに行く構えです。

なぜ「Cursorデータ学習」が画期的なのか

プログラマーの実作業を学習素材に

V9-Mediumの最大の特徴は、AIコードエディタCursor（カーソル）の実データを学習に使った点です。

Cursorは、OpenAI・Stripe・Perplexityといった有名企業のエンジニアが日常的に使っているAI付きエディタです。世界中の開発者が、リアルなコードを書きながら、修正したりリファクタリング（コード整理）したりしています。

従来のコーディングAIは、GitHub（ギットハブ）の公開リポジトリを教材にするのが定番でした。完成済みのコードが大量にある一方で、「人が試行錯誤しながら直していく過程」は学べません。

Cursorのデータには、デバッグ（バグ修正）・リファクタリング・新機能追加の生の流れが記録されています。V9-Mediumはこの一次資料を学ぶことで、現場の開発作業を再現しやすくなったわけです。

具体的にできることのイメージ

例えば、ある中小企業のエンジニアが社内システムにログイン機能を追加する場面を想像してみてください。

仕様変更で何度も書き直し、テストで失敗してログを見ながら修正し、最後に別ファイルの定数を直して動くようになる——こうした往復のパターンを、V9-Mediumは多数のCursorユーザーの作業から学んでいます。

つまり「完成形だけ知っているAI」ではなく、「失敗してから直すまでを知っているAI」に近づいたということです。

データ利用への賛否

ただしCursorの利用規約を巡って、開発者コミュニティから「自分のコードがAI学習に使われるのは想定外」という声も出ています。マスク氏は「今後もCursorデータを追加投入する」と明言しており、この点はサービス側の透明性が問われそうです。

コーディング王座戦線：Claude・GPT・Geminiとの比較

主要モデルのSWE-benchスコア

コーディングAIの実力を測る代表的なベンチマークが「SWE-bench Verified」です。GitHubの実際のバグ修正タスクをどれだけ正しく解けるかを測ります。

2026年6月時点の主要モデルのスコアは以下の通りです。

Claude Mythos Preview：93.9%（首位）
Claude Opus 4.8：88.6%
Claude Opus 4.7：87.6%
GPT-5.3 Codex：85.0%
Gemini 3.1 Pro：80.6%
Grok 4（v8-small基盤）：75%

現行のGrok 4はトップから10〜18ポイント離されています。V9-Mediumがこの差をどこまで詰められるかが、6月公開の最大の見どころです。

それぞれの得意分野は違う

ただし「1位＝万能」ではありません。最新の比較レポートによると、Claudeは複数ファイルにまたがる複雑なロジックに強く、GPTはターミナル操作、Geminiはリポジトリ全体の理解で頭ひとつ抜けるとされます。

実際、開発現場では複数のAIを並列でレビューさせると、1モデル単体に比べて発見できる問題が約3割増えるという調査もあります。V9-Mediumがどの軸で強みを出すかで、用途別の使い分けが変わる可能性があります。

日本での使い方と料金 — X Premium・SuperGrokの選び方

無料でも試せる

日本のユーザーがGrokを使う方法は大きく3つあります。

1つ目は無料版。ブラウザで「grok.com」にアクセスすれば、誰でもログインして基本機能を試せます。

X Premiumプラン（X連携重視）

2つ目はX Premium。X（旧Twitter）と合わせて使いたい人向けです。日本の月額料金は以下になっています。

X Premium：月980円
X Premium+：月6,080円

X Premium以上に入ると、画像生成やDeepSearch（深掘り検索）などのGrok機能が解禁されます。Xを日常的に使い、タイムライン上でGrokに話しかけたい人にはこちらが便利です。

SuperGrok（AI単体重視）

3つ目はSuperGrok。AI機能だけを使いたい人向けの単体プランで、料金は月30ドル（App Store日本では月5,000円表示）です。

X Premium+の6,080円より約1,000円安く、SNS機能が不要ならこちらの方がコスト効率が良くなります。さらに上位の「SuperGrok Heavy」は月50,000円で、より重いタスクや長時間利用向けに設計されています。

どれを選ぶ？

ざっくりまとめると以下のような選び方になります。

とりあえず試したい → grok.comの無料版
Xも一緒に使いたい → X Premium（月980円）
AI機能だけしっかり使いたい → SuperGrok（月30ドル）
業務で大量に使う → SuperGrok Heavy（月50,000円）

V9-Mediumが公開されると、どのプランで使えるかは現時点で未発表です。これまでの流れだとSuperGrok以上で先行提供される可能性が高いと見られます。

Grok 5（6兆パラメータ）と SpaceXAI 統合という次の一手

既にGrok 5も学習中

マスク氏はV9-Mediumと同時に、その先のGrok 5の存在も明かしています。

Grok 5は6兆パラメータを目標としたMoE（Mixture of Experts／専門家混合）構造のモデルです。実現すれば、公表ベースで世界最大級のAIモデルになります。

MoEとは、複数の小さな専門家AIを内部に持ち、質問に応じて適切な専門家だけを動かす仕組みです。全パラメータを一度に使わずに済むので、巨大化と効率のバランスを取りやすくなります。

Colossus 2 という巨大インフラ

Grok 5の学習場所は、テネシー州メンフィスにあるColossus 2というスーパーコンピューターです。

NVIDIAの最新GPU「GB200」「GB300」を約55万基搭載し、消費電力は1ギガワット超。2026年1月、世界で初めて1ギガワットを超えたAI学習施設として記録されました。

1ギガワットは、大規模な原子力発電所1基分の出力に相当します。AIの世界で「電力こそが競争力」と言われる理由が、この数字に表れています。

xAIはSpaceXAIへ

組織面でも大きな動きがありました。マスク氏はxAIを独立企業として解散し、SpaceXの傘下に「SpaceXAI」として統合する方針を発表しています。

背景には、SpaceXのIPO（株式公開）を控えた事業再編があります。AI部門をSpaceXに組み込むことで、ロケット・衛星・AIをひとつの上場体としてまとめ、評価額を最大化する狙いと見られます。

よくある質問（FAQ）

Q1. Grok V9-Mediumはいつから使える？

2026年6月中旬の一般公開を予定しています。ただし市場予測サイトでは「6月30日までに公開される確率」を約33%と見ており、学習後の調整に時間がかかれば7月以降にずれ込む可能性もあります。

Q2. 日本語でも使える？

はい、現行のGrokシリーズも日本語に対応しています。V9-MediumはCursorデータで学習しているためコーディング能力の向上が中心ですが、日本語での会話や文章生成もこれまで通り利用可能になると見られます。

Q3. ChatGPTやClaudeから乗り換える価値はある？

用途によります。SWE-benchのスコアではClaudeが先行しており、ライティングや一般会話でもChatGPT・Claudeが安定しています。一方でV9-Mediumは「リアルな開発作業の流れ」を学んでいるため、デバッグや既存コードの修正タスクで強みが出る可能性があります。複数AIを併用するスタイルが当面は無難です。

Q4. 法人で導入するには？

API経由で利用するのが一般的です。xAIはGrok APIを提供しており、月額の使った分だけ課金される従量制で導入できます。Grok 4のAPI価格は他社と同水準で、V9-Mediumも同様の体系になる見込みです。社内で使う場合は、Cursor学習データに含まれる可能性のあるコードの取り扱いに関する規約確認も推奨されます。