Grok Skills登場|会話を跨ぐ記憶とClaude対抗CLIの中身

伊東雄歩
監修者 伊東 雄歩

株式会社ウォーカー CEO。東北大学卒。MENSA会員、JDLA認定講師、健全AI教育協会理事。生成AI×教育・学習科学を専門とし、2億円超のシステム開発プロジェクトを統括。

taolis.net X note Voicy YouTube
  • xAIが2026年5月18日、Grokに「Skills(スキル)」を正式導入。一度教えれば全会話で使える永続記憶を実装
  • 5月14日にはコーディング特化CLI「Grok Build 0.1」を早期アクセス公開。Claude CodeとCodex CLIに真正面から挑む
  • Grok Buildは最大8つの並列エージェントが同時動作。Arena Modeで複数案を自動採点する独自機構
  • SWE-bench Verifiedのスコアは70.8%で、Claude Code(87.6%)・Codex CLI(88.7%)にはまだ届かず
  • 日本でも利用可能。SuperGrok月額約4,500円、Heavyは約45,000円。X(旧Twitter)アカウントは不要

「ChatGPTには毎回同じ書式を教え直している」「Claude Codeはすごいけど、xAIにも対抗馬はないの?」——そう感じている人に朗報です。2026年5月、xAIが立て続けに2つの大型機能を投入しました。会話を跨いで記憶する「Grok Skills」と、コーディング専用CLI「Grok Build 0.1」。本記事ではこの2つの中身と、Claude Code・Codex CLIとの違い、日本での使い方までまとめます。

Grok Skillsとは?「一度教えれば全会話で覚えている」記憶機能

Grok Skillsは2026年5月18日に正式リリースされた、ワークフローを永続的に記憶する仕組みです。

自然言語の指示やファイルアップロードでスキルを定義すると、その内容がアカウントに紐づいて保存されます。

つまり、新しいチャットを開いても「いつもの書式」「いつものトーン」が最初から適用されている状態になります。

標準スキルと自作スキルの関係

すべてのGrokアカウントには、xAIが用意したビルトインのスキルがプリセットされています。設定は不要で、最初から動きます。

自分用にカスタマイズしたい場合は、同名のスキルを上書きするだけ。ユーザー定義のものが常に優先される設計です。

「会社のロゴ入りピッチ資料の型」「決算月の予算表テンプレ」など、繰り返し使う作業をスキル化しておけば、毎回プロンプトに貼り付ける手間が消えます。

何ができる?請求書・ピッチ資料・予算表が一発で完成

Grok Skillsの真価は、ビジネス文書の自動生成にあります。

具体的には、Word・PowerPoint・Excel・PDFをそのまま納品できる品質で吐き出せるのが特長です。

想定されるユースケース

たとえば、こんなシーンで効きます。

  • 請求書の自動発行:取引先名と金額を伝えるだけで、自社書式の請求書PDFが完成
  • ピッチデック作成:構想を箇条書きで投げると、PowerPoint形式の10枚スライドが返ってくる
  • 予算スプレッドシート:項目と概算を伝えると、計算式入りのExcelが届く
  • 既存ファイルの再構成:古いWord文書をアップして「2026年版に更新して」と指示するだけで修正版が生成

これまで「AIが出した内容をWord/PowerPointに手作業で貼り直す」工程に時間を取られていた人ほど、効果を実感しやすい設計です。

外部サービスとの連携も同時進化

xAIは5月22日に4つのプラットフォームコネクタも追加発表しました。Vercel・Canva・Gamma・S&P Globalの4社です。

Skillsで作った成果物をそのままCanvaで装飾したり、S&P Globalの金融データを参照しながらレポートを作る、といった連携が現実的になります。

新登場「Grok Build 0.1」|並列8エージェントのコーディングCLI

もう一つの目玉が、5月14日に早期アクセス開始されたGrok Build 0.1です。

これはAnthropicのClaude Code、OpenAIのCodex CLIと真正面からぶつかるエージェント型コーディングツールです。

技術スペックの要点

主な仕様は次の通りです。

  • コンテキスト長:256,000トークン(ベンダー発表では最大2Mトークン構成も)
  • 並列エージェント数:最大8。複数のタスクを同時並行で処理
  • Plan Mode標準装備:実装前に計画を立て、ユーザー確認を経てから手を動かす
  • ACP(Agent Coordination Protocol)対応:複数エージェント間の通信規格を実装
  • 入力:テキスト+画像 / 出力:テキスト

Arena Mode──複数案を自動採点する独自機構

Grok Build最大の独自性は「Arena Mode」でしょう。

複数のエージェントに同じ課題を解かせ、その出力を自動でスコアリング・ランキングしてから開発者に提示する仕組みです。

人間が「AとBどっちがいい?」と全部見比べる手間を、AI自身が肩代わりするイメージです。並列8エージェントの本領が発揮されるのは、まさにこのモードといえます。

API料金は破格水準

API料金は入力100万トークンあたり0.20ドル、出力100万トークンあたり1.50ドル。Claude OpusやGPT-5系と比べると、桁が一つ違う安さです。

SuperGrokおよびX Premium加入者は、OpenCode経由で追加API課金なしで利用できます。

Claude Code・Codex CLIとの比較|何が違う?

気になるのは「結局どれが強いの?」という点です。SWE-bench Verifiedという業界標準ベンチで比較してみます。

SWE-benchスコア比較

  • Codex CLI(OpenAI):88.7%
  • Claude Code(Anthropic):87.6%
  • Grok Build 0.1(xAI内部測定):70.8%

純粋なベンチマーク性能では、Grok BuildはまだClaude CodeとCodex CLIに15ポイント以上の差をつけられています。

ただし、xAIは6月までに6兆パラメータ・1.5MトークンコンテキストのGrok 5を投入予定。これがGrok Buildに搭載されると、ベンチ差は大きく縮まると見られています。

特徴の住み分け

スコア以外の特徴で整理すると、こうなります。

  • Claude Code:成熟度と安定性が随一。MCP連携で社内ツールに繋ぎやすい
  • Codex CLI:ベンチ最強。OpenAIエコシステムとの統合が魅力
  • Grok Build:並列エージェントとArena Modeで「多案出しと自動評価」を回せる。価格も安い

「とにかく品質重視」ならClaude CodeかCodex、「複数案を競わせて選びたい」「コストを抑えたい」ならGrok Buildという棲み分けが見えてきます。

日本で使うには?料金プランと登録手順

結論から言うと、Grokは日本からも問題なく使えます。X(旧Twitter)のアカウントは必須ではありません。

料金プランの整理

2026年5月時点での主要プランは以下の通りです。

  • 無料プラン:基本的なGrok対話が利用可能(回数制限あり)
  • SuperGrok:月額30ドル(約4,500円)。Grok 4へのフルアクセス+新機能の早期公開
  • SuperGrok Heavy:月額300ドル(約45,000円)。Grok 4 Heavyと16エージェントによる議論機能
  • Grok Build用:SuperGrok Heavy相当が必要。ただしSuperHeavy新設プランで最初の6カ月は月99ドルに割引

登録方法

grok.com にアクセスし、メールアドレス・Googleアカウント・Appleアカウントのいずれかでサインアップすればすぐ使えます。

支払いはクレジットカード。決済通貨はドルですが、日本のカード会社が円で請求してくれます。

よくある質問(FAQ)

Q1. Grok Skillsは無料プランでも使えますか?

標準のビルトインスキルは無料プランからも順次提供される予定ですが、カスタムスキルの作成や本格的な業務ドキュメント生成は、SuperGrok以上の有料プランが前提となります。

Q2. Grok Buildは個人の趣味開発でも契約する価値がありますか?

月99ドル(約14,800円)の割引プランでも、個人利用としてはやや重い金額です。まずは無料のClaude Code(一部無料枠あり)やCodex CLIの無料試用で要件を確かめ、並列実行や多案比較が本当に必要かを見極めるのがおすすめです。

Q3. 既存のClaude Code資産をGrok Buildに移行できますか?

Grok BuildはACP(Agent Coordination Protocol)に対応しており、共通規格でのプロンプト・ツール定義の流用は理論上可能です。ただしMCP(Claude側のプロトコル)固有の機能はそのまま動かないため、段階的な書き換えが必要になります。

Q4. 日本語のドキュメント生成精度はどうですか?

Grokは日本語に対応していますが、Word/PowerPointのレイアウト崩れや、敬語の不自然さは現時点で報告されています。納品前の人手レビューは必須と考えるべきです。

まとめ

xAIの2026年5月リリースを振り返ると、次の3点が要点です。

  • Grok SkillsでChatGPT・Claude同様の永続記憶機能が実装され、業務テンプレの自動生成が現実的に
  • Grok Build 0.1はベンチではまだ追走中だが、並列8エージェント+Arena Mode+低価格APIで独自路線
  • 日本からも問題なく契約可能。個人はSuperGrok(月4,500円)から、本格コーディングはSuperHeavy(月14,800円)から試せる

まずは無料プランで使い心地を確かめ、業務での反復作業が多い人ほどSkillsの恩恵を受けやすい——というのが現時点での評価です。Grok 5の登場でベンチ差がどう縮まるかも、今後の見どころになります。

参考文献

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です