- Cursorが2026年5月18日に新コーディングAI「Composer 2.5」を発表
- 第三者評価「Coding Agent Index」で62点を獲得し、Claude Opus 4.7・GPT-5.5に次ぐ世界3位
- 1タスクあたりのコストは0.44ドル、最先端モデルの10〜60分の1で動く
- 合成タスクをComposer 2の25倍に増やし、長時間タスクの完走率が向上
- Cursor Pro(月20ドル)のAutoモードなら専用プールで実質無制限に使える
「Claude OpusやGPT-5.5は便利だけど、1回の作業で数百円かかる。チームで使うと月の請求書が怖い」——そう感じている開発者は多いはずです。2026年5月、Cursorが発表した新モデル「Composer 2.5」は、その悩みを一気に吹き飛ばす答えになりそうです。世界的なAI評価機関が「コストはわずか10分の1、性能は最先端と肩を並べる」と認定しました。
Cursor Composer 2.5とは何か
Cursorが自社開発する“速くて安い”コーディングAI
Cursorは、AI支援機能を組み込んだプログラミング用エディタとして世界中の開発者に使われています。
これまではClaudeやGPT-5.5など、他社の高性能AIを呼び出して動かすのが主流でした。
そこに自社開発の専用モデル「Composer」シリーズを投入し、価格と速度で他社に対抗する方向へ舵を切った形です。
新バージョンのComposer 2.5は2026年5月18日に公開されました。前世代のComposer 2と比べて知能と振る舞いが大幅に向上したと発表されています。
ベースは中国Moonshot AIの「Kimi K2.5」
Composer 2.5の土台になっているのは、中国Moonshot AI社が公開したオープンソースモデル「Kimi K2.5」です。
Cursorはこの基盤に独自の継続事前学習と強化学習を上乗せし、コーディング専用に磨き上げました。
パラメータ数は合計約1兆、推論時に動くのは320億という「MoE(混合エキスパート)」と呼ばれる仕組みで、必要な部分だけが動くため計算コストが抑えられています。
第三者ベンチマークが裏付けた実力
独立評価機関による「Coding Agent Index」で世界3位
新モデルの実力を客観的に示したのが、独立系AI評価機関Artificial Analysisが公開した「Coding Agent Index」です。
このベンチマークは、複数のAIが実際にコードを書き、バグを直し、複雑な機能を実装するタスクを総合評価します。
結果はこうなりました。
- 1位:Claude Opus 4.7(Claude Code、max設定)— 67点
- 2位:GPT-5.5(Codex、xhigh設定)— 65点
- 3位:Composer 2.5(Cursor CLI)— 62点
前世代のComposer 2は48点だったので、わずか数か月で14点も上積みされたことになります。
最も衝撃的なのは「1タスクあたりの単価」
性能と並んで注目されたのが価格です。
同じベンチマークで測った1タスクあたりのコストは、以下のとおりでした。
- Claude Opus 4.7(max):4.10ドル(約630円)
- GPT-5.5(xhigh):4.82ドル(約740円)
- Composer 2.5 Fast:0.44ドル(約68円)
- Composer 2.5 標準:0.07ドル(約11円)
1位と2位のモデルに比べて、Composer 2.5 Fastは約10分の1、標準版にいたっては約60分の1で済む計算です。
なぜ10分の1のコストで動くのか
「全部呼ばずに必要な専門家だけ呼ぶ」MoE設計
Composer 2.5の安さを支える最大の要因は、MoE(Mixture of Experts、混合エキスパート)と呼ばれるモデル構造です。
1兆個のパラメータを丸ごと動かすのではなく、入力ごとに320億分だけを呼び出します。
必要な専門家にだけ仕事を回す社内ヘルプデスクのようなもので、計算量とコストが大幅に削減されます。
合成タスクを25倍に増やしたトレーニング
Cursorは学習データの作り方も見直しました。
前世代では人間の作業ログ中心でしたが、Composer 2.5では合成タスクをComposer 2の25倍に拡張。さまざまな失敗パターンを意図的に体験させ、長時間タスクの完走率を高めたといいます。
さらに「ローカル化されたテキストフィードバック」と呼ばれる手法で、AIが間違えた箇所だけに修正ヒントを差し込み、その瞬間の判断確率を調整しています。失敗をピンポイントで上書きできるイメージです。
主要コーディングAIとの比較
Claude Code・Codex・Antigravity 2.0との関係
2026年5月時点で、コーディングAIには大きく4つの選択肢があります。
- Claude Code(Anthropic):構造設計や大規模リファクタに強い。月額20ドルから
- Codex(OpenAI、GPT-5.5):マルチステップの自動操作が得意。週次アクティブユーザー400万人を突破
- Antigravity 2.0(Google):2026年5月19日公開。複数エージェントの同時実行とGemini 3.5 Flashが武器
- Cursor Composer 2.5:価格対性能で頭ひとつ抜けた存在。エディタ統合が強み
「最高峰の精度」か「コスパ最強」か
使い分けの目安は、求める精度とコスト感です。
大規模なアーキテクチャ設計や長文の仕様書からの実装ならClaude Codeが今も先頭です。
業務要件が複雑で、長いタスクを自律的に走らせたいならCodexが向きます。
普段のコード修正や中規模機能の追加なら、Composer 2.5でほぼ事足りるというのが今回の評価から読み取れる結論です。
日本のエンジニアに何が起きるか
Cursorは日本でも導入が広がっている
Cursorは日本のスタートアップや個人開発者の間でも、ここ1年で急速に普及しました。
料金体系はHobby(無料)/Pro(月20ドル)/Pro+(月60ドル)/Ultra(月200ドル)の4プラン。日本円でも、Proなら毎月3,000円前後で使えます。
Composer 2.5のAutoモードが事実上の「使い放題」
注目すべきは、Composer 2.5にはAuto(自動)モード専用のクレジットプールがあることです。
有料プランのユーザーは、通常のクレジットを使い切ったあともAutoモードでComposer 2.5を呼べます。
つまり実質的に追加コストなしで使い放題に近い形になります。クラウドのAPI課金で毎月数万円飛んでいた個人開発者にとっては、料金感覚が一変する事件です。
中小企業のソフト内製化を後押し
業務システムを内製しようとする中小企業にとっても朗報です。
これまで「AIで開発を効率化したいが、APIコストが読めない」という理由で導入が止まっていた現場でも、Composer 2.5なら月額固定で見通しが立てやすくなります。
2026年5月の中小企業庁系調査では、AI導入率はわずか12%という結果が出ていました。低コストで安定したAIが出てきたいま、この数字を押し上げる起爆剤になるかもしれません。
Composer 2.5が活きる3つの場面
①個人開発者の副業プロジェクト
平日夜と週末だけ動かす副業プロジェクトでは、月々のAPI料金が成果以上に膨らみがちです。
ある副業エンジニアが新しいSaaSの試作品を作る場面を考えてみましょう。Claude Opus 4.7だけで開発を回すと月1万円を超えることもありましたが、Composer 2.5に切り替えれば、同じ作業量でも1,000円程度で収まる計算になります。
②社内ツールを内製したい情シス担当者
中小企業の情シス担当者は、限られた予算で社内ツールを作らなければなりません。
「経費精算の自動化スクリプト」「在庫管理ダッシュボード」など、よくある業務システムなら、Composer 2.5で十分にこなせます。CursorのIDEに統合されているため、Pythonの知識が浅いメンバーでも本人の手元でテストして動かせます。
③スタートアップのMVP開発
立ち上げ初期のスタートアップでは、リリースまでのスピードがすべてです。
3人の創業メンバーがMVPを2週間で作り上げる場面では、Composer 2.5のAutoモードを並列でフル稼働させても、Pro+プラン(月60ドル)の範囲に収まる事例が報告されています。資金調達前でも、最先端のAIで開発を進められるのは大きな安心材料です。
よくある質問(FAQ)
Q1. Composer 2.5は日本語のコメントや指示でも使えますか?
はい。日本語の自然文プロンプトに対応しています。コメント生成やドキュメント執筆も日本語のまま指示できます。
Q2. Composer 2.5を使うにはどのプランが必要ですか?
Cursorの有料プラン(Pro以上)が必要です。AutoモードでComposer 2.5を呼び出す場合は、通常のクレジット消費とは別の専用プールが使われるため、実質的に追加課金なしで利用できます。
Q3. 標準版とFast版はどう使い分ければいいですか?
標準版は単価が圧倒的に安く、簡単な修正向きです。Fast版は約30%速く動き、長いタスクや反復が必要な作業に向いています。Artificial Analysisの計測では、Fastが1タスクあたり6.7分、標準が9.3分でした。
Q4. 既存のClaude CodeやCodexから乗り換えるべきですか?
用途によります。大規模リファクタや高精度が必要な作業ならClaude Code、長期の自律実行を任せたいならCodex、コストと速度のバランスを重視するならComposer 2.5、という選び分けがおすすめです。1つに絞らず併用する開発者も増えています。
Q5. 中国Moonshot AIのモデルがベースですが、データの安全性は大丈夫ですか?
Cursorは、Composer 2.5の推論サーバーを自社のインフラ上で動かしていると公式に説明しています。ユーザーのコードがMoonshot AIに送信される仕組みではありません。とはいえ、企業利用ではプライバシー設定(Privacy Mode)を有効にしておくのが安心です。
まとめ
Cursor Composer 2.5の登場は、コーディングAIの勢力図を確実に塗り替えつつあります。要点を振り返ります。
- 2026年5月18日に公開された自社開発の新モデル
- 第三者評価で世界3位、最先端2モデルとの差はわずか3〜5点
- 1タスクあたりのコストは10〜60分の1
- MoE構造と合成タスク25倍の学習で性能とコストを両立
- Cursor Proユーザーは追加課金なしで使い放題に近い
「コストが高くてAI開発を諦めていた」読者は、いちどCursorの無料プランから試してみる価値があります。これからの開発スタイルは、複数のAIを使い分けて最適なコストで動かす時代に進んでいきます。
参考文献
- Cursor公式ブログ「Introducing Composer 2.5」(2026年5月18日)
- Artificial Analysis「Cursor’s Composer 2.5: third on the Coding Agent Index」
- ITmedia AI+「Cursor、新モデルがコスト1/10で最先端モデル並みの性能」(2026年5月22日)
- DataCamp「Composer 2.5: Benchmarks, Pricing, and How It Compares」
- The New Stack「Cursor bets on cheaper coding with Composer 2.5 and Kimi K2.5」

