- 2026年4月2日、無料で使えるAI音楽生成モデル「ACE-Step 1.5 XL」がオープンソースで公開
- 自分のPCだけで日本語ボーカル付きの楽曲をまるごと生成できる
- ベンチマークで有料サービスSuno v5を全指標で上回る結果
- RTX 3090なら1曲わずか10秒以下、A100なら2秒以下で生成
- MITライセンスで商用利用OK——YouTuberやクリエイターに朗報
「AIで音楽を作ってみたいけど、毎月のサブスク料金が気になる……」「日本語の歌を作りたいのに、海外サービスだと発音がおかしい……」——そんな悩みを持つ人に、ついに決定打が登場しました。完全無料・ローカル実行・日本語ボーカル対応の音楽生成AI「ACE-Step 1.5 XL」。その実力と使い方を、初心者にもわかりやすく解説します。
ACE-Step 1.5 XLとは?——自分のPCで動く音楽生成AI
ACE-Step 1.5 XLは、2026年4月2日にオープンソースとして公開されたAI音楽生成モデルです。テキストで指示を出すだけで、ボーカル付きの楽曲をまるごと作ってくれます。
たとえるなら、「超優秀な作曲家の友だちが、あなたのPCの中に住んでいる」ようなもの。「明るいポップスで、サビは盛り上げて」と伝えるだけで、歌詞・メロディ・伴奏がそろった曲を数秒で仕上げてくれるのです。
最大の特徴はローカル実行——つまりインターネットに接続しなくても、自分のパソコンだけで動くこと。SunoやUdioのようなクラウドサービスと違い、月額料金もクレジット制限も一切ありません。何曲作っても完全に無料です。
モデルのパラメータ数は40億(4B)。これは、1000種類以上の楽器と50以上の言語に対応できる規模です。もちろん日本語の歌詞にも対応しており、日本語ボーカル付きの楽曲を生成できます。ライセンスはMIT(商用利用OK)なので、作った曲をYouTubeやSNSに使うのも自由です。
Suno v5を超えた?——ベンチマーク結果の衝撃
「無料のオープンソースが有料サービスに勝てるの?」と思うかもしれません。実は、ベンチマークテストではSuno v5を全指標で上回っているのです。
ACE-Step 1.5 XLのSongEvalスコアは8.09。これは音楽生成AIの総合的な品質を測る指標で、Suno v5のスコアを超えています。さらに、歌詞の再現度を測るLyric Alignmentでは8.35という高スコアを記録しました。
想像してみてください。無料の回転寿司が、高級寿司店の味を超えてしまったようなもの。しかも食べ放題。これが今、AI音楽の世界で起きていることです。
ただし注意点もあります。ベンチマークはあくまで「数値上の評価」です。実際に聴いたときの感動や、ボーカルの自然さでは、Sunoの方が洗練されていると感じる場面もあります。とはいえ、無料モデルがここまで追いついたこと自体が衝撃的と言えるでしょう。
日本語ボーカルにも対応——歌詞を入れるだけで作曲
ACE-Step 1.5 XLが日本のユーザーにとって特にうれしいのは、日本語ボーカルに対応している点です。
使い方はとてもシンプル。プロンプト(指示文)に曲のスタイルを書き、歌詞を入力するだけ。たとえば「明るいJ-POP、テンポ120BPM」と指定して、日本語の歌詞を入れれば、日本語で歌ってくれる楽曲が生成されます。
対応言語は50以上。英語、中国語、韓国語はもちろん、フランス語やスペイン語でも曲を作れます。まるで世界中の歌手を1人のAIに詰め込んだようなものです。
さらに、LoRA(軽量ファインチューニング)にも対応。自分の好きなアーティストの曲を数曲学習させるだけで、その雰囲気に近い楽曲を生成できるようになります。ちなみにLoRAとは、「AIに少しだけ追加のクセを覚えさせる技術」のこと。大掛かりな再学習なしで、自分好みにカスタマイズできるのが魅力です。
必要なスペックと3つのモデル——どれを選ぶ?
「自分のPCで動くの?」という疑問に答えましょう。ACE-Step 1.5 XLの動作に必要なスペックは以下の通りです。
- 最低VRAM:12GB(オフロード+量子化を使った場合)
- 推奨VRAM:20GB以上(オフロードなしでフル性能を発揮)
- 対応GPU:NVIDIA(CUDA)、AMD、Intel、Apple Silicon(Mac)
VRAMとは、「GPUが作業に使えるメモリ」のこと。ゲーミングPCを持っている人なら、RTX 3060(12GB)以上であれば動かせます。Macユーザーも、M1以降のApple Siliconに対応しているので安心です。
ダウンロードできるモデルは3種類あります。
- base(ベース):基本モデル。ファインチューニングのベースに最適
- sft(ファインチューン済み):そのまま使える高品質モデル。迷ったらこれ
- turbo(高速版):わずか8ステップで生成完了。スピード重視の人向け
turboモデルなら、RTX 3090で1曲10秒以下、A100ならわずか2秒以下で生成できます。コーヒーを淹れる間に10曲以上作れる計算です。
ライバル比較——Suno・Udio・ACE-Stepの違い
AI音楽生成サービスは今、群雄割拠の時代です。主要なサービスを比べてみましょう。
ACE-Step 1.5 XL——無料・ローカル・無制限
完全無料でローカル実行。MITライセンスで商用利用可。日本語ボーカル対応。生成枚数の制限なし。ただし、VRAM 12GB以上のGPUが必要で、セットアップにはPython環境の構築が必要です。技術に慣れた人向け。
Suno——業界最大手のクラウドサービス
無料プランあり(1日50クレジット)。Pro Plan(月額約10ドル)で月2,500クレジット、Premier Plan(月額約30ドル)で月10,000クレジット。ブラウザから使えて手軽。v4.5では8分の長尺曲にも対応し、ボーカルのリアルさに定評があります。2026年時点で「一強」と言われるほどの人気です。
Udio——高音質で映画的なサウンドが得意
無料プランあり(月100クレジット)。Standard(月額約10ドル)、Pro(月額約30ドル)。音質の高さと自然なボーカルが特徴で、映画のサウンドトラックのような重厚な楽曲が得意です。
ポイントは、ACE-Stepが「自分のPCで無制限に使える」という点でまったく違うカテゴリにいることです。月額料金を払い続けるのが嫌な人、大量に曲を生成したい人、データをクラウドに送りたくない人にとって、ACE-Stepは唯一の選択肢と言えます。
日本のクリエイターへの影響——YouTuberから企業まで
ACE-Step 1.5 XLの登場は、日本のクリエイターにとって大きなインパクトがあります。具体的なシーンを考えてみましょう。
たとえば、YouTuberのCさん。毎月20本の動画を投稿していますが、BGMの著作権問題にいつも悩まされています。フリー素材サイトの曲は他のチャンネルと被るし、有料サービスは月額が積み重なる。ACE-Step 1.5 XLなら、動画ごとにオリジナルBGMを無料で量産できます。しかも商用利用OK。
また、個人ゲーム開発者のDさん。インディーゲームのBGMを外注すると1曲数万円かかりますが、ACE-Step 1.5 XLを使えばプロトタイプ段階のBGMを自分で生成できます。「とりあえずこんな雰囲気で」というラフ案を数秒で作り、最終版だけプロに依頼する——そんなワークフローが可能になります。
企業のマーケティング担当Eさんも恩恵を受けます。SNS広告やプレゼン動画のBGMを、社外にデータを送ることなく社内PCで生成できるのは、情報管理の観点からも安心です。
一方で、注意点もあります。ACE-Step 1.5 XLの学習データには著作権の扱いが明確でない部分もあり、生成された楽曲が既存の曲に似てしまうリスクはゼロではありません。商用利用する場合は、念のため生成された曲を確認してから使うことをおすすめします。
よくある質問(FAQ)
Q. GPUを持っていないPCでも使えますか?
A. CPU単体での実行は現時点では非常に遅く、実用的ではありません。VRAM 12GB以上のGPUが推奨されます。Macの場合はM1以降のApple Siliconに対応しています。GPU搭載PCがない場合は、Google Colabなどのクラウド環境を利用する方法もあります。
Q. 生成した曲をYouTubeや商用に使っても問題ありませんか?
A. MITライセンスなので、商用利用を含めて自由に使えます。ただし、AIが生成した楽曲の著作権に関する法律は国によって異なり、日本でもまだ議論が続いています。現時点では問題ないとされていますが、今後の法整備には注意が必要です。
Q. Suno v5とACE-Step 1.5 XL、初心者にはどちらがおすすめですか?
A. 初心者にはSunoがおすすめです。ブラウザからすぐに使えて、セットアップが不要だからです。一方、PCのスペックに自信があり、月額料金を払いたくない人にはACE-Step 1.5 XLが向いています。まずSunoの無料枠で試してみて、物足りなくなったらACE-Stepに挑戦するのが良いでしょう。
Q. 日本語の歌詞はどのくらい自然に歌ってくれますか?
A. 完璧とは言えませんが、十分に聴き取れるレベルです。英語に比べると日本語の発音精度はやや劣りますが、BGMとして使う分には問題ありません。より自然な日本語ボーカルが必要な場合は、LoRAで日本語楽曲を追加学習させると改善されます。
Q. ACE-Step 1.5とACE-Step 1.5 XLの違いは何ですか?
A. XLは2026年4月に公開された上位モデルで、パラメータ数が4Bに増加。音質、プロンプトへの忠実度、音楽性のすべてが向上しています。無印の1.5は2026年2月公開で、よりコンパクトなモデルです。スペックに余裕があればXLを選びましょう。
まとめ
- ACE-Step 1.5 XLは完全無料・ローカル実行の音楽生成AI:月額料金なし、生成回数の制限なし
- ベンチマークでSuno v5を上回る品質:SongEvalスコア8.09を記録
- 日本語ボーカルにも対応:50以上の言語で歌詞付き楽曲を生成
- VRAM 12GB以上のGPUがあれば動作:RTX 3060以上、またはMac M1以降
- MITライセンスで商用利用OK:YouTube、SNS、ゲームなどに自由に使える
- Suno・Udioとは棲み分け:手軽さならSuno、無制限・無料ならACE-Step
まずは公式GitHubリポジトリをチェックして、自分のPCのスペックで動くか確認してみましょう。GPU搭載PCを持っているなら、今日からでもAI作曲を始められます。「AI音楽って面白そうだけど、毎月お金を払うのは……」と思っていた人にとって、ACE-Step 1.5 XLは最高の入り口になるはずです。
参考文献
- ローカルで実行できる音楽生成AI「ACE-Step 1.5 XL」が登場、日本語ボーカル付き楽曲も生成可能 — GIGAZINE
- ACE-Step 1.5 公式GitHubリポジトリ
- Suno v5以上の品質、商用利用できる日本語対応ローカル音楽生成AI「ACE-Step 1.5 XL」が無料公開 — テクノエッジ
- ACE-Step 1.5: Pushing the Boundaries of Open-Source Music Generation — 公式サイト
- The BEST Local AI Music Generator Is Here: ACE Step 1.5 XL — Canadian Technology Magazine

