ACE-Step 1.5とは?無料で使えるAI作曲の実力

伊東雄歩
監修者 伊東 雄歩

株式会社ウォーカー CEO。東北大学卒。MENSA会員、JDLA認定講師、健全AI教育協会理事。生成AI×教育・学習科学を専門とし、2億円超のシステム開発プロジェクトを統括。

taolis.net X note Voicy YouTube

「AIで音楽を作れる時代」がさらに進化しました。2026年2月、ACE-Step 1.5というオープンソースの音楽生成AIが公開され、大きな話題になっています。なんと無料で使えて、自分のパソコンで動かせるのに、有料サービスに負けない品質の曲が作れるんです。

この記事でわかること

  • ACE-Step 1.5がどんなAIなのか
  • 有料サービスSunoとの性能比較
  • 必要なパソコンのスペックと始め方
  • LoRA機能で自分だけの音楽スタイルを作る方法
  • クリエイターや音楽業界への影響

ACE-Step 1.5とは?2秒で1曲作れるAI

ACE-Step 1.5は、テキストや歌詞を入力するだけで、ボーカル付きの曲を自動生成してくれるAIです。中国の2つの企業、TIMEDOMAIN(北京時域じいき科技)とStepFun(階躍かいやく星辰)が共同で開発しました。

最大の特徴は、そのスピードです。高性能GPU(A100)ならたった2秒で1曲まるごと生成できます。一般的なゲーミングPC(RTX 3090)でも10秒以内で完成します。

しかもMITライセンスで公開されているので、個人でも企業でも無料で商用利用OK。これまで月額料金を払って使っていた音楽生成サービスの代わりになる可能性があります。

仕組みを解説!LMとDiTの2段階構成

ACE-Step 1.5は、2つのAIが役割分担して曲を作ります。

まずLM(言語げんごモデル)が「作曲プランナー」として働きます。たとえば「明るいポップスを作って」というざっくりした指示を受けると、曲の構成・テンポ・歌詞の配置などを具体的な設計図に変換します。

次にDiT(拡散かくさんトランスフォーマー)が「音の職人」として、その設計図をもとに実際の音声を生成します。楽器の音色や歌声のニュアンスなど、音の細部を担当します。

つまり、LMが「どんな曲にするか」を考えて、DiTが「実際の音にする」という分業体制です。この仕組みのおかげで、高速かつ高品質な音楽生成が実現しています。

Sunoと比較!有料サービスを超えた?

AI音楽生成で最も有名なサービスといえばSunoです。月額10ドル(約1,500円)のProプランで約500曲を生成できます。では、無料のACE-Step 1.5はSunoに勝てるのでしょうか?

音楽AIの品質を測る指標「SongEval」のベンチマークでは、驚きの結果が出ています。

  • 音質スコア(PQ):ACE-Step 1.5が8.35、Suno v4.5が7.85
  • 総合スコア(CU):ACE-Step 1.5が8.09、Suno v4.5が7.63
  • 一貫性スコア:ACE-Step 1.5が4.72、Suno v4.5が4.64

数値上はACE-Step 1.5がSuno v4.5を上回っています。ただし、最新のSuno v5には歌詞やスタイルの忠実度ちゅうじつどで一部負ける部分もあります。とはいえ、無料でこの品質は驚異きょうい的です。

必要スペックは?4GBのGPUでOK

ACE-Step 1.5を動かすのに、高額なパソコンは必要ありません。

  • 最低VRAM:4GB未満(エントリークラスのGPUでOK)
  • 推奨GPU:NVIDIA RTX 3060以上
  • 生成時間の目安:RTX 3090で約10秒、A100で約2秒
  • 曲の長さ:10秒〜600秒(10分)まで対応

たとえば、10万円台のゲーミングPCでも十分に動作します。Gradio UIという使いやすい画面が用意されているので、コマンド操作が苦手な人でもブラウザから直感的に操作できます。

始め方はかんたんです。GitHubからコードをダウンロードして、Python環境でセットアップするだけ。公式の日本語チュートリアルも用意されています。

LoRA機能で自分だけの音楽スタイルを学習

LoRA(Low-Rank Adaptation)とは、AIに自分好みのスタイルを覚えさせる技術です。ACE-Step 1.5は、このLoRA機能を標準搭載しています。

たとえば、自分が作った曲を数曲〜数十曲読み込ませるだけで、そのスタイルを学習したカスタムモデルが作れます。「自分っぽい曲をAIに量産してもらう」ということが可能になるわけです。

トレーニングもかんたんで、Gradio UIの「LoRA Training」タブからワンクリックで開始できます。RTX 3090なら約1時間で学習が完了します。

アーティストやYouTuberにとって、自分の世界観を保ちながらBGMや楽曲を量産できるのは大きなメリットです。

音楽業界への影響は?Sunoの立場が変わる

ACE-Step 1.5の登場は、AI音楽生成の勢力図を大きく変える可能性があります。

これまでSunoやUdioなどの有料サービスが市場をリードしてきました。しかし、無料で同等以上の品質が出せるオープンソースモデルが登場したことで、「わざわざお金を払う理由」が問われる時代になりました。

一方で、Sunoには使いやすいインターフェースや、パソコン不要のクラウド実行といった強みがあります。技術に詳しくない人には、引き続きSunoのようなサービスが選ばれるでしょう。

日本では、YouTubeやTikTokの動画制作どうがせいさくでBGMを自作する需要が高まっています。ACE-Step 1.5は、コストをかけずにオリジナル曲を作りたいクリエイターにとって、強力な選択肢になりそうです。

まとめ

  • ACE-Step 1.5は無料・オープンソースの音楽生成AI
  • LMとDiTの2段階構成で、2秒で1曲生成可能
  • SongEvalベンチマークでSuno v4.5を上回るスコアを記録
  • VRAMは4GB未満で動作し、一般的なPCで使える
  • LoRA機能で自分だけの音楽スタイルを学習できる
  • MITライセンスで商用利用も無料

参考文献

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です