画像生成AI「Stable Diffusion」で知られる英Stability AIは4月3日(現地時間)、テキストで作曲できる生成AI「Stable Audio 2.0」を発表した。Stable AudioのWebサイトにログインすることで無料で利用できる他、間もなくStable Audio APIでも利用できるようになる見込みだ。

【その他の画像】

 Stable Audioは、同社が昨年9月に発表した音楽生成AI。リリース当初の無料版では44.1kHzで最長45秒のトラックしか生成できなかったが、バージョンアップで最長3分のフルトラックの音楽を生成できるようになった。

 テキストからだけでなく、音声からも作曲できる。オーディオサンプルをアップロードし、自然言語のプロンプトでサンプルをアレンジできる。

 無料では、3分の音楽を20曲まで作れる。作った音楽を入力オーディオとして利用することもできる。

 旧版同様に、モデルのトレーニングにはストック音楽サービスAudioSparxのデータを使った。AudioSparxに楽曲を登録しているアーティストは、Stable Audioのトレーニングをオプトアウトするオプションが提供されるようになった。

 また、クリエイターの著作権保護のために、生成した音楽のアップロードについてはAudible Magicとの提携で、同社のコンテンツ認識(ACR)技術採用のコンテンツマッチングを強化し、著作権侵害を防止している。

 Stability AIは同日、Stable Audioで生成されたトラックのライブストリーミングを公式YouTubeチャンネルで開始した。

Stable Audio 2.0のWebアプリ版