音楽生成AI「Stable Audio 3.0」が登場、6分以上の音楽を生成可能な大型モデルとスマホで動作する小型モデルが公開される – GIGAZINE


AI


画像生成AI「Stable Diffusion」の開発元として知られるAI企業のStability AIが音楽生成AI「Stable Audio 3.0」を公開しました。

Stable Audio 3.0 | Generative Audio Models — Stability AI
https://stability.ai/stable-audio

Stable Audio 3.0, the model family built with open-weight models
— Stability AI

https://stability.ai/news-updates/meet-stable-audio-3-the-model-family-built-for-artistic-experimentation-with-open-weight-models

Stable Audio 3.0は「Stable Audio 3.0 Small」「Stable Audio 3.0 Small SFX」「Stable Audio 3.0 Medium」「Stable Audio 3.0 Large」の4種類に分かれてリリースされており、「Stable Audio 3.0 Small」「Stable Audio 3.0 Small SFX」「Stable Audio 3.0 Medium」の3種がオープンモデルとして無料公開されています。各モデルの特徴は以下の通り。

Stable Audio 3.0 Small:最大2分の音楽を生成可能。スマートフォンやノートPCでも動作する小型モデル。ショートトラックの生成に最適。
Stable Audio 3.0 Small SFX:最大2分の音楽を生成可能。スマートフォンやノートPCでも動作する小型モデル。サウンドエフェクトなどの生成に最適。
Stable Audio 3.0 Medium:最大6分20秒の音楽を生成可能。高度な音楽表現が可能
Stable Audio 3.0 Large:最大6分20秒の音楽を生成可能。シリーズの中で最高性能のモデル


Stable Audio 3.0は「既存の楽曲の編集」や「既存の楽曲の続きを生成」といった操作にも対応。LoRAを用いて好みのテイストに調整することもできます。

「Stable Audio 3.0 Small」「Stable Audio 3.0 Small SFX」「Stable Audio 3.0 Medium」は以下のリンク先で配布されています。

stabilityai/stable-audio-3-small-music · Hugging Face
https://huggingface.co/stabilityai/stable-audio-3-small-music

stabilityai/stable-audio-3-small-sfx · Hugging Face
https://huggingface.co/stabilityai/stable-audio-3-small-sfx

stabilityai/stable-audio-3-medium · Hugging Face
https://huggingface.co/stabilityai/stable-audio-3-medium

また、生成AIツールの「ComfyUI」がStable Audio 3.0での音楽生成に即日対応しています。


Stable Audio 3.0 LargeはStability AIのAPIを介して利用可能なほか、企業向けのモデル提供も行われています。

この記事のタイトルとURLをコピーする




ソース元はコチラ

この記事は役に立ちましたか?

もし参考になりましたら、下記のボタンで教えてください。

関連記事