본문 바로가기
AI · 인공지능/AI 뉴스

무료 음악 생성 AI 「Stable Audio Open」 공개

by 두우우부 2024. 6. 7.
반응형



이미지 생성 AI "Stable Diffusion"의 개발로 알려진 Stability AI가 오픈 소스 음악 생성 AI  「Stable Audio Open」 을 공개했습니다. Stable Audio Open은 문장 지시만으로 최대 47초의 음악을 생성할 수 있습니다.

Stable Audio Open — Stability AI
https://stability.ai/news/introducing-stable-audio-open

Stable Audio Open — Stability AI

Stable Audio Open is an open source model optimised for generating short audio samples, sound effects and production elements using text prompts.

stability.ai


Stable Audio Open은 텍스트로 음악을 생성할 수 있는 AI로, "Rock beat played in a treated studio, session drumming on an acoustic kit(스튜디오에서 수록된 록 비트, 어쿠스틱 키트에서의 세션 드럼)" 처럼, 텍스트 지시로 음악을 생성할 수 있습니다. 생성할 수 있는 음악은 최장 47초로, 짧은 오디오 샘플이나 사운드 이펙트 등의 용도를 상정하고 있다고 합니다. Stable Audio Open에서 생성한 음악의 예는 다음 링크에서 확인할 수 있습니다.



Stability AI는 2024년 4월 상용 음악 생성 AI 'Stable Audio 2.0'을 출시하고 있습니다. Stability AI는 Stable Audio Open과 Stable Audio 2.0의 차이에 대해, "Stable Audio 2.0에서는 최장 3분의 음악을 생성 가능하고, 음악의 보간 기능이나 멀티 파트 음악 생성 등 고도의 기능도 갖추고 있습니다. Stable Audio Open은 악곡 전체의 생성에는 최적화되어 있지 않고, 오디오 샘플이나 사운드 이펙트, 프로덕션 용도에 적합하다."라고 설명하고 있습니다.

텍스트로 지정한 음악을 자동 생성하는 AI 「Stable Audio」가 등장

Stability AI가 음악 생성 AI "Stable Audio"를 발표했습니다. Stable Audio를 사용하면 문장 지시만으로 음악을 생성할 수 있습니다. 다만, 접속 폭주로 인해 음악 생성이 실패하는 경우가 다수 발생하고 있

doooob.tistory.com


또한 Stable Audio Open은 저작권 문제를 피하기 위해 8967건의 CC-BY 콘텐츠와 4907건의 CC0 콘텐츠를 사용하여 학습하고 있다는 것.

Stable Audio Open 모델 데이터는 공개되어 있습니다.

stabilityai/stable-audio-open-1.0 · Hugging Face
https://huggingface.co/stabilityai/stable-audio-open-1.0

stabilityai/stable-audio-open-1.0 · Hugging Face

Stable Audio Open 1.0 Please note: For commercial use, please refer to https://stability.ai/membership Model Description Stable Audio Open 1.0 generates variable-length (up to 47s) stereo audio at 44.1kHz from text prompts. It comprises three components: a

huggingface.co

반응형