메타(Meta)에서 텍스트 설명을 바탕으로 음악을 만들어내는 인공지능(AI) 음악 생성 도구인 뮤직젠(MusicGen)의 코드를 공개했습니다. 온라인에서 데모 버전을 체험해 볼 수 있으며, 웹 브라우저만 있으면 누구나 이용 가능합니다. 뮤직젠이 만들어내는 결과물은 상당히 인상적이며, AI 음악 모델 기술이 얼마나 발전했는지 보여줍니다.
이제 뮤직젠과 음악 생성 방식에 대해 자세히 알아보겠습니다.
뮤직젠이란 무엇인가?
2023년 6월, 메타는 뮤직젠이라는 AI 음악 생성 모델을 발표했습니다. 텍스트 설명을 기반으로 음악을 합성하는 기술은 이전에도 있었지만, 메타는 이 모델의 코드를 오픈 소스로 공개한 첫 번째 기업입니다. 이전에는 OpenAI의 Jukebox나 MusicLM을 통해 음악을 만들거나 짧은 음악 클립을 생성할 수 있었습니다.
뮤직젠의 오픈 소스 공개 덕분에, 16GB 이상의 GPU를 가진 사용자는 자신의 컴퓨터에서 프로그램을 실행할 수 있으며, 11GB로도 구동이 가능합니다. 또한, 웹 브라우저를 통해 뮤직젠 웹 앱을 무료로 이용할 수 있으므로, 고성능 하드웨어가 없어도 누구든 쉽게 체험해 볼 수 있습니다. 온라인 데모에서는 약 12초 길이의 음악 스니펫을 생성하는 데 1분 이상이 걸릴 수 있다는 점을 감안해야 합니다.
뮤직젠의 음질은 어떤 수준인가?
메타에 따르면, 뮤직젠은 고품질의 음악 샘플을 생성할 수 있다고 합니다. 여기서 ‘고품질’은 연구진이 32kHz로 정의한 수준입니다. 이는 음성 합성(16kHz)과 디지털 음악 표준(44.1kHz) 사이의 중간 지점이라고 할 수 있습니다. 실제 음질은 라디오나 스트리밍 플랫폼에서 듣는 것과 같은 최고 수준에는 미치지 못합니다. 그러나 다른 AI 음악 생성 기술과 비교했을 때, 그리고 현재 기술 수준을 고려했을 때, 노이즈가 적고 음질이 상당히 우수합니다.
그렇다면 생성된 음악이 프롬프트와 얼마나 일치할까요? 아래에 제시된 예시를 통해 직접 확인할 수 있습니다. 전반적으로, 기존의 대중음악 장르를 따르면서, 이전 모델에 비해 더 일관된 음악 구조를 보여줍니다.
뮤직젠으로 음악을 생성하는 방법
뮤직젠은 사용법이 간단하고 별도의 회원 가입도 필요하지 않습니다. 인터페이스 또한 단순해서 누구나 쉽게 즐길 수 있습니다.
뮤직젠을 사용하여 음악을 생성하는 방법은 다음과 같습니다.
- 뮤직젠 웹 앱을 엽니다.
- ‘음악 설명’이라는 텍스트 상자에 원하는 프롬프트를 입력합니다. 예를 들어 “아일랜드 포크 선율”과 같이 간단하게 입력하거나, 악기, 템포, 장르, 분위기 등을 구체적으로 묘사할 수도 있습니다.
- ‘생성’ 버튼을 눌러 프로세스를 시작합니다. 1~2분 정도 지나면 우측의 ‘Generated Music’ 모듈에 오디오 플레이어가 나타납니다.
- 오디오 플레이어 컨트롤을 사용해 음악을 듣거나, 우측 상단에 있는 다운로드 아이콘을 클릭하여 컴퓨터에 저장할 수 있습니다. 파일은 .mp4 형식으로만 다운로드할 수 있습니다.
- 기존 멜로디를 활용하고 싶다면 텍스트 상자 옆의 모듈에서 파일을 업로드하거나, 마이크를 선택하여 멜로디를 녹음할 수 있습니다.
멜로디 조건 설정은 텍스트 설명과 함께 제공된 멜로디를 함께 활용합니다. 이를 통해 뮤직젠에서 얻는 결과물을 더욱 정교하게 제어할 수 있습니다.
뮤직젠 오디오 사용에 대한 제한 사항은 무엇인가?
뮤직젠의 코드는 MIT 라이선스에 따라 거의 제한 없이 자유롭게 배포됩니다. 하지만 모델을 사용하여 생성된 오디오에 대해서는 아직 법적인 지침이 명확하지 않으므로 주의가 필요합니다. 메타에서 제시한 뮤직젠 사용 관련 경고를 참고하는 것이 좋습니다.
메타는 다음과 같이 경고합니다. “모델을 사용하여 사람들에게 적대적이거나 불쾌한 환경을 조성하는 음악을 의도적으로 생성하거나 배포해서는 안 됩니다. 불안감이나 고통을 유발하거나 공격적이라고 여겨질 수 있는 음악, 또는 역사적 또는 현재의 고정관념을 조장하는 콘텐츠도 포함됩니다.”
메타는 뮤직젠이 AI 음악 생성을 연구하는 사람들을 위한 도구이며, 스트리밍 플랫폼에 AI 음악을 업로드하는 것과 같은 ‘다운스트림 사용’을 위한 것이 아니라고 명확히 밝혔습니다.
AI 아트 생성에는 언제나 윤리적 문제가 따릅니다. AI 모델 훈련에 사용되는 데이터에 대한 동의를 얻어야 하고, 아티스트에게 적절한 보상이나 크레딧을 제공해야 합니다. 이러한 이유로 메타는 신중하게 접근하고 있습니다.
결론적으로, 재미를 위해 뮤직젠 모델을 탐색하는 것은 문제가 없지만, 상업적인 목적으로 오디오를 사용하는 경우에는 더 복잡한 문제가 발생할 수 있습니다. 많은 사람들이 AI 기술과 팝 음악이 결합될 미래의 모습에 대해 궁금해하고 있습니다.
메타는 간단한 텍스트 설명으로 음악을 생성할 수 있는 오픈 소스 AI 모델인 뮤직젠을 출시했습니다. 이 기술이 궁금하다면 웹 브라우저를 통해 데모를 체험해 볼 수 있습니다.