구글 ‘글→음악’ 생성 AI 발표…뭐든 AI가 만드는 세상 오나

김민석 기자
김민석 기자
업데이트 2023-01-30 16:19
입력 2023-01-30 16:09

구글 뮤직LM, 원음 음악 자유자재 생성
생성 AI, 3D프린팅 등 발전·적용 여지 많아
저작권, 윤리 문제 등 기술 발전으로 보완해야

이미지 확대
오픈AI의 이미지 생성 인공지능(AI)인 ‘달리2’에 “텍스트 설명에서 고음질 음악을 생성하는 AI 모델의 사진”이라는 텍스트를 입력해 생성한 이미지. 달리2
원본 이미지입니다.
손가락을 이용하여 이미지를 확대해 보세요.
닫기
최근 오픈AI의 인공지능(AI) 챗봇 챗GPT 등장으로 위기감을 느낀 구글이 문자 설명을 음악으로 만드는 생성 AI인 ‘뮤직LM’을 개발했다. 생성형 AI의 발달이 가속화하며, 설명하면 무엇이든 AI가 만들어 주는 날이 더 이상 먼 미래의 일만은 아니게 됐다.

구글 AI 연구팀은 뮤직LM 개발 과정을 소개한 논문을 지난 27일(현지시간) 공개했다. 뮤직LM은 28만시간 분량의 음악 데이터를 학습했다. 복잡한 텍스트를 입력해도 꽤 어울리는 음악을 만든다. 예를 들어 ‘아케이드 게임의 메인 사운드 트랙. 빠르고 경쾌하며, 기억하기 쉬운 일렉트릭 기타 리프가 있음. 반복적이고 기억하기 쉽지만 심벌 크래쉬나 드럼 롤과 같은 예상치 못한 소리도 나옴’이라는 문구를 입력하면 게임에 삽입하기에 손색이 없는 30초짜리 음악이 생성된다.

‘명상’, ‘산책’, ‘운동’ 등 음악 스트리밍 플랫폼에서 사용자가 음악을 찾을 때 입력할 법한 주제어를 입력해도 뮤직LM은 음악을 생성한다. ‘재즈(00:00~00:15), 록(00:15~00:30)’처럼 시간대별로 음악 장르를 설정하면 시간에 맞춰서 자연스럽게 악기와 리듬이 바뀐다.
이미지 확대
오픈AI의 이미지 생성 인공지능(AI) ‘달리2’에 “음악가보다 노래를 더 잘 만드는 AI의 3D 렌더링”이라고 입력해 생성한 이미지. 달리2
원본 이미지입니다.
손가락을 이용하여 이미지를 확대해 보세요.
닫기
다만 구글 측은 뮤직LM 모델을 서비스로 제공하지는 않는다. 저작권 문제를 기술적으로 완전히 해결하지 못했기 때문이다. 연구팀은 분석 결과 뮤직LM이 생성한 음악의 1% 정도가 학습 데이터를 직접 복제한 것으로 나타났다고 밝혔다. 오픈 소스로 공개돼, 미국 대학 등에서 표절 논란을 일으키고 있는 챗GPT의 행보와 대조적이다.

지난해부터 한층 고도화된 생성형 AI가 속속 등장하고 있다. 생성형 AI는 데이터를 바탕으로 새로운 콘텐츠를 만들어주는 AI를 말한다. 지난해 4월엔 오픈AI가 텍스트를 입력하면 이미지를 생성하는 ‘달리(DALL·E)2’를 공개해 업계에 충격을 줬다. 11월말엔 시와 에세이, 논문까지 쓸 수 있는 챗GPT가 등장했다. 개발 언어를 몰라도 일상어로 코딩을 할 수 있게 해 주는 AI는 이미 상용화 돼 있다. 오픈AI는 동영상 생성 AI 개발 가능성을 내비친 바 있다. 글로 설명하면 3D 프린터로 입체 형상을 생성하는 AI도 가까운 시일 내에 등장할 것으로 보인다. 생성 AI가 더 고도화되면 더 복잡한 것들도 컴퓨터 자판에 말로 입력해 만들어낼 수 있게 된다.

다만 급속도로 발전한 생성 AI는 현 시대 법제도나 사회 규범과 충돌할 여지가 많다. 불완전한 기술로 인해 저작권 문제에 부딪치는 것은 이 중 하나일 뿐이다. 당분간은 보고서 작성 중에 필요한 일러스트를 만들어 사용하는 등 AI가 생성한 콘텐츠가 인간의 작업에 도움을 주는 형태로 사용될 것으로 전망된다.

김민석 기자

에디터 추천 인기 기사

많이 본 뉴스

120년 역사의 서울신문 회원이 되시겠어요?
닫기