인터스피치 포스터 및 몬스터 사운드 기술이 반영된 '사운드 팔레트' 화면. NC AI 제공 NC AI는 글로벌 음성·언어 기술 학회인 '인터스피치 2025'에서 몬스터 사운드 생성·변환 AI 기술을 공개한다고 17일 밝혔다.
인터스피치는 국제 음성커뮤니케이션협회(ISCA)가 주최하는 세계 최대 규모의 음성 및 언어 기술 학회다. 매년 전 세계 음성 연구자와 산업 관계자가 모여 최신 연구 결과를 공유하는 자리다.
NC AI는 이번 학회에서 몬스터 사운드에 특화된 고품질 음색 변환 모델의 구조와 학습 기법을 다룬 논문과, 이를 웹 기반 실시간 변환 시스템으로 구현한 데모 구축 사례 논문 등 총 2편을 발표한다.
방문자가 마이크에 대고 말을 하거나 사운드를 업로드하면 곧바로 특정 몬스터의 울음이나 포효 등 음색으로 변환하는 체험형 데모를 제공한다. 온라인 데모 페이지도 선보인다.
새로운 기술은 대규모 MMORPG 게임에서 몬스터 사운드 제작 비용을 줄인다. CD 수준으로 음성을 분석해 캐릭터 고유의 거친 숨소리나 날카로운 포효를 놓치지 않고 담아낸 뒤 원래 음성의 내용은 유지하면서 원하는 스타일만 덧입힌다.
또 목소리에서 '무슨 말을 하는지'와 '어떤 느낌으로 말하는지'를 인식해 웃음, 포효, 숨소리 등 비언어적 요소를 자연스럽게 변환한다. 금속성 울림이나 두꺼운 숨소리 같은 질감을 주파수별로 정밀 복원하고 0.005초마다 강약 변화를 반영해 기계적인 소리가 아닌 실제 생물이 내는 것 같은 울림을 구현한다.
공격성, 위압감, 유쾌함 등 캐릭터 성격을 반영하는 스타일 속성도 세밀하게 조절할 수 있다. 동일 몬스터라도 전투나 감정 상태에 따라 완전히 새로운 음향을 생성할 수 있다.
회사에 따르면 해당 기술은 테스트 점수로 최근 공개된 음색 변환 모델을 앞질렀다. 음질과 자연스러움, 음색 유사도, 발화 내용 보존성 등 주관·객관 평가 전 부문에서 높은 점수를 기록했다.
NC AI의 음색 변환 기술은 회사의 생성형 SFX(사운드 이펙트) 저작 툴인 '사운드 팔레트'의 핵심 엔진으로도 활용된다.
조남현 NC AI 오디오 AI 팀장은 "앞으로도 AI를 활용해 창작자의 상상력을 현실로 구현하고, 디지털 콘텐츠 산업 전반에 혁신적인 오디오 경험을 제공하는 데 기여할 것"이라고 말했다.