대기업이나 AI 전문가들만의 전유물로 여겨졌던 AI 음성 기술이 중소기업이나 소상공인은 물론 일반 사용자들까지 대중적으로 활용할 수 있게 됐다. 기존 TTS 방식을 사용한 콜센터 ARS나 안내방송처럼 기계음이 뚜렷한 음성은 고객들에게 친근감을 주지 못했다. 획일화된 음성 특성상 기업의 브랜드 가치를 살리기도 어렵다. 그러나 이제 AI 음성으로 그 한계를 극복할 수 있게 됐다.

인공지능 전문기업 마인즈랩(대표 유태준)은 자사의 인공지능(AI) 서비스 플랫폼 마음에이아이(maum.ai)에서 AI 음성 생성 서비스를 오픈했다고 12일 밝혔다. 마인즈랩이 자체 개발한 AI 음성 생성 서비스를 통해 사용자는 최소 20분, 최대 1시간 이내의 음성 데이터만을 가지고도 실제 인물의 목소리와 90% 이상 유사한 목소리를 만들 수 있다.

마인즈랩은 AI 음성생성 시 머신러닝 과정을 자동화해 사용자는 음성 파일을 업로드하거나 웹사이트 상에서 음성 녹음을 마치기만 하면 된다. 녹음 품질이 양호하지 않고, 확보된 녹음 분량 역시 제한적인 역사적 인물의 음성의 음성까지 높은 품질로 구현할 수 있다.

마인즈랩의 AI음성 생성 서비스 마음에이아이 화면
마인즈랩의 AI음성 생성 서비스 마음에이아이 화면

이 음성생성 기술은 다양한 산업에 활용될 수 있다 콜센터에서는 단순 반복적 성격의 아웃바운드 콜을 자동화하는 ‘음성봇’으로 사용된다. 교육, 게임, 유튜브 영상 등 다양한 분야의 콘텐츠를 제작할 때도 AI 음성생성 서비스를 활용할 수 있다.

최홍섭 마인즈랩 상무는 “”며 “마인즈랩의 AI 음성 생성 기술은 글로벌 탑티어 기업의 기술 수준과 비교해도 밀리지 않을 정도의 완성도를 보이며, 이 모든 과정을 누구나 쉽게 곧바로 경험할 수 있다는 데에서도 큰 차별점이 있다”며 “마음에이아이의 모토인 ‘쉽게 쓰는 AI, 바로 쓰는 AI’에 맞춰 이번에 오픈한 음성 생성 서비스 이외에도 음성인식, 이미지 인식, 챗봇, 기계독해(MRC) 등 인공지능 전 영역을 서비스화할 예정”이라고 말했다.

이향선기자 hslee@nextdaily.co.kr

저작권자 © 넥스트데일리 무단전재 및 재배포 금지