IT·과학 산업 경제
정치 사회 문화·생활
전국 글로벌 연예·스포츠
오피니언 포토·영상 기획&시리즈
스페셜&이벤트 포럼 리포트 아이뉴스TV

AWS "반지의 제왕 한권 3.1달러면 AI가 음성전환"

본문 글자 크기 설정
글자크기 설정 시 다른 기사의 본문도 동일하게 적용됩니다.

"저렴한 비용 장점"…'아마존 폴리' 등 AI 서비스 소개

[아이뉴스24 김국배기자] "텍스트를 음성으로 변환해주는 '아마존 폴리(Poly)'는 문자 수 100만 개당 4달러만 지불하면 됩니다."

김일호 아마존웹서비스(AWS) 솔루션 아키텍트는 25일 서울 여의도 콘래드호텔에서 열린 'AWS 기술 세미나'에서 AWS 인공지능(AI) 서비스의 장점 중 하나로 저렴한 비용을 꼽았다.

AWS의 AI 중 하나인 아마존 폴리는 딥러닝 기술을 활용해 텍스트를 생생한 음성으로 전환해주는 서비스다.

김일호 아키텍트는 "일반적인 뉴스 기사 하나를 음성으로 전환하는 데는 3센트 정도의 비용이 든다"면서 "'반지의 제왕 두 개의 탑' 소설 같은 경우 3달러 10센트면 텍스트를 음성으로 변환할 수 있다"고 설명했다.

이어 "음성으로 변환된 문자 수에 대해서만 요금을 지불하며, 생성된 음성 파일은 저장 후 추가 요금없이 원하는 만큼 반복적으로 재생할 수 있다"고 덧붙였다.

특히 그는 "아마존 폴리는 자연스러움(naturalness)이 특징"이라며 "최대한 사람이 말하는 것과 동일하게 구현했다"고 강조했다.

실제로 폴리는 다양한 억양의 남성과 여성 음성을 포함해 47개 음성을 24개 언어로 제공한다. 약자, 숫자조합 같은 텍스트를 상황에 맞도록 인식하도록 구현했다. 다만 아직 한국어는 지원하지 않고 있다. 워싱턴포스트 등이 이미 고객이다.

그는 "음성을 인터페이스로 사용하는 서비스(Apps)는 이제 일상 생활이 됐다"며 "음성은 매우 다양한 분야에서 활용될 수 있다"고 부연했다.

아울러 김 아키텍트는 이미지 인식·분석 서비스 '아마존 레코그니션(Rekognition)', 쉽게 챗봇 서비스를 개발하게 해주는 '아마존 렉스(Lex)' 등 또 다른 AI 서비스도 소개했다.

레코그니션은 객체 및 장면 탐지, 안면 분석, 안면 비교 등을 제공한다. 렉스는 아마존 '알렉사'과 동일한 기술 기반으로 구현돼 대화형 챗봇을 제작할 수 있다.

김 아키텍트는 "가령 객체 및 장면 탐지의 경우 사진 공유 앱이나 서비스에서 자동으로 사진을 분류·태깅하는 검색엔진을 구현할 수 있으며, 안면 분석은 사진 출력 서비스 시 원하는 분위기의 사진이나 가장 나온 사진을 추천해줄 수 있다"고 말했다.

김국배기자 vermeer@inews24.com



공유하기

주소가 복사되었습니다.
원하는 곳에 붙여넣기 해주세요.

alert

댓글 쓰기 제목 AWS "반지의 제왕 한권 3.1달러면 AI가 음성전환"

댓글-

첫 번째 댓글을 작성해 보세요.

로딩중
댓글 바로가기