IT·과학 산업 경제
정치 사회 문화·생활
전국 글로벌 연예·스포츠
오피니언 포토·영상 기획&시리즈
스페셜&이벤트 포럼 리포트 아이뉴스TV

'마치 사람처럼' 진화하는 인터넷 번역 서비스

본문 글자 크기 설정
글자크기 설정 시 다른 기사의 본문도 동일하게 적용됩니다.

인공신경망 기계 번역(NMT)으로 진화…무엇이 달라졌나

[성상훈기자] 최근 인터넷 번역 서비스에 탑재되는 '인공신경망 기계 번역(NMT: Neural Machine Translation)에 대한 관심이 커지고 있다. 마치 사람이 번역하는 것과 같은 착각을 일으킬 정도로 감탄사가 나오는 번역 사례가 속속 등장하면서부터다.

구글도 AI를 적용한 이 같은 서비스 나선다.

구글은 29일 서울 역삼동 구글코리아 본사에서 'AI 혁신의 시대: 구글 포토와 구글 번역' 을 주제로 기자간담회를 갖고 구글 포토와 구글 번역 서비스 인공지능 기술 업데이트에 대한 내용을 발표했다.

특히 관심을 받은 것은 '구글 번역' 서비스. 구글은 이전부터 인공지능 기술의 한 종류인 '딥러닝(심층학습)' 기술을 번역 서비스에 활용해 왔다. 이세돌과 바둑 대결을 벌여 화제가 됐던 알파고에 사용된 범용 인공지능과 같은 알고리즘이다.

이에 이어 구글은 이달부터 '인공신경망 기계번역(NMT)' 기술을 구글 번역 서비스에 통합했다. NMT기술이 구글 번역 서비스에 적용된 이후 기존 번역 서비스에 비해 오역이 58%(영어, 중국어)에서 87%(영어, 스페인어)까지 감소했다는 게 회사 측 설명이다.

기존 인터넷 번역 서비스는 통계 기반 번역(SMT: Statistical Machine Translation)이 쓰여왔으며 NMT는 여기에서 한 단계 진화된 방식이다. SMT 방식이 단어나 몇 개의 단어가 모인 구(Phrase) 단위의 학습 번역 방식이었다면, NMT 방식은 문장 전체의 맥락에서 그 안의 구성 요소들을 변환하면서 해석, 번역하는 방식이다.

이를 통해 문장 안에서 단어의 순서, 의미, 문맥에서의 의미 차이 등을 반영해 보다 효율적이고 정확한 번역이 가능해진다는 것. 쉽게 말하면 단어 하나하나를 인식 하는 것이 아닌 문장 전체를 기계가 스스로 인식하는 것이다.

구글 번역 서비스가 지원하는 언어는 총 108개. 이중 영어, 프랑스어, 독일어, 스페인어, 중국어, 일본어, 한국어, 터키어 등 8개 언어에 NMT 기술이 적용된다. 구글에 따르면 이 8개 언어를 사용하는 인구는 전세계 35%를 차지한다.

한국어의 정확도는 다른 언어보다는 낮지만 이전 번역 서비스에 비해서는 몰라보게 정확해졌다는 것이 일반적인 평가다.

◆진화한 번역 서비스, "별걸 다 번역하네"

공교롭게도 국내 기업 네이버도 구글보다 한달 먼저 NMT 기술을 번역서비스 '파파고'에 적용했다. 파파고 역시 기존 SMT 번역 방식에서 2배 이상 정확도 상승을 이뤘다.

구글 NMT 번역 서비스의 강점은 기계가 스스로 웹이 있는 번역 콘텐츠를 크롤링(수집)하고 검색하면서 인간의 도움 없이 스스로 콘텐츠를 통해 해당 언어의 관련성을 배우면서 학습한다는 점이다.

구글 번역 서비스는 최근 고3 수험생들이 수능을 마친 이후 '수능 망했어'를 'I lost my Life(내 인생은 이제 끝났어)'로 번역하거나 'She geun hye you(쉬 근혜 유)' 문장을 '그녀는 너를 화나게 한다' 등의 문장으로 번역하는 등 기존 번역 서비스에서 보여주지 않았던 면모를 보여주면서 연일 화제에 올랐다.

인터넷 상의 학술자료나 온라인 기사를 기계가 스스로 수집하면서 연관성 높은 문장을 스스로 배열하다보니 존재하지 않는 단어조차도 맥락을 풀이해 번역하고 있는 셈이다.

네이버 파파고도 마찬가지다. 일례로 파파고를 통해 '나는 아침 일찍 아침 준비를 했다'를 영어로 번역하면 'I prepared breakfast early in the morning' 으로 번역해준다.

이전 번역 방식인 통계 정보만 사용하면 '아침'이라는 단어가 나왔을 때 'in the morning'으로 번역해야 하는지 'breakfast(아침식사)'로 번역해야 하는지 구분이 쉽지 않다.

그러나 문장 전체를 인식하게 되면 이같은 의미의 차이가 녹아 있기 때문에 기계가 스스로 '아침'을 '아침식사'로 적절하게 인식하게 된다.

물론 단점도 있다. 인터넷 상에 잘 공개되지 않은 데이터는 배우기 힘들고 미세한 성별까지 구분해서 번역하지 못하는 경우도 있기 때문이다. 따라서 이를 보완할 수 있는 다양한 리서치가 뒤따라줘야 한다.

버락 투로프스키 구글 번역 프로덕트 매니지먼트 총괄은 "인공신경망 기계 번역은 문장 번역시 전체 무낵 적용해서 가장 관련성 높고 적합한 것 찾아 재배열해서 실제 인간이 말하는 것에 가깝게 수정하게 된다"며 "가까운 시일안에 크롬 브라우저에도 적용하게 될 것"이라고 전했다.

성상훈기자 hnsh@inews24.com




주요뉴스


공유하기

주소가 복사되었습니다.
원하는 곳에 붙여넣기 해주세요.
alert

댓글 쓰기 제목 '마치 사람처럼' 진화하는 인터넷 번역 서비스

댓글-

첫 번째 댓글을 작성해 보세요.

로딩중
댓글 바로가기


뉴스톡톡 인기 댓글을 확인해보세요.

TIMELINE