preLoad Image preLoad Image
검색 바로가기
주메뉴 바로가기
주요 기사 바로가기
다른 기사, 광고영역 바로가기
중앙일보 사이트맵 바로가기

[지식충전소] “얼라 했더니 Kid…3년 내 사투리까지 자동번역”

기계번역 수준 어디까지 왔나
해운 업계에서 일하는 김민식(44) 차장은 1년에 3~4번 미국을 포함해 중국·일본·동남아시아 등 다양한 지역으로 해외 출장을 간다. 공식적인 미팅에서는 영어로 하지만 비영어권 국가에서 택시 탈 때, 식당에서 음식을 시킬 땐 말이 안 통하는 것이 사실이다. 이럴 때 그가 요긴하게 활용하는 것이 구글 번역 앱이다. 가장 최근 터키 이스탄불 출장 땐 싫어하는 양고기 주문을 피하려 구글 번역 앱을 활용했다. 터키어로 된 메뉴판을 찍는 것만으로 영어로 번역이 이뤄졌다. 메뉴 주문 때도 종업원에게 구글 번역 앱이 장착된 휴대전화를 이용해 터키어로 주문했다.

“10년 내에 언어의 장벽이 사라질 것이다. 조그만 이어폰 크기의 통역기가 상대방이 외국어로 말하면 당신의 모국어로 실시간으로 바꿔 말해줄 것이다.”
기사 이미지

자동 번역으로 불리는 ‘기계번역’의 발전이 언어 장벽을 무너뜨리고 있다. 사진을 찍으면 사진 속 글자를 37개 언어로 번역해 주는 구글 번역 앱은 이미 실생활에서 활용되고 있다.

지난 1월 29일(현지시간) 월스트리트저널에 실린 ‘언어의 장벽이 무너진다(The Language Barrier Is About to Fall)’는 제목의 기고문 중 일부다. 이 기고문을 쓴 이는 알렉 로스. 힐러리 클린턴 미국 대통령 후보가 국무부 장관 시절 혁신 담당 수석 자문관으로 영입한 혁신 전문가다.

그의 주장대로 구글 번역기, 네이버 번역기, 마이크로소프트(MS)의 스카이프 트랜슬래이터, 한컴의 지니톡 같은 번역 앱이 이미 언어 장벽을 무너뜨리고 있다.

흔히 자동 번역으로 일컬어지는 ‘기계번역’은 컴퓨터의 처리 능력을 이용해 한 언어를 다른 언어로 번역하는 기술이다. 언어 장벽을 깨기 위한 인간의 노력이 컴퓨터와 만나 기계번역이 시작됐다. 1950년대 미국이 러시아어와 영어를 대상으로 기계번역 실험을 시도한 것이 최초였다. 당시엔 컴퓨터 처리 능력이 좋지 않아 관심을 끌지 못했고, 번역 품질도 좋지 않았다. 사람이 직접 번역하는 ‘휴먼 번역’보다 시간도 느리고 비용도 많이 들었다.
기사 이미지
기계번역에 혁신적인 변화를 가져온 사건은 88년 IBM이 통계방식(SMT·Statistical Machine Translation) 기술을 기계번역에 도입한 것이다. 전에는 규칙기반(RBMT·Rule-Based Machine Translation) 기술을 이용한 기계번역이 전부였다.

규칙기반 기술은 언어의 문법을 규칙화해 번역하는 방법이다. 언어학자가 중심이 되어야만 가능한 번역 기술이다. 이에 반해 통계기반 기술은 방대한 양의 연구재료, 즉 빅데이터를 이용해 통계적으로 규칙을 생성해 번역하는 방법이다. 기계번역에 언어학자가 필요없는 시대가 열린 것이다.

통계방식의 기계번역이 도입된 이후 언어 데이터가 많은 글로벌 정보기술(IT) 기업이 기계번역에 뛰어들 수 있게 됐다. 규칙기반 기계번역의 장점은 문법에 기반을 두기 때문에 정확성이 높다는 것이다. 다만 시간과 개발비용이 많이 들기 때문에 시스트란 같은 번역전문 대기업만 할 수 있는 분야였다. 통계기반의 기계번역은 언어학자 없이도 개발을 할 수 있고 데이터가 많이 쌓일수록 번역의 품질이 높다는 장점이 있다. 대량의 데이터가 쌓이기 전까지는 번역의 품질이 떨어진다는 단점이 있다. 요즘 규칙기반 기계번역은 통계기반 기술을 함께 사용하는 하이브리드 방식으로 진화 중이다.
기사 이미지
구글은 통계기반 기계번역의 대중화를 열었다. 2006년 영어·스페인어·독일어·프랑스어 번역으로 시작했지만 현재 100여 개의 언어를 번역할 정도로 발전했다. 한때는 통계기반 기계번역의 품질이 좋지 않아 “구글로 돌렸나(‘구글 번역기를 이용했나’라는 뜻)”라는 비꼬는 말까지 나왔을 정도다. 구글코리아 관계자는 “구글 번역은 매월 5억 명 이상의 사람이 이용하고 있고, 초당 100만 개의 단어를 처리하고 있다”고 설명했다. 구글 이후 MS·네이버 등의 글로벌 IT 기업이 기계번역 시장에 뛰어들기 시작했다.

현재의 기계번역에 대해 전문가들은 “일상생활에서는 불편함이 없을 정도”라고 평가하고 있다. 다만 기계번역을 이용하려면 스마트폰을 조작해야 하는 게 아직까지는 불편한 점이다. 10년 후에는 스마트 기기를 상대방에게 보여줘야 하는 불편함이 사라질 것으로 보인다. 김영길 한국전자통신연구원(ETRI) 실장은 “10년 후에는 이어폰 같은 웨어러블 기기를 이용한 통·번역기가 대중화될 것”이라며 “기계번역을 이용할 때 생기는 불편함이 상당 부분 해결될 것”이라고 예측했다.

구글·MS·네이버·한컴 같은 IT 기업이 기계번역 시장에 뛰어드는 이유는 잠재성이 크기 때문이다. 번역자동화 사용자협회(TAUS)는 지난해 세계 자동통·번역 시장 규모는 25억 달러(약 2조8492억원)였고, 2019년에는 70억 달러(약 8조원) 규모로 성장할 것이라고 내다봤다. 연평균 30% 이상 성장하는 것이다. 지난 8월 컨설팅업체 록트는 한국의 통·번역 시장 규모를 7274억원이라고 추정 발표했다.

쇼핑몰들은 상품 소개나 사용자 댓글을 구글 번역 같은 기계번역을 통해 다국어로 제공하면서 쇼핑몰 매출도 덩달아 올라가는 효과를 보고 있다. 에어비앤비나 호텔스닷컴 같은 여행·숙박 사이트의 경우 실시간으로 사용자 평이 다국어로 제공된다. 해외 뉴스 사이트의 기사 번역도 기계번역이 많이 사용되는 분야로 꼽힌다.

네이버 번역기를 연구하고 개발하는 네이버랩스의 파파고팀 김준석 리더는 “실시간으로 올라오는 사용자 평 같은 것은 워낙 양이 많아 시간적으로 사람이 번역하기 힘들다. 이런 경우 기계번역이 많이 활용된다”고 설명했다.

요즘 기계번역은 인공지능을 만나 더 급속히 발전하고 있다. 구글·네이버·MS·한컴 등이 기계번역의 품질을 높이기 위해 딥러닝 기술을 접목시키고 있다. 인공신경망 번역(NMT·Neural Machine Translation)이라고 불리는 기술로, 데이터를 스스로 학습해 번역을 수행하는 방법이다.

구글은 지난달 "구글 번역기에 딥러닝 기반의 새로운 알고리즘을 사용할 예정”이라고 발표했다. 이 기술을 통해 까다롭기로 유명한 ‘중국어-영어 번역’ 서비스 오류를 상당 부분 줄인 것으로 알려졌다. 네이버랩스의 파파고팀도 얼마 전 인공지능을 이용한 네이버 번역 베타서비스를 출시했다. 파파고팀의 김준석 리더는 “네이버랩스의 기계번역 팀은 최신 기술인 NMT를 적용한 번역 엔진을 완성했다”면서 “20일 안드로이드 앱부터 순차적으로 NMT 기반의 번역 엔진을 적용할 계획”이라고 밝혔다.

2018년 평창 겨울올림픽 자동 통·번역 공식 소프트웨어로 선정된 지니톡도 인공지능 기술을 접목해 번역의 품질을 높이고 있다. 지니톡을 개발한 신소우 한컴인터프리 대표는 “인공지능이 접목되면 3년 내 ‘얼라(어린이)’와 같은 사투리도 ‘키드(kid)’로 번역할 수 있을 것”이라고 내다봤다.

10년 후에는 일상생활의 회화를 위해 영어 학원을 다니지 않아도 되는 셈이다. 다만 비즈니스나 의학, 법률, 문학 같은 전문적인 분야는 앞으로도 기계번역이 완벽하게 번역할 수 없다는 게 정설이다.

최영진 기자 cyj73@joongang.co.kr
AD

중앙일보 핫 클릭

PHOTO & VIDEO

shpping&life

뉴스레터 보기