preLoad Image preLoad Image
검색 바로가기
주메뉴 바로가기
주요 기사 바로가기
다른 기사, 광고영역 바로가기
중앙일보 사이트맵 바로가기

[지식충전소] 한국어 기계번역 어려워…일본어로 1차 번역한 뒤 영어로 다시 물어보세요

한국어는 기계번역이 어려운 언어로 꼽힌다. 어근과 접두어, 접미어에 의해 단어의 기능이 결정된다. 예를 들면 ‘나는 학교에 간다’도 다양한 형태로 바뀌는 것이다. ‘나는 학교에 가네요’ ‘나는 학교에 가’ ‘나 학교 간다’ 같은 변화가 생기기 때문이다.

한국전자통신연구원(ETRI)의 김영길 실장은 “어순도 변화가 많고 서술어가 생략이 되는 경우도 있다. 한국어는 영어에 비해 번역하기에 난이도가 상당히 높은 언어”라고 설명했다.

단어의 순서를 뜻하는 어순도 기계번역 품질에 영향을 미친다. 한국어와 일본어는 주어-목적어-서술어 형태를 가지고 있다. 이에 반해 영어·스페인어·프랑스어는 주어-서술어-목적어의 어순이다. 어순이 같으면 당연히 기계번역을 할 때 정확성이 높아진다. 반대로 어순이 다르면 정확성이 떨어진다.

반면 한국어를 영어로 번역하거나 영어를 한국어로 번역할 때 한국어-일본어-영어, 영어-일본어-한국어 순으로 기계번역을 하면 정확성이 높아진다. 이를 피벗(징검다리 언어를 이용해 기계번역을 하는 것)이라고 한다. 동남아시아 언어 같이 컴퓨터의 학습 데이터를 구하기 힘든 언어도 번역의 품질이 떨어진다.

‘나는 밤을 먹었다’를 구글 번역기로 돌리면 ‘I had nights’라는 틀린 문장이 나온다. 반면 한컴의 지니톡에 ‘나는 밤을 먹었다’라는 문장을 넣으면 ‘I ate a chestnut’이라는 정확한 결과물이 나온다.

이렇게 결과물이 다르게 나오는 이유는 ‘번역의 중심 언어’가 다르기 때문이다. 신소우 한컴인터프리 대표는 “구글 번역은 영어를 중심으로 하고 지니톡은 한국어를 중심으로 하기 때문에 이런 차이가 생긴다”고 말했다.

최영진 기자
AD

중앙일보 핫 클릭

PHOTO & VIDEO

shpping&life

뉴스레터 보기