preLoad Image preLoad Image
검색 바로가기
주메뉴 바로가기
주요 기사 바로가기
다른 기사, 광고영역 바로가기
중앙일보 사이트맵 바로가기

[J report] 저무는 손가락 터치 시대, 목소리로 다 되는 세상 열린다

1차 판매분 4000대 35분 만에 매진. 2차 판매분 4000대 하루 만에 매진. (네이버 웨이브)
 
예약판매 38분 만에 3000대 매진. (카카오 카카오미니)
 
요즘 인공지능(AI) 스피커 시장 열기가 이 정도다. 이쯤에서 짚고 넘어가야 할 것이 있다. 이 열기의 근원은 무엇일까. 파격적 할인? 음악 서비스 이용권? 그도 아니면 제품에 붙은 라이언 캐릭터 피규어?
 
무엇이 열기를 부채질했건, 분명한 건 시장이 달라졌다는 것이다. 지난해까지만 해도 얼리 어답터의 독특한 취향으로 여겨졌던 AI 스피커는 어느새 대중의 관심 한복판으로 성큼 걸어 들어왔다. 이를 두고 “본격적인 ‘음성 인식의 시대’가 꽃을 피우려 한다”는 분석까지 나올 정도다. 시장조사기관 가트너는 지난해 7억2000만 달러(8200억원) 규모였던 AI 스피커 시장이 2021년 35억2000만 달러(4조원) 규모로 확대될 거로 전망했다.
 
정말 음성 인식 플랫폼 시장은 기술적, 산업적으로 ‘티핑포인트’(변곡점)를 지나고 있는 걸까. 세 가지 궁금증을 전문가들과 짚어봤다.
 
주요 IT기업 음성인식 플랫폼

주요 IT기업 음성인식 플랫폼

◆기술은 무르익었나=AI 스피커는 음성인식 기반의 인공지능 서비스다. 얼마나 잘 듣고(음성인식), 똑똑한 답을 내놓느냐(인공지능)가 관건이다.
 
전문가들은 최근 AI 스피커의 기능을 바탕으로 “첫 번째 장벽, 즉 자연어 인식 기술에선 일단 티핑 포인트에 도달한 게 확실하다”고 진단했다. 최근 출시된 서비스의 자연어 인식 정확도는 96%에 근접한 것으로 알려졌다. 이는 평균적 청력의 사람이 실제 생활에서 인식하는 것과 큰 차이가 없는 수준이다. 신진우 카이스트 전기·전자공학부 교수는 “이제는 인공지능의 ‘귀’는 걸림돌이 되지 않는다. 인공지능이 얼마나 대화의 맥락과 의도를 이해해 똑똑한 답변을 내놓느냐가 문제”라고 말했다.
 
똑똑한 답이 나오려면 두 가지가 필요하다. 머리가 좋아야 하고(인공지능 알고리즘) 공부를 많이 해야 한다(빅데이터). 아직 대부분의 음성인식 플랫폼은 성인이 기대하는 수준으로 똑똑하지 않다는 게 한계다. 체계적으로 쌓인 빅데이터도 적지만, 빅데이터를 어떻게 조합해야 최적의 답을 내놓을지에 대한 노하우를 장악한 기업도 없다.
 
이경전 경희대 경영학과 교수는 “아직 대부분의 플랫폼은 날씨 같이 단편적 정보를 내놓는 수준”이라며 “여러 명령을 한번에 수행하거나 대화의 맥락을 파악해 대답을 내놓는 것 같은 기술은 아직 갈길이 멀다”고 말했다.
 
◆시장은 얼마나 열렸나=음성인식 플랫폼이 본격적인 시장성을 갖추려면 생태계가 구축돼야 한다. 스마트폰 운영체제의 경쟁력이 얼마나 다양한 애플리케이션 생태계를 확보했느냐로 갈리는 것과 같다.
 
가장 발빠르게 움직이는 게 아마존이다. 2014년에 이미 AI 스피커를 출시한 ‘선두 기업’인 아마존은 2015년 음성인식 플랫폼 ‘알렉사’에 연동되는 ‘스킬’(앱과 같은 개념) 생태계를 구축하기 시작했다. 스킬 생태계는 무서운 속도로 확장되고 있다. 기술전문기업 보이스봇에 따르면 6월 말 기준 1만5000개였던 알렉사의 스킬 수는 최근 2만개를 넘어섰다.
 
최재홍 강릉원주대 멀티미디어공학부 교수는 “알렉사의 스킬 생태계는 증가세에 탄력이 붙어 내년 중 10만개를 돌파할 수 있을 것으로 본다”며 “애플이 처음 아이폰을 공개했을 때 iOS의 앱이 500여개에 불과했다는 것을 감안하면 어마어마한 규모”라고 말했다.
 
네이버도 음성인식 플랫폼 ‘클로바’를 11월 공개해 생태계를 구축할 계획이다. 최 교수는 “아직 음성인식 시장은 초기에 불과하기 때문에 더 풍성한 생태계를 구축하는 기업이 나오면 기존 질서가 뒤집힐 가능성이 있다”고 말했다.
 
◆한국 기업의 현 주소는=국내 기업도 이런 상황을 알고 있다. 인공지능 분석 기술이나 빅데이터 보유량, 서비스 생태계 등을 감안할 때 국내 기업이 영어권 시장에서 아마존이나 구글을 앞서긴 쉽지 않다는 게 객관적 평가다.
 
관건은 한국어 시장에선 국내 기업들이 패권을 쥘 수 있느냐는 것이다. 전문가들은 “한국어 음성인식 플랫폼 시장을 외국 기업이 뺏아가긴 쉽지 않을 것”이라고 평가한다. 일단 한국어 인식 기술이나 한국어 빅데이터에서 국내 기업이 앞선다. 인공지능 알고리즘에선 삼성전자가, 빅데이터 보유량에선 네이버가 압도적이다. 카카오는 O2O(온·오프라인 연계) 서비스를 중심으로 생태계 구축에 주력한다는 전략이다. 이경전 교수는 “네이버는 오디오 콘텐트 확보에서 앞서있고, 카카오는 O2O 서비스 연계 전략이 기대된다”며 “어느 회사건 음성 기반의 킬러 서비스를 먼저 내놓으면 승기를 잡을 수 있을 것”이라고 말했다.
 
임미진 기자 mijin@joongang.co.kr
AD
온라인 구독신청 지면 구독신청

중앙일보 핫 클릭

PHOTO & VIDEO

shpping&life

뉴스레터 보기

김민석의 Mr. 밀리터리 군사안보연구소

군사안보연구소는 중앙일보의 군사안보분야 전문 연구기관입니다.
군사안보연구소는 2016년 10월 1일 중앙일보 홈페이지 조인스(https://news.joins.com)에 문을 연 ‘김민석의 Mr. 밀리터리’(https://news.joins.com/mm)를 운영하며 디지털 환경에 특화된 군사ㆍ안보ㆍ무기에 관한 콘텐트를 만들고 있습니다.

연구소 사람들
김민석 소장 : kimseok@joongang.co.kr (02-751-5511)
국방연구원 전력발전연구부ㆍ군비통제센터를 거쳐 1994년 중앙일보에 입사한 국내 첫 군사전문기자다. 국방부를 출입한 뒤 최장수 국방부 대변인(2010~2016년)으로 활동했다. 현재는 군사안보전문기자 겸 논설위원으로 한반도 군사와 안보문제를 깊게 파헤치는 글을 쓰고 있다.

박용한 연구위원 : park.yonghan@joongang.co.kr (02-751-5516)
‘북한의 급변사태와 안정화 전략’을 주제로 북한학 박사를 받았다. 국방연구원 안보전략연구센터ㆍ군사기획연구센터와 고려대학교 아세아문제연구소 북한연구센터에서 군사ㆍ안보ㆍ북한을 연구했다. 2016년부터는 중앙일보에서 군사ㆍ안보 분야 취재를 한다.