preLoad Image preLoad Image
검색 바로가기
주메뉴 바로가기
주요 기사 바로가기
다른 기사, 광고영역 바로가기
중앙일보 사이트맵 바로가기

석학에게 10분 만에 배우는 인공지능의 '현재'

앤드류 응 스탠포드 교수. 세계적인 인공지능 석학이다. 최근 몇 년 인공지능 열풍을 선도한 딥러닝 분야의 대가다. 지난 2011년 인간의 뇌를 모방한 신경망 기술 개발 프로젝트 '구글 브레인 프로젝트'의 책임자를 맡았다. 
 
화교 출신인 그는 2014년 중국의 검색엔진 기업 바이두의 인공지능 연구 센터에 합류, 중국 인공지능 산업의 최전선에 섰다. 3년 만에 바이두를 떠난 후에는 AI 벤처기업을 설립하고, 다양한 교육 과정을 만드는 등 인공지능 인재 육성에 적극적으로 나서고 있다.   
앤드류 응 스탠포드 대학 교수 [사진 바이두 백과]

앤드류 응 스탠포드 대학 교수 [사진 바이두 백과]

응 교수는 얼마 전 미국에서 열린 인공지능 컨퍼런스에 참가해 '인공지능은 새로운 전기다'라는 주제로 강연을 했다. 25분이라는 짧은 시간이었지만 인공지능의 '현재'를 가장 명쾌하게 풀어낸 강의로 꼽히며 중국 젊은이들 사이에서 인기를 끌고 있다.  
  
차이나랩이 당시 강연 내용을 재구성해봤다. 딱 10분만 투자해보시라. 4차 산업 혁명의 핵심 '인공지능'이 좀 더 쉽게 다가올지도 모른다.
 
인공지능(AI)은 어떻게 사용되고 있는가?
현재 산업에서 사용되는 인공지능은 '지도학습(Supervised Learning)'을 기반으로 한다. 지도학습이란 컴퓨터에 다양한 데이터를 입력, 반복된 훈련 과정을 통해 하나의 결과를 유추하는 기술이다. 컴퓨터가 스스로 학습하는 '머신러닝(기계 학습)'의 일종이다. 
 
예를 들면 '내'가 나온 수 백 장의 사진을 컴퓨터에 입력하고 이 이미지의 답이 '나'라고 반복적으로 가르쳐 주는 것이다. 그 후 컴퓨터는 내가 나온 사진이 입력되면 이 이미지가 내가 맞는지 아닌지를 유추해낼 수 있다. 이때 컴퓨터는 'Yes' 혹은 'No' 중 하나의 답을 줄 수 있다.  
 
이 같은 지도학습을 통해 실제로 돈을 벌고 있는 부분이 온라인 광고다. 광고와 이용자의 정보를 컴퓨터에 투입했을 때, 컴퓨터는 과거 데이터를 바탕으로 이용자가 광고를 클릭할지 안 할지를 유추한다. 지도학습은 소비 금융 부분에서도 이용되고 있다. 고객의 신용 정보를 입력하면 컴퓨터는 그동안 대출 실적 데이터를 기반으로 돈을 빌려줘야 할지, 말지를 결정할 것이다.
 
앤드류 응 교수 [사진 중국 량즈웨이]

앤드류 응 교수 [사진 중국 량즈웨이]

지난 몇 년 이 같은 지도학습 기술은 빠르게 발전했다. 결과를 유추하는 능력이 크게 향상되면서 점차 사용 분야가 다양해지고, 운용 비용은 저렴해지고 있다.
 
동시에 단순히 'Yes 혹은 No(0 혹은 1)'의 답을 내놓는 수준을 넘어서고 있다. 음성 식별이 대표적이다. 음성 식별은 음성이 '입력'되면, 이를 문자로 '출력'한다. 방대한 양의 데이터가 축적되면서 음성 식별의 정확도는 빠르게 향상되고 있다. 이 같은 학습법은 이미 아마존의 AI 스피커 알렉사, 애플의 음성 비서 시리, 바이두의 음성 스마트카 솔루션 듀어OS 등에서 사용되고 있다.  
 
또한 영어를 입력하면 알고리즘을 거쳐 통해 프랑스어로 변환이 되는 '기계 번역'과 문자를 음성으로 전환하는 TTS(Text to Speech) 등이 현재 지도학습을 응용한 기술들이다.
 
인공지능은 왜 이제야 주목받기 시작했을까?
인공지능을 연구하다 보면 가장 많이 받게 되는 질문이 있다. 바로 인공지능이 왜 이제야 주목받기 시작했느냐다. 알다시피 인공지능과 관련된 이론과 기술은 오래전부터 존재해왔다.   
인공지능은 왜 이제야 주목받기 시작했을까? [사진 중국 량즈웨이]

인공지능은 왜 이제야 주목받기 시작했을까? [사진 중국 량즈웨이]

위 그림에서 답을 찾아보자. 가로축이 데이터의 양을, 세로축이 알고리즘의 성능을 나타낸다. 과거의 인공지능 기술은 데이터 양이 증가해도 알고리즘의 성능은 눈에 띄게 향상되지 않았다. 그러나 인공 신경망이 도입되고, 데이터의 양이 증가함에 따라 성능이 빠르게 좋아지는 것을 볼 수 있다. 또한 인공 신경망의 규모가 커질수록 데이터 투입에 따른 성능 향상되는 속도가 점점 더 빨라진다.  
 
인공신경망? 사람의 신경을 모방한 기계 학습 기법. 사람의 감각 기관에서 받아들인 정보는 뉴런을 통해 뇌로 전달된다. 이후 뇌는 종합, 판단해서 다시 명령을 내리게 된다. 이때, 여러 개의 뉴런이 연결되면서 복잡한 연산 등을 수행하게 되는데 이와 같은 두뇌의 정보 처리 과정을 모방해서 만든 알고리즘이 바로 인공 신경망이다.
 
결론은 인공지능 알고리즘이 발전하기 위해서는 두 가지가 필요하다는 얘기다. 하나는 방대한 양의 데이터, 그리고 대규모의 인공 신경망이다. 이전까지는 인공지능에 대한 이론은 존재했지만 실제 알고리즘의 성능을 향상시킬 수 있는 데이터와, 인공 신경망이 부족했다. 때마침 대량의 데이터를 처리하는 빅데이터 기술의 보급과 인공 신경망의 규모화가 맞아 떨어진 결과라고 할 수 있다.
 
인공지능은 앞으로 어떻게 발전해갈 것인가?
또 하나 자주 받는 질문을 꼽아보자. 바로 앞으로 인공지능이 어떤 방향으로 발전해 나갈 것이며, 어떤 경제적 가치를 만들어 낼 수 있느냐다.
 
앞에서도 얘기했듯이, 현재 가장 많은 경제적 가치를 만들어내고 있는 것이 '지도학습' 방식이다. 만약 나에게 지도학습 그 다음의 머신러닝 학습법을 예측해보라고 한다면, 단연 '전이학습(Transfer Learning)'을 꼽는다. 이 방식은 개념 자체가 그다지 '섹시'하지 않아 상대적으로 주목을 덜 받고 있다고 생각한다.  
 
전이학습이란 하나의 환경에서 만들어진 알고리즘을 또 다른 분야에서 적용하는 것을 말한다. 예를 들면 인터넷에 떠도는 사진들을 통해 훈련된 이미지 식별 알고리즘을 의학 분야로 가져와, 영상 진단 등에 사용하는 식이다. 지금의 머신러닝 기법들을 현실 분야에서 응용하기 위해서는 훈련 데이터를 새롭게 수집하고, 모델을 다시 만들어야 하는 불편함이 있다.  
 
강화학습(Reinforcement learning) 역시 주목할 만하다. 지도학습이 입력(데이터)과 출력(Yes or No)을 통해 알고리즘을 만들었다면, 강화학습은 '잘했다' 혹은 '못했다'라는 보상 값을 통해 스스로 정보를 활용하고 결과를 도출하도록 하는 것이다. 컴퓨터는 다양한 행위를 스스로 해보며 변하는 점수를 확인, 결국 자신이 가장 잘한 행위를 판단할 수 있게 된다. 알파고, 자율 주행 차량, 로봇 등에 강화학습이 활용되고 있다.
 
강화학습은 개념 자체가 흥미롭기 때문에 많은 관심을 받아왔다. 나도 이 분야에 흥미를 느끼고 몇 년째 관련 연구를 하고 있다. 그러나 강화학습을 현실에서 응용하고, 나아가 경제적 가치를 창출하기 위해서는 아직 갈 길이 멀다.  
 
강화 학습이 가장 잘 구현되는 분야가 게임이다. 컴퓨터는 게임을 플레이하면서 정해진 알고리즘으로 무한대에 가까운 시도를 할 수 있다. 이는 곧 무한대의 데이터를 얻을 수 있다는 의미다. 반면 실제 상업화에 응용할 수 있는 분야들에서는 사실상 풍부한 데이터를 구축하는 게 힘든 상황이다.  
 
하나 아쉬운 점은 지도학습, 비(非)지도학습, 전이학습, 강화학습 등 머신러닝 학습법들이 만들어내고 있는 성과의 폭이 초기에 비해 줄어들고 있다는 것이다. 한계를 말하는 사람도 있다. 그러나 이는 지금의 상황일 뿐, 컴퓨터 공학이 매년 비약적인 발전을 거듭하고 있는 점을 감안할 때, 이 중 한 분야에서 획기적인 돌파가 이뤄질 수 있을 것으로 기대한다.  
 
어떤 인공지능 회사가 살아남을 것인가?
얼마 전 오프라인 유통회사에 다니는 한 친구에게서 질문을 받은 적이 있다. "우리는 인터넷으로 물건을 팔고 있다. 아마존 역시 인터넷으로 물건을 판다. 그렇다면 아마존과 우리 회사는 같은 종류의 기업이라고 할 수 있나?" 물론 대답은 'No'다.  
 
인터넷 사이트가 있고 사내에 개발자들이 있다고 유통업체가 하루 아침에 인터넷 기업이 되지 않는다. 인터넷 시대에 걸맞은 디지털 마케팅 능력과 수평적인 의사결정 구조. 직원들이 인터넷 활용에 있어 전문가적인 퍼포먼스를 보여주는 회사가 진정한 의미에서 인터넷 기업이 된다. 
인공지능 [사진 셔터스톡]

인공지능 [사진 셔터스톡]

요즘 많은 사람들이 인공지능 기업이라는 말을 한다. 아마 그들의 회사에 몇 명의 인공지능 전문가나, 머신러닝 혹은 인공 신경망을 활용하고 있을지 모른다. 하지만 이것만으로는 인공지능 기업이 될 수 없다.  
 
먼저 인공지능 회사는 데이터를 전략적으로 활용할 줄 알아야 한다. 내가 회사 하나를 창업했다고 가정해 보자. 나는 가장 먼저'데이터-고객-제품'이 유기적으로 연결된 순환 시스템을 만들 것이다.  
 
"알고리즘을 통해 다양한 시장 데이터를 모은다. 이를 바탕으로 제품을 출시한다. 제품을 구매한 고객들에게서 더 많은 데이터가 발생한다. 이 과정을 순환하면서 데이터는 폭발적으로 늘어난다. 알고리즘은 정교해진다. 그리고 점점 더 고객이 원하는 제품에 가까워질 수 있다. 이 시스템에서는 데이터, 고객, 제품이 같은 비중을 차지한다"
 
대표적인 예가 구글과 바이두 같은 검색 엔진이다. 검색 엔진은 방대한 데이터를 보유하고 있으며 오랜 기간에 걸쳐 복잡한 데이터 전략을 수립해 놓고 있다. 이들이 구축한 데이터 전략과 경험은 유능한 개발자와 훌륭한 알고리즘을 보유한 후발주자들을 뿌리치는 높은 성벽이 된다.  
 
두번째는 통일된 데이터 베이스다. 요즘은 많은 회사들이 데이터 창고를 보유하고 있다. 그런데 자세히 보면 상당히 분산돼 있다. 한 개발자가 여러 데이터를 활용해 작업을 하려고 하면 적어도 수십 명의 각 팀 담당자를 거쳐야 하는 경우도 있다. 누구나 쉽게 접근할 수 있는 하나의 통일된 데이터 베이스가 구축되어야 한다. 인공지능 기업의 가장 기초적인 부분이다.  
 
마지막으로 업무 프로세스도 변해야 한다. 현재 모바일 애플리케이션이 만들어지는 과정을 보자. 먼저 서비스 기획자는 애플리케이션의 설계와 디자인을 하나의 도면으로 그려 개발자에게 전달할 것이다. 그 후 개발자는 도면에 맞게 애플리케이션을 구현해 나갈 것이다. 이 분업 과정은 상당히 뚜렷하고 명쾌하다.  
 
인공지능 시대는 어떨까? 채팅로봇을 만든다고 가정해보자. "여기에 사진을 넣고..여기에는 말풍선을 넣고...." 식의 도면은 더 이상 의미가 없다. 인공지능 시대의 서비스 기획자는 기술자와 '알고리즘을 어떻게 서비스에 안착시킬지', '이용자와 데이터를 어떻게 연결할지' 등에 대해 처음 기획 단계부터 끊임없이 소통하고 피드백을 줘야 한다. 이 같은 업무구조가 인공지능 회사의 모든 프로세스를 관통하게 될 것이다.  
 
AI 전문가가 중요한 이유
컴퓨터 혹은 알고리즘은 어떻게 자신이 해야 할 작업을 인식할 수 있을까? 두 가지 지식으로부터 이를 결정한다. 하나는 데이터, 하나는 사람이다. 컴퓨터가 문제를 해결하기에 앞서 이 둘 중 하나를 선택해야 한다.  

 
온라인 광고를 예로 들어보자. 광고 분야에서는 다양하고 방대한 양의 데이터가 있다. 때문에 사실 사람의 힘이 그다지 필요하지 않다. 간단한 알고리즘에 데이터를 집어넣기만 하면 컴퓨터 스스로 학습하고 더 나은 결과를 도출해 낼 수 있다. 사람보다 데이터가 중요하다.  
 
의료 영역은 다르다. 데이터의 절대적인 양이 적을뿐만 아니라 입력할 수 있는 케이스도 수 백 가지에 불과하다. 이럴 때는 사람의 힘이 상당 부분 필요해진다. 의사들도 다양한 환자 데이터를 분석해 하나의 그래프 모형을 만든다. 이를 자신들이 구축한 지식 범위 내에서 활용할 뿐이다.  
 
그리고 또 다른 분야가 하나 있다. 바로 일정 수량의 데이터가 확보돼 있으며, 동시에 적당한 사람의 개입을 필요로 하는 분야들이다. 아마 인공지능이 경제적 가치를 만들어 낼 수 있는 많은 산업들이 여기에 속할 것이다. 우리 사회가 특정 산업과 인공지능에 해박한 전문가들을 필요로 하는 이유다.  
 
실제로 많은 개발자들이 인공지능 영역에 발을 들이고 있다. 일부는 시중 서적을 통해 독학을 하기도 하고, 일부는 온라인 강의를 쫓아 듣기도 한다. 그러나 하나 소홀히 되는 중요한 학습법이 있다. 바로 논문을 읽고 새로운 알고리즘들을 접하는 것이다.  
 
인공지능은 전문가는 다양한 알고리즘을 자기의 것으로 내재화했을 때 만들어진다. 인공지능 전문가들을 꿈꾸는 이들에게 많은 논문을 읽고 다양한 관련 학회나 발표회에 참가할 것을 주문하는 이유다.  
 
차이나랩 이승환
AD
온라인 구독신청 지면 구독신청

중앙일보 핫 클릭

PHOTO & VIDEO

shpping&life

뉴스레터 보기

김민석의 Mr. 밀리터리 군사안보연구소

군사안보연구소는 중앙일보의 군사안보분야 전문 연구기관입니다.
군사안보연구소는 2016년 10월 1일 중앙일보 홈페이지 조인스(news.joins.com)에 문을 연 ‘김민석의 Mr. 밀리터리’(news.joins.com/mm)를 운영하며 디지털 환경에 특화된 군사ㆍ안보ㆍ무기에 관한 콘텐트를 만들고 있습니다.

연구소 사람들
김민석 소장 : kimseok@joongang.co.kr (02-751-5511)
국방연구원 전력발전연구부ㆍ군비통제센터를 거쳐 1994년 중앙일보에 입사한 국내 첫 군사전문기자다. 국방부를 출입한 뒤 최장수 국방부 대변인(2010~2016년)으로 활동했다. 현재는 군사안보전문기자 겸 논설위원으로 한반도 군사와 안보문제를 깊게 파헤치는 글을 쓰고 있다.

오영환 부소장 : oh.younghwan@joongang.co.kr (02-751-5515)
1988년 중앙일보 입사 이래 북한 문제와 양자 외교 관계를 비롯한 외교안보 현안을 오래 다뤘다. 편집국 외교안보부장ㆍ국제부장과 논설위원ㆍ도쿄총국장을 거쳤고 하버드대 국제문제연구소(WCFIA) 펠로우를 지냈다. 부소장 겸 논설위원으로 외교안보 이슈를 추적하고 있다.

박용한 연구위원 : park.yonghan@joongang.co.kr (02-751-5516)
‘북한의 급변사태와 안정화 전략’을 주제로 북한학 박사를 받았다. 국방연구원 안보전략연구센터ㆍ군사기획연구센터와 고려대학교 아세아문제연구소 북한연구센터에서 군사ㆍ안보ㆍ북한을 연구했다. 2016년부터는 중앙일보에서 군사ㆍ안보 분야 취재를 한다.