preLoad Image preLoad Image
검색 바로가기
주메뉴 바로가기
주요 기사 바로가기
다른 기사, 광고영역 바로가기
중앙일보 사이트맵 바로가기
닫기
닫기

이메일 받기를 하시면 기사 업데이트
메일로 확인 할 수 있습니다.

“대통령기록관·삼성도 우리 고객”

약 12,000,000,000장. 국내에서 1년간 대외거래용으로 쓰는 종이문서는 120억장에 달한다. A4 종이를 가로로 이어 붙이면 지구 89바퀴를 돌 수 있는 분량이다. 상당수 공식 문서가 전자파일로 보관되는 디지털 시대에 여전히 이렇게 많은 종이문서가 소비되는 이유는 법적 효력 때문이다. 관련 법령에 따라 전자문서는 특정 조건에서만 법률적 효력을 가지는 공식 문서로 인정되다보니, 종이로 출력해서 보관해야하는 서류가 줄어들기 어려웠다. 
 

AI 기반 문서 전자화 ‘악어디지털’
갈긴 손글씨도 AI가 디지털 변환
작년 1억2000만장 작업 89억 매출
“독서 즐겨 책 스캔하다 아예 창업”

전자문서법 개정…서류창고가사라진다

그런데 이 규제가 풀리게 됐다. 지난 2일 국무회의를 통과한 '전자문서 및 전자거래 기본법 개정안'에 따르면 앞으로는 스캔 문서 등도 종이문서와 동일한 법적 효력을 갖게 된다. 과거 전자문서는 e메일 등 특정 조건을 만족하는 경우에만 효력이 인정됐다. 개정안은 금지 규정만 아니면 전자문서의 서면 효력을 인정한다. 기업과 기관이 서류 창고와 관리 인력을 늘려가며 울며 겨자먹기 식으로 종이문서를 이중 보관할 필요가 없어진 것이다.
 
국내 최초로 인공지능(AI) 기반 문서 전자화 서비스를 시작한 '악어디지털'은 개정안 통과를 누구보다 반겼다. 김용섭(43) 악어디지털 대표는 지난 24일 중앙일보와 인터뷰에서 "우리가 만들어주는 '전자화 문서'가 법적 효력이 있는지 기관과 기업별로 해석이 달라 설득하는 데 많은 시간과 비용이 들었다"며 "이제는 그럴 필요가 없어졌다"며 환영의 뜻을 비쳤다.
 
김용섭 악어디지털 대표 [사진 악어디지털]

김용섭 악어디지털 대표 [사진 악어디지털]

물 만난 악어

악어디지털은 자체 개발한 AI OCR(글자 인식) 기술을 통해 종이문서를 전자 열람·검색이 가능한 전자문서로 변환해주는 기술을 보유했다. 문서 수거부터 스캔, 전자화 이후 원본 보관 또는 파기까지 '원스톱'으로 제공한다.
 
지난해 이 회사가 전자화한 문서는 1억 2000만장에 달한다. 주요 고객사 중엔 대통령기록관·감사원·검찰·국회도서관 등 공공기관과 삼성바이오로직스·삼성SDS·삼정KPMG 등 대기업이 포진해있다. 김 대표는 "스캔 전문기업, OCR 기업 등 분야별 경쟁자는 있어도 이 모든 것을 통합한 기술과 노하우를 갖춘 곳은 우리가 국내에서 유일하기 때문"이라고 설명했다.
 
종이 문서가 전자 문서로 변환되는 과정. [사진=악어디지털, 편집=김정민 기자]

종이 문서가 전자 문서로 변환되는 과정. [사진=악어디지털, 편집=김정민 기자]

네이버 뛰쳐나온 개발자, '악어의 자세'로 창업 

김용섭 대표는 보안 전문 개발자였다. 첫 직장이던 시큐어소프트에선 공인인증 솔루션을 개발했고 이후 2004년부터 보안소프트웨어 기업 안랩에서 4년을, 다시 네이버에서 2007년부터 7년을 일했다.
 
유명 IT 기업에서 이력을 쌓으면서도 창업의 꿈을 키웠다. 시작은 취미로 하던 독서였다. 일본에서 네이버 현지 주재원으로 근무할 땐 잦은 출장으로 책을 들고 다닐 수 없게 되자 직접 스캔본을 만든 게 계기가 됐다. 태블릿PC가 막 출시돼 전자책(e북)이 활성화되기 전이었다. 번거로운 스캔을 '누가 대신 해주면 좋겠다'는 생각이 창업으로 이어졌다. 네이버를 퇴사하고 2014년 초기자금 1억 5000만원을 들여 회사를 세웠다.
 
독특한 사명은 효율성을 중시하는 악어의 습성에서 따왔다. 김 대표는 "먹잇감을 발견할 때까지 움직임을 최소화하는 악어의 효율적인 면과 혹한기에도 죽지 않는 강인한 생명력을 본받고자 지은 이름"이라며 "종이문서가 유발하는 비효율적인 단순 반복 업무를 악어의 자세로 개선하겠다는 의미"라고 말했다.
 
식성·서식지 선정이 까다롭지 않고 막강한 면역력을 갖춘 악어는 2억년 넘게 살아남았다. [중앙포토]

식성·서식지 선정이 까다롭지 않고 막강한 면역력을 갖춘 악어는 2억년 넘게 살아남았다. [중앙포토]

B2G 키우며 3년새 자산 100배

회사가 큰 전환점을 맞은 건 2018년. 대(對)정부 영업력을 갖춘 문서보관업체 '문서지기'를 인수하며 공공부문 고객을 대량 확보했다. 40평 규모의 사무실도 지난해 크게 확대했다. 980평짜리 용인 디지털센터와 3000평짜리 덕평 문서 보관시설이 완공되면서 대규모 사업을 수주할 수 있게 됐다.
 
지난해부턴 맞춤형 업무 자동화(RPA) 서비스도 시작했다. 예컨대 세무법인이 고객사라면, 물류업체들이 보내온 수기 세금계산서를 전자문서화한 뒤 국세청 신고까지 자동으로 넣어주는 식이다.
 
2017년 5억원에 불과했던 매출은 지난해 89억원을 기록했다. 같은 기간 자산규모도 100배 늘어 170억원이 됐다. 2015년부터 현재까지 받은 누적 투자액은 96억원이다. 김 대표는 올해 매출을 100억원 이상, 내년 매출을 200억원 이상으로 예상하고 있다.
 

필기체·전문용어도 척척…AI 문자 판독

악어디지털의 핵심 기술은 AI OCR 엔진이다. 이 엔진이 문자를 인식하는 정확도는 99%. ㅎ을 ㄹ처럼 흘려 쓴 필기체나 수십년 전 설계도에 흐릿하게 적힌 손글씨도 맥락에 맞게 읽어낸다. 김 대표는 "자체 개발한 2~3개의 인공 신경망 Ai를 동시에 돌려 오차를 보완한다"며 "사람으로 치면 전문 인력 여럿이 함께 판독하며 오류를 줄이는 구조"라고 설명했다.
 
그는 이어 "알파벳 24글자만 학습시키면 되는 영문과 달리 한글은 기본 조합만 2450자가 넘는다. 필기체까지 판독하려면 산업별로 각종 데이터를 다뤄본 경험이 중요하다"고 밝혔다.
 
자연어 교정 기능을 적용한 악어디지털의 AI 필기체 인식 기술 [사진 악어디지털]

자연어 교정 기능을 적용한 악어디지털의 AI 필기체 인식 기술 [사진 악어디지털]

 
실제 이 회사의 정교한 AI 기술 뒤에는 6년간 축적해온 고객사 300여 곳의 방대한 데이터가 있다. 국가별 양식이 제각각인 무역업 문서부터 전문 용어가 난무하는 바이오업계 문서, 오래된 국가 기록물을 판독해 본 경험 등이 모두 엔진 고도화에 도움이 됐다고 한다. 현재는 복잡한 도표나 초서체·해서체가 쓰인 고문서, 일제강점기 타자기 기록물 등도 어려움 없이 전자화할 수 있는 수준이다.
 

"네이버·구글 넘는 기록물 기업될 것"

과학기술정보통신부 등은 전자문서 활성화로 창출될 국내 신규 시장을 약 6000억원 규모로 보고 있다. 일찍이 자리잡은 해외 전자문서 시장의 규모는 이보다 훨씬 크다. 미국의 대표 정보관리기업 '아이언 마운틴' 한 곳이 올리는 연 매출만 4조원 수준이다.
 
2005년부터 전자문서에 종이문서와 동일한 법적 지위를 부여한 일본의 시장규모는 약 1조~1조 4000억원이다. 악어디지털은 2017년 일본 자회사 스티카(STIICA)를 설립, 일본어 인식 기술을 고도화한 뒤 지난해 200평 규모 사업장 마련을 마쳤다. 일본 내 단일사업장으론 최대 규모다. 신종 코로나바이러스(코로나19)가 지나가는대로 RPA 사업을 확대한다는 계획이다.
 
김 대표는 "기록물 분야에서 네이버·구글을 뛰어넘어 아시아 최대, 최고가 되는 것이 목표"라며 "네이버나 구글은 보지 못하는 다양한 문서를 취급하고 분석해왔기 때문에 충분히 가능하다"고 당찬 포부를 밝혔다.
 

한국의 실리콘밸리, 판교

김정민 기자 kim.jungmin4@joongang.co.kr 
온라인 구독신청 지면 구독신청

한국의 실리콘밸리, 판교

이메일 받기를 하시면
기사 업데이트 시 메일로 확인 할 수 있습니다.

다른 기자들의 연재 기사 보기

지면보다 빠른 뉴스

디지털에서만 만날 수 있는 중앙일보 뉴스