이 기사는 프리미엄 스타트업 미디어 플랫폼 한경 긱스에 게재된 기사입니다.
인공지능(AI) 번역은 일상을 바꾼 대표적인 기술로 꼽힌다. 우리는 구글과 네이버(파파고) 덕분에 자료 리서치, 외국인과 대화 등 어렵지 않은 수준의 일상 번역은 어느정도 해결할 수 있게됐다. 데이터가 쌓이고 기술이 고도화되면서 번역의 완성도도 빠르게 높아지고 있다. 번역 앱의 양대산맥인 구글과 네이버뿐 아니라 마이크로소프트(MS), 엔비디아, LG 등 국내외 테크 기업들이 앞다투어 초거대 AI 언어모델을 구축하고 있다. 이 가운데 상대적으로 몸집이 작은 스타트업들은 빅테크 AI 번역이 해결할 수 없는 버티컬(전문) 영역을 구축하며 번역 시장의 틈새를 겨냥하고 있다.
상장까지한 스타트업, 음식점으로 간 까닭
2012년 설립된 플리토(Flitto)는 AI 번역앱의 시대가 열리기 전, 집단지성 번역 플랫폼을 운영했다. 당시 사람들은 번역이 필요할 때 플리토를 찾았다. 설립 8년 만인 2019년 이 집단지성 번역 모델로 특례 상장까지 하며 성공 가도를 이어 갔지만 고민의 시기가 찾아왔다. 대기업들의 초거대 AI 모델이 고도화되면서 단순 '번역'만으로는 회사의 경쟁력을 유지하기 어려워진 것. 회사는 다른 방향을 모색해야 했다.플리토는 전문 번역과 AI 번역이 함께하는 특화 번역 서비스와 '언어 빅데이터 판매'로 사업을 확장해갔다. 최근에는 메뉴판 번역 서비스를 선보였다. 이 서비스는 QR 코드 기반 다국어 번역 서비스로 음식 메뉴판, 관광 안내문 등 번역이 필요한 장소에서 QR코드 스캔만으로 정확한 다국어 번역문을 확인할 수 있도록 한다. 메뉴, 가격 등이 바뀔 때마다 다시 출력해야 하는 책자형 메뉴판에 비해 편의성과 경제성을 제공한다.
메뉴판은 대부분 식자재, 지역명 등 고유명사로 이뤄져 있어 기존의 기계 번역만으로는 해석이 어렵다는 문제가 있었다. 기사, 논문 등 일반적인 텍스트에 비해 음식 메뉴 다국어 데이터의 양은 많지 않았다. 뿐만 아니라 음식 메뉴판은 손글씨로 작성되거나 왼쪽에서 오른쪽으로 읽는 가로형이 아닌 세로형 텍스트 등 기재된 형태가 매우 다양해 데이터 확보에 어려움이 있었다.
데이터가 부족했기에 기계가 번역을 하면 완성도가 낮았고, 그렇다고 사람을 써서 모든 메뉴판에 적힌 텍스트를 하나씩 번역하기는 번거로웠다. 사람과 기계의 협업 프로세스를 갖춘 플리토에게 적합한 분야였다.
플리토는 AI 번역과 사람 번역가의 검수를 통해 정확한 메뉴 번역 서비스 제공하는 게 특징이다. 자체 AI 번역 엔진은 간단하고 반복적인 번역을 맡고, 문화와 맥락 이해가 필요한 번역은 자체 전문번역실에서 근무하는 전문가들이 맡는다. 이 회사의 통합 번역 플랫폼은 AI 번역과 번역가 검수가 함께 진행되는 방식으로 운영된다.
그렇기에 완성도 높은 번역이 가능하다. '돌문어 해물삼합'을 예로들면 파파고는 'Stone Octopus Seafood Samhap'으로 직역한다면 플리토의 메뉴 번역 서비스'Octopus Seafood Samhap (three delicacies)'고 번역하며 정확한 정보를 제공한다.
다국어 메뉴판 서비스는 여의도 ‘더현대서울’의 6층과 지하1층 식당가에 공급되고 있으며 미슐랭 식당인 금돼지식당에도 쓰이고 있다. 이외에도 지방자치단체, 대형쇼핑몰, 다양한 요식업 매장들을 대상으로 서비스를 확장하는 중이다. 영어, 중국어, 일본어, 프랑스어, 아랍어 등의 언어로 제공 가능하다.
고난이도 콘텐츠도 번역 척척
온라인동영상플랫폼(OTT) 사업이 폭발적으로 성장하면서 콘텐츠 현지화 수요 또한 급격히 늘었다. 기존의 번역 인력만으로는 부족해지면서 이들을 돕는 AI 콘텐츠 번역 업체의 존재감도 커지는 추세다.실리콘밸리 기반 스타트업 엑스엘에이트에이아이(XL8 .ai)는 번역을 넘어 번역가를 위한 업무툴을 제공한다. 구글과 애플, 퀄컴의 AI전문가들이 2019년 설립한 이 기업은 지난달 영상 번역툴 미디어캣(MediaCAT)을 공식 출시했다.
미디어캣은 영상을 업로드하면 몇번의 클릭만으로 대사를 추출해 타임코드를 맞추고 대사를 원하는 언어로 번역한뒤 더빙작업까지 지원한다. 전문번역가 개인도 손쉽게 사용할 수 있으며 '인형 눈 붙이기'처럼 단순 반복 작업으로 여겨지던 타임코드 작업을 기계로 대체해 효율성을 대폭 개선했다는 평가를 받고 있다.
회사에 따르면 그간 번역한 영상 콘텐츠 분량은 총 50만 시간을 넘어섰고, 번역한 단어는 24억개, 지원하는 번역 언어쌍의 종류는 총 66개이다. 영상자료를 기반으로 학습해 구어체 번역에 특화됐다는 점도 눈에띈다. 영상 내 대사의 맥락에 따른 번역뿐만 아니라 한국어의 '하세요', '합쇼', '해라' 등의 존중어, 높임말 등 인물 관계도 고려한 번역도 진행한다. 콘텐츠 분야 만큼은 구글, 파파고 등 빅테크가 따라올 수 없는 수준으로 번역하는 셈이다.
정영훈 엑스엘에이트 대표는 “이미 구글이라는 대기업이 진출한 머신번역(MT)에서 스타트업이 어떤 강점을 가질 수 있을까에 대해 연구한 결과 시장 세분화를 통해 사업을 성장시킬 수 있었다”고 언급하기도 했다.
엑스엘에이트 관계자는 "유튜브 채널 EO(이오)와 보이저엑스 등 유력 스타트업, 번역가협회 등 여러 기업 및 단체와 사업 제휴를 논의중"이라며 "번역가들의 '포토샵' 같은 효율적인 툴이 될 것"이라는 포부를 밝혔다.
법률 등 전문분야 학습한 인텔리 AI 등장
텍스트 데이터가 많은 법률 분야에도 AI 번역의 존재감이 두드러지고 있다. 네이버의 투자를 받은 베링랩은 법률?특허 AI 번역 웹서비스를 운영한다. 베링랩은 특정 전문 분야의 데이터를 집중 학습해 해당 분야에서 범용 번역 엔진보다 높은 성능을 자랑한다. 현재 법률, 특허, 기술 분야를 중심으로 사업을 이어가고 있다.웹 서비스와 함께 번역툴 '인텔리캣'(IntelliCAT)도 선보였다. 이 툴은 MS워드 기반의 번역에 비해 시간을 50% 이상 단축할 수 있는 도구로 알려졌다. 법률?특허 분야에서 번역 업무 생산성을 크게 높여줄 수 있으며 관련 논문이 세계 최고 권위의 컴퓨터 언어학 학회 ACL에 채택되기도 했다.
에이아이링고는 AI를 통한 국문 영문 법률 자료 및 판례 번역 서비스를 제공한다. 사람이 작업할 경우 10시간이 소요되는 문서도 1분만에 번역이 가능하다고 한다. 에이아이링고는 개별 로펌이 이용하는 단어를 AI에게 학습시켜 맞춤형 서비스도 지원 중이다. 사용자가 지정한 그룹 내에서만 번역 결과를 볼 수 있고 파일명 또한 암호화돼있어 기밀성을 지킬 수 있다. 소송, 국제중재, M&A, 국제계약 등에 활용될 예정이다.
전문가들은 "언어 데이터는 수집은 쉽지만 데이터를 다듬고 학습 과정이 복잡하다"며 "언어를 다루는 인간의 감정이나 해석이 주관적인만큼 더 섬세하고 다양한 버티컬 번역 AI 기술이 있어야 한다"고 보고있다.
최다은 기자 max@hankyung.com
관련뉴스