수업·발표·통화녹음 등 간편하게 텍스트 변환
(서울=연합뉴스) 장우리 기자 = 최근 복잡한 발표 내용이나 대화를 실시간으로 받아써 주는 인공지능(AI) 음성 인식 서비스가 인기를 끌고 있다.
코로나19 상황 장기화로 화상회의 등 원격 업무가 잦아지면서 직장인 이용자들도 대폭 늘어나는 추세다.
20일 IT업계에 따르면 국내 AI 음성인식 서비스의 선두주자인 네이버는 지난해 12월 '클로바노트'를 출시했다.
클로바노트는 수업 필기나 회의록 작성, 통화 내역·상담 기록 관리 등 다양한 상황에서 활용할 수 있는 앱으로 이달 초 이미 누적 다운로드 80만건을 돌파했다.
지난달 월간 사용자 수(MAU)는 27만명, 가입자 수는 70만명을 넘어서며 올 1월 대비 각각 4.6배, 9.5배 증가했다.
클로바노트에서는 긴 문장 인식은 물론 참석자별 음성 차이를 구분해 대화 형태로 기록도 가능하다. 최근에는 글로벌 시장을 의식해 영어와 일본어 변환 서비스도 추가됐다.
스타트업들도 음성 기록 시장에 활발히 나서고 있다.
리턴제로의 앱 '비토'는 통화 음성을 메신저 대화처럼 말풍선에 담아 보여주는 게 특징이다.
지난해 4월 출시돼 전화 업무가 잦은 영업직이나 음성 통화가 어려운 청각장애인 사이에서 화제가 됐다.
최근에는 사람의 육성과 ARS(자동응답시스템) 음성을 구별하는 기술이 탑재됐으며, 추임새를 걸러내고 대화를 요약하는 기능 등이 앞으로 추가될 예정이다.
비토는 "서비스를 운영하면서 확보한 한국어 음성 빅데이터가 AI 학습에 활용돼 기술을 정교화하고 음성 인식률을 높였다"고 설명했다.
유튜브 등 동영상 플랫폼 이용자가 늘어나면서 영상 편집 시 자동으로 자막을 달아주는 서비스도 생겼다.
보이저엑스의 영상 편집 프로그램 '브루'는 영상 속 음성을 자동으로 인식해 자막으로 바꿔 준다.
영상을 돌려보며 일일이 자막을 붙이는 과정을 생략할 수 있어 유튜버들로부터 편집 시간을 줄여줬다는 평가를 받고 있다.
업계 관계자는 "음성인식·문자 변환 기술은 한참 전부터 존재했지만, 딥러닝과 같은 AI 기술이 등장하면서 품질이 획기적으로 향상됐다"며 "데이터가 쌓일수록 AI 엔진이 정교해지는 만큼 적용 분야도 늘어날 것으로 기대된다"고 말했다.
iroowj@yna.co.kr
(끝)
<저작권자(c) 연합뉴스, 무단 전재-재배포 금지>
관련뉴스