음성인식 기기·자동통번역 등 토종기술 다국어 개발 활용
한국전자통신연구원(ETRI)은 독일어·러시아어·아랍어·베트남어의 대화체 언어음성 데이터베이스(DB)를 구축, 음성인식·언어번역 분야 SW 개발 등에 활용할 수 있도록 산업체·학계 등에 배포한다고 30일 밝혔다.
언어음성 DB에는 4개국어 대화체 음성DB 약 36만 문장과 각 외국어의 한국어 대역문장 5만 개씩 20만 문장이 담겨 있다.
언어음성 DB는 음성인식 분야와 언어번역 분야의 SW 개발이나 음성언어처리 연구의 기초데이터로 사용되며 음성언어 SW는 태블릿 PC나 내비게이션, 스마트폰, 전자사전, 지능형로봇 분야 등에 활용되고 있다.
ETRI는 이번에 배포하는 다국어 음성DB가 앞으로 해당 언어 지역권에 수출되는에어컨, TV 리모컨, 내비게이션 등에 음성인식 SW를 장착하는 데 활용돼 관련 상품수출에 기여할 것으로 내다보고 있다.
또 최근 국내 업체와 애플, 구글 등 세계적 기업 사이에 벌어지고 있는 인공지능, 사물인터넷(IoT), 지능형 로봇, 자율주행 자동차, 스마트TV 등 스마트 인터페이스 분야에서도 다국어 음성DB가 외국 기술의 잠식을 차단하는 데 큰 역할을 할 것으로 연구진은 기대하고 있다.
음성DB를 이용한 상용제품은 국내 DB가 없으면 외국에서 개발된 음성인식 및 번역 엔진을 도입해 탑재해야 하기 때문에 큰 비용이 들고 관련 기술 발전에도 걸림돌이 된다.
유럽언어자원협회(ELRA) 등 해외에서 살 수 있는 일부 외국어 DB는 300∼500명이 참여한 제품의 경우 1억∼2억원 정도가 필요하지만 ETRI가 제공하는 4개국어 음성DB는 참여 인원수가 2천400명에 달하면서도 해외DB의 5∼10% 수준 가격으로 중소기업에 제공된다.
ETRI는 2011년부터 한·영·일·중 등 다국어 언어음성DB를 구축하고 57개 기관에 247개 DB를 배포, 430억원 상당의 비용 절감 성과를 얻었다며 이번에 배포하는 4개 국어 언어음성 DB를 10개 기관에 배포할 경우 최소 120억원의 수입대체효과를 얻을 수 있다고 밝혔다.
ETRI 자동통역연구실 이영직 박사는 "ETRI 음성DB는 국가DB사업에서 요구하는고품질 수준으로 국가지정 감리업체 검사에서 합격했다"며 "이 DB를 활용하면 언어음성기술의 완성도를 높일 수 있어 신규시장 창출과 국제경쟁력 강화에도 기여할 것"이라고 말했다.
scitech@yna.co.kr(끝)<저 작 권 자(c)연 합 뉴 스. 무 단 전 재-재 배 포 금 지.>
한국전자통신연구원(ETRI)은 독일어·러시아어·아랍어·베트남어의 대화체 언어음성 데이터베이스(DB)를 구축, 음성인식·언어번역 분야 SW 개발 등에 활용할 수 있도록 산업체·학계 등에 배포한다고 30일 밝혔다.
언어음성 DB에는 4개국어 대화체 음성DB 약 36만 문장과 각 외국어의 한국어 대역문장 5만 개씩 20만 문장이 담겨 있다.
언어음성 DB는 음성인식 분야와 언어번역 분야의 SW 개발이나 음성언어처리 연구의 기초데이터로 사용되며 음성언어 SW는 태블릿 PC나 내비게이션, 스마트폰, 전자사전, 지능형로봇 분야 등에 활용되고 있다.
ETRI는 이번에 배포하는 다국어 음성DB가 앞으로 해당 언어 지역권에 수출되는에어컨, TV 리모컨, 내비게이션 등에 음성인식 SW를 장착하는 데 활용돼 관련 상품수출에 기여할 것으로 내다보고 있다.
또 최근 국내 업체와 애플, 구글 등 세계적 기업 사이에 벌어지고 있는 인공지능, 사물인터넷(IoT), 지능형 로봇, 자율주행 자동차, 스마트TV 등 스마트 인터페이스 분야에서도 다국어 음성DB가 외국 기술의 잠식을 차단하는 데 큰 역할을 할 것으로 연구진은 기대하고 있다.
음성DB를 이용한 상용제품은 국내 DB가 없으면 외국에서 개발된 음성인식 및 번역 엔진을 도입해 탑재해야 하기 때문에 큰 비용이 들고 관련 기술 발전에도 걸림돌이 된다.
유럽언어자원협회(ELRA) 등 해외에서 살 수 있는 일부 외국어 DB는 300∼500명이 참여한 제품의 경우 1억∼2억원 정도가 필요하지만 ETRI가 제공하는 4개국어 음성DB는 참여 인원수가 2천400명에 달하면서도 해외DB의 5∼10% 수준 가격으로 중소기업에 제공된다.
ETRI는 2011년부터 한·영·일·중 등 다국어 언어음성DB를 구축하고 57개 기관에 247개 DB를 배포, 430억원 상당의 비용 절감 성과를 얻었다며 이번에 배포하는 4개 국어 언어음성 DB를 10개 기관에 배포할 경우 최소 120억원의 수입대체효과를 얻을 수 있다고 밝혔다.
ETRI 자동통역연구실 이영직 박사는 "ETRI 음성DB는 국가DB사업에서 요구하는고품질 수준으로 국가지정 감리업체 검사에서 합격했다"며 "이 DB를 활용하면 언어음성기술의 완성도를 높일 수 있어 신규시장 창출과 국제경쟁력 강화에도 기여할 것"이라고 말했다.
scitech@yna.co.kr(끝)<저 작 권 자(c)연 합 뉴 스. 무 단 전 재-재 배 포 금 지.>