신조어·전문용어 93만 단어 수록
(서울=연합뉴스) 임화섭 기자 = 한국정보화진흥원(NIA·원장 서병조)은 빅데이터 관련 서비스 개발을 지원하기 위해 '형태소(形態素) 사전'을 제작해 오픈소스로 개방한다고 21일 밝혔다.
형태소는 의미를 지닌 가장 작은 말의 단위로, 한국어 텍스트 분석을 통해 다양한 의미를 추출하기 위해서는 이를 담은 사전이 필수다.
93만 단어를 담은 NIA의 형태소 사전 'NIADic'은 국립국어원의 우리말 샘 사전을 바탕으로 제작된 것으로, 전부터 쓰이던 '세종Dic'(9만 단어)에 신조어와 법률·의료 등 6대 분야별 전문단어를 추가해 빈도수·연관분석 측면에서 의미있는 데이터 분석이 가능해졌다.
NIA는 형태소사전을 빅데이터센터(www.kbig.kr)를 통해 공개하고, 중소기업, 연구자, 일반인 등이 쉽게 분석·활용할 수 있도록 했다.
solatido@yna.co.kr
(끝)
<저작권자(c) 연합뉴스, 무단 전재-재배포 금지>
관련뉴스