소강춘 국립국어원장 "인공지능에 활용할 말뭉치 구축에 내년 200억원 투입"

입력 2018-12-06 15:41   수정 2018-12-06 15:43


“200억원의 예산을 투입해 현재 2억 어절인 말뭉치를 내년 10억 어절까지 늘려가겠습니다.”

소강춘 국립국어원장은 6일 서울 광화문 한 식당에서 기자간담회를 갖고 인공지능(AI) 관련 서비스 개발의 기반이 되는 말뭉치 구축 계획을 설명했다. 1989년부터 전주대 국어교육과 교수로 재직해온 소 원장은 지난 8월 국립국어원장으로 취임했다.

말뭉치란 텍스트를 컴퓨터가 읽을 수 있는 형태로 수집하고 분류해 놓은 언어 자료를 말한다. 말뭉치 구축을 위해서는 텍스트의 저작권 계약을 비롯해 각 단어가 쓰인 맥락을 파악하고 형태소별로 구별해 컴퓨터에 인식될 수 있도록 태그 작업을 해야 한다.

정부는 1998년 ‘21세기 세종계획’으로 말뭉치 구축에 나섰다. 2007년까지 2억 어절을 확보했지만 이후 10년 간 예산 지원이 끊기면서 중단됐다. 하지만 알파고 같은 AI의 학습 기능이 부각되고 아마존이 음성인식 스피커 ‘알렉사’를 내놓으면서 말뭉치의 중요성이 다시 주목받기 시작했다. 연간 예산이 140억원 남짓인 국립국어원에 내년 말뭉치 관련 예산만 별도로 204억원이 확정된 이유다. 소 원장은 “학습된 말뭉치의 양이 많을수록 기계는 똑똑해진다”며 “10억 어절을 확보해도 미국(3000억 어절)뿐 아니라 중국(300억~800억 어절)이나 일본(150억 어절)에 미치려면 갈 길이 멀다”고 말했다. 국립국어원은 향후 10년 간 150억 어절의 말뭉치를 구축한다는 중장기 계획을 세워뒀다. 소 원장은 “언어는 계속 변화하고 새로 생긴다”며 “일회성이 아니라 꾸준히 작업을 지속해가야 한다”고 말했다.

소 원장은 말뭉치 구축뿐 아니라 국어대사전을 보완하고 어려운 공공기관의 용어들을 다듬는 작업도 해 나갈 방침이다. 겨레말큰사전 편찬을 지원하고 내년 10월엔 2009년 이후 중단됐던 남북 공동 국제학술회의도 여는 등 남북 언어 통합을 위한 작업들도 추진할 예정이다. 소 원장은 “언어 통합은 중요한 문제지만 남북 교류 상황을 고려하고 관게 부처와의 협의도 필요하다”며 “미세한 부분부터 조정해갈 것이 많다”고 말했다.

윤정현 기자 hit@hankyung.com



관련뉴스

    top
    • 마이핀
    • 와우캐시
    • 고객센터
    • 페이스 북
    • 유튜브
    • 카카오페이지

    마이핀

    와우캐시

    와우넷에서 실제 현금과
    동일하게 사용되는 사이버머니
    캐시충전
    서비스 상품
    월정액 서비스
    GOLD 한국경제 TV 실시간 방송
    GOLD PLUS 골드서비스 + VOD 주식강좌
    파트너 방송 파트너방송 + 녹화방송 + 회원전용게시판
    +SMS증권정보 + 골드플러스 서비스

    고객센터

    강연회·행사 더보기

    7일간 등록된 일정이 없습니다.

    이벤트

    7일간 등록된 일정이 없습니다.

    공지사항 더보기

    open
    핀(구독)!