와이즈넛은 유클리드소프트, 딥네츄럴, 포티투마루와 함께 컨소시엄을 구축해 텍스트 요약을 위한 인공지능 학습데이터 구축 사업을 진행한다. 총 사업비는 42억 5000만원 규모다.
이번 과제는 뉴스, 보도자료, 회의록과 방송 다큐멘터리, 드라마, 예능 방송 등 주요 내용을 간결하게 정리·요약하여, 양질의 학습데이터 확보 및 요약 모델 구축을 목표로 하고 있다.
와이즈넛은 지난 20여년간 자연어 이해 및 처리 기술을 자체 개발하며 보유해 온 한국어 기반 BART, T5 등 Transformer기반의 최신 사전학습 언어모델을 토대로 요약 모델을 개발할 예정이다.
최종적으로 구축된 학습데이터와 요약 모델은 모두 AI Hub를 통해 공개되며, 관련 분야 전문가 및 일반인 누구나 활용 가능하다.
한경닷컴 뉴스룸 open@hankyung.com
관련뉴스