엔씨·고려대, AI 대화 데이터셋 공개…"외부지식 세계 첫 결합"

입력 2022-04-14 17:42  

엔씨·고려대, AI 대화 데이터셋 공개…"외부지식 세계 첫 결합"


(서울=연합뉴스) 최현석 기자 = 엔씨소프트[036570]는 고려대 임희석 교수 연구팀과 공동연구를 통해 구축한 인공지능(AI) 대화 데이터셋 '포커스 데이터셋(FoCus Dataset)'을 공개했다고 14일 밝혔다.
회사 측 설명에 따르면 이 데이터셋은 사용자 개인의 배경지식인 페르소나(Persona)와 외부 지식을 모두 활용하는 세계 최초의 AI 대화 데이터셋이다. 8천여 개의 광범위한 주제를 다룬 1만5천개 이상 대화로 구성돼 있다.
이 데이터셋을 적용한 AI는 대화하고 있는 사용자의 경험, 선호, 소유, 흥미 등을 파악하고 위키피디아에서 이야기 주제에 대한 최신 지식을 실시간으로 습득해 자연스러운 대화가 가능하다는 것이 회사의 설명이다.
엔씨소프트는 "일반적인 대용량 언어모델은 학습과 추론에 큰 비용이 소요되지만 실시간 지식과 개인 경험을 반영하는 데 한계를 나타내고 있다"며 "포커스 데이터셋은 초거대 언어 모델을 사용하지 않고도 같은 성능의 대화 기술 구현이 가능한 것이 특징"이라고 설명했다.
공동연구팀은 지난 2월 AI 학회 'AAAI 2022'에서 관련 연구 논문을 발표했다.
엔씨소프트는 오는 10월에는 국제전산언어학회인 '콜링(COLING) 2022'에서 데이터 활용 경진 대회와 연구 성과 공유 워크숍을 고려대와 공동 개최한다.
이연수 엔씨 랭귀지AI랩 실장은 "최근 NLP(자연어 처리) 학계에서는 비용, 환경 문제로 초거대 언어모델 기반의 대화 기술에 필적할 수 있는 새로운 대화 기술들이 제안되고 있다"며 "이러한 연구 방향에 공감하는 차원에서 데이터 공개를 결정했으며, 글로벌 연구 커뮤니티에서 활발한 논의와 기술 개발이 이뤄지기를 기대한다"고 말했다.
harrison@yna.co.kr
(끝)


<저작권자(c) 연합뉴스, 무단 전재-재배포 금지>

관련뉴스

    top
    • 마이핀
    • 와우캐시
    • 고객센터
    • 페이스 북
    • 유튜브
    • 카카오페이지

    마이핀

    와우캐시

    와우넷에서 실제 현금과
    동일하게 사용되는 사이버머니
    캐시충전
    서비스 상품
    월정액 서비스
    GOLD 한국경제 TV 실시간 방송
    GOLD PLUS 골드서비스 + VOD 주식강좌
    파트너 방송 파트너방송 + 녹화방송 + 회원전용게시판
    +SMS증권정보 + 골드플러스 서비스

    고객센터

    강연회·행사 더보기

    7일간 등록된 일정이 없습니다.

    이벤트

    7일간 등록된 일정이 없습니다.

    공지사항 더보기

    open
    핀(구독)!