데이터드리븐, 교육분야 Edu-BERT 문자생성 인공지능 개발

입력 2022-03-04 09:21  

데이터드리븐이 교육분야 자연어처리 모델 Edu-BERT와 GPT2를 활용한 인공지능 문장생성 모델의 개발을 완료한 것으로 알려졌다.

2018년 11월 구글이 발표한 언어모델 BERT(Bidirectional Encoder Representations from Transformers)에서 교육 도메인 특성을 반영해 재학습한 언어재현표현 모델인 Edu-BERT는 기존 한국어 모델의 경우 사용한 단어의 특성이 달라 교육 분야 활용을 위해서 추가 데이터를 수집하고 학습을 진행해야했던 제약을 극복할 수 있도록 개발됐다.

데이터드리븐은 2019년부터 2021년까지 교육분야 사업을 진행하며 수집한 ‘교육 활동 기록 데이터’를 형태소 단위로 분리하고 Attention & Doc2Vec Network를 통해 교육적인 의미가 강한 단어의 가중치를 조정하여 Edu-BERT를 구성했다. 해당 모델을 활용하여 한국지능정보사회진흥원이 주관하는 2021년 인공지능 학습용 데이터 구축 사업의 ‘텍스트 기반 학생 청소년 핵심역량분석 모델’ 개발에 기여한 바 있다.

또한, Edu-BERT와 GPT2를 결합시켜 개발한 교육 분야 인공지능 모델인 문장생성 모델을 개발, 교수자가 학습자를 관찰하는 다양한 기준의 지표에서 상세한 서술을 생성하는 기능을 수행하고 교수자의 관점과 판단의 방향성을 유지한 채로 문장을 생성해 수업 기록 업무대 대한 부담을 경감시켰다.

김기범 데이터드리븐 부사장은 “이번에 개발한 모델을 활용한 서비스 확장을 통해 더 많은 데이터를 수집하고 인공지능 성능을 고도화 할 수 있는 선순환 구조를 구축 중이다. 2022년 대규모 교육 데이터 추가 수집을 진행하여 더 많은 영역에 적용할 수 있는 인공지능 모델과 서비스를 개발할 계획이다”고 밝혔다.

한국경제TV    김원기  기자

 kaki1736@wowtv.co.kr

관련뉴스

    top
    • 마이핀
    • 와우캐시
    • 고객센터
    • 페이스 북
    • 유튜브
    • 카카오페이지

    마이핀

    와우캐시

    와우넷에서 실제 현금과
    동일하게 사용되는 사이버머니
    캐시충전
    서비스 상품
    월정액 서비스
    GOLD 한국경제 TV 실시간 방송
    GOLD PLUS 골드서비스 + VOD 주식강좌
    파트너 방송 파트너방송 + 녹화방송 + 회원전용게시판
    +SMS증권정보 + 골드플러스 서비스

    고객센터

    강연회·행사 더보기

    7일간 등록된 일정이 없습니다.

    이벤트

    7일간 등록된 일정이 없습니다.

    공지사항 더보기

    open
    핀(구독)!