네이버클라우드, 원하는 정보만 추출하는 '클로바 도큐먼트 OCR' 출시

양현주 기자

입력 2021-03-11 11:18  


네이버 클라우드가 비정형의 업무 문서에서 사용자가 원하는 정보만 추출하는 `클로바 도큐먼트 OCR(CLOVA Document OCR)` 특화 서비스를 출시했다.

`클로바 도큐먼트 OCR` 특화 모델은 클로바 AI 자연어 처리 기술(NLP)로 비정형 문서들을 선행 학습시킨 후 글자 위치, 문서 양식과 관계없이 업무 문서에서 상호, 지점명, 사업자 번호와 같은 주요한 정보만 추출하여 항목별 분류까지 자동으로 도와주는 상품이다.

이번 출시로 영수증, 신용카드, 사업자등록증, 명함, 신분증, 의료비 지출 영수증 등 발급 기관이 상이하거나 위·변조 방지 기술이 적용되어 OCR(광학문자인식) 기술 적용이 까다로웠던 분야에까지 문서 인식이 가능해졌다.

영수증, 의료비 영수증, 사업등록증의 경우 발급 기관마다 형태가 달라 사용자가 희망하는 정보를 자동으로 추출하는 것이 쉽지 않았다.

하지만 `클로바 도큐먼트 OCR`을 통해 인식된 문서에서 정보의 연결 관계를 파악할 수 있어, 텍스트와 숫자 값이 의미하는 바를 정확하게 찾아낼 수 있다.

이와 함께 문자 이미지를 단순히 텍스트로 인식하는 수준을 넘어서 구겨지거나 오염된 각종 서류에서 추출된 텍스트를 AI 기술로 항목별로 자동 기입이 가능해졌다.

명함과 신용카드같이 다양한 형태와 디자인으로 출시되는 문서도 빠르게 인식 가능하다.

특히, 국내의 경우 가로형과 세로형 등 형태가 다양하고 영문, 한자, 기호 등 여러 활자가 인쇄되어 있다.

이렇게 특정하기 어려운 문서에서도 정확하게 필요한 값을 추출할 수 있으며, 해당 기술은 네이버웍스와 리멤버 서비스에도 활용된다.



이 밖에 주민등록증, 운전면허증, 여권과 같은 신분증은 빛 반사가 많고 워터마크나 형광인쇄 등의 위·변조 방지 기술이 적용되어 난이도가 높지만, 뛰어난 성능과 속도로 텍스트 추출이 가능하다.

특히, 신용카드나 주민등록증과 같은 민감정보와 개인 정보를 OCR로 인식할 경우 보안이 더욱 철저하게 요구되기 때문에 도큐먼트 OCR은 사전 신청 절차를 걸쳐 승인을 받은 기업에서만 선별적으로 사용할 수 있다.

안전한 사용을 위한 보안 아키텍처 또한 별도로 안내할 예정이다.

한상영 네이버클라우드 상무는 "산업 군을 막론하고 자동화를 통해 업무를 간소화하는 추세가 이어지면서 OCR의 활용 분야가 다각화되고 비즈니스 현장의 핵심 기술로 자리매김하고 있다"며 "향후 Document OCR 특화 모델을 지속적으로 확장하고 네이버 클라우드 플랫폼의 다른 서비스와 유기적으로 연계한 솔루션을 출시해 네이버클라우드 만이 제공할 수 있는 차별화된 서비스로 혁신을 선도해 나가겠다"고 말했다.

관련뉴스

    top
    • 마이핀
    • 와우캐시
    • 고객센터
    • 페이스 북
    • 유튜브
    • 카카오페이지

    마이핀

    와우캐시

    와우넷에서 실제 현금과
    동일하게 사용되는 사이버머니
    캐시충전
    서비스 상품
    월정액 서비스
    GOLD 한국경제 TV 실시간 방송
    GOLD PLUS 골드서비스 + VOD 주식강좌
    파트너 방송 파트너방송 + 녹화방송 + 회원전용게시판
    +SMS증권정보 + 골드플러스 서비스

    고객센터

    강연회·행사 더보기

    7일간 등록된 일정이 없습니다.

    이벤트

    7일간 등록된 일정이 없습니다.

    공지사항 더보기

    open
    핀(구독)!