개체식별 데이터 구축사업으로 빅데이터 활용 높인다

입력 2014-06-02 11:35  

접근을 통해 막강해진 개인, 폭증하는 정보, 빨라진 변화대응 등 복잡한 환경에 대응해야 할 입장에 처했다. 이런 가운데 빅데이터 분석의 선결 과제인 비정형 텍스트 데이터 정형화 및 데이터 식별 관련하여 주목되는 사업을 연이어 수주한 회사가 있어 화제다.

지난해 안행부 ‘빅데이터 공통기반 및 시범과제 구축’ 사업에 참여하여 성공적으로 수행한 ㈜오픈SNS(대표이사 배복태)는 대법원 ‘민사 판결서 공개시스템 구축’ 사업과 한국과학기술정보연구원(이하 KISTI)의 ‘과학기술 콘텐츠 고부가가치화를 위한 개체식별 데이터 구축’사업(이하 개체 식별 사업’)을 잇따라 수주했다고 밝혔다.

대법원 ‘민사 판결서 공개시스템 구축’사업은 오픈SNS가 지난 2010년부터 이미지 PDF 판결서와 HWP 형사 사건 판결서를 대상으로 ‘자동 익명화 기술’을 적용하여 구축해 온 시스템의 연장선에서 수주한 사업이다. 여기서 ‘자동 익명화 기술’이란 판결서 등에 기재되어 있는 주민번호, 차량번호, 카드번호뿐만 아니라 사건 당사자 및 관계자의 성명과 별명, 이해관계가 엮여 있는 범죄 발생 장소의 명칭, 주소 등을 식별기호로 대체하여 실명을 파악할 수 없도록 자동으로 변화해 주는 기술을 말한다.

특히나 판결서의 경우 1심에서 3심까지 사건 당사자들의 일관성 유지가 필수적이므로 각 심급별 익명화 대상 정보에 대한 일관성 있는 자동화 처리가 필수적이다. 또한 이와 같은 자동 익명화 기술은 향후 더욱 빈번해질 것으로 예상되는 공공 기관의 정보 공개 요청 시의 개인 정보 보호 요구에 대한 기술적인 대응책이 될 것으로 생각된다.

한편 KISTI의 ‘개체 식별 사업’은 국내외 논문의 저자, 발행기관 및 주요 키워드를 중심으로 특허, 연구보고서의 저자 및 소속 기관, 주요 키워드 등을 자동으로 식별하여 동명이인 및 이형동인에 대한 정보의 정확성을 높이는 것을 주요 골자로 하는 사업이다. 이 사업의 의의는 산재한 비정형 텍스트 정보로부터 정확한 정보를 찾을 수 있는 기반을 제공하는 데 있으며, 주요 적용 기술로는 비정형 텍스트 데이터의 정형화 가공 처리 기술과 클러스터링 기반의 개체 식별 기술 등이 있다.

㈜오픈SNS 관계자는 “서로 달라 뵈는 두 가지 사업은 빅데이터 사업의 난제 중 하나인 비정형 텍스트의 가공이라는 측면에서 일맥상통하는 기술”이라며, “이번 오픈에스앤에스가 출시한 빅데이터 관리솔루션인 HEMON(헤몬)과 더불어 향후 빅데이터 관련 사업의 성패에 중요한 영향을 미칠 것으로 예상된다”고 밝혔다



[한경스타워즈] 증권사를 대표하는 상위권 수익률의 합이 110%돌파!! 그 비결은?
[한경닷컴 스탁론] 최저금리 3.5% 대출기간 6개월 금리 이벤트!
[한경컨센서스] 국내 증권사의 리포트를 한 곳에서 확인




[한경+ 구독신청] [기사구매] [모바일앱]  ⓒ '성공을 부르는 습관' 한경닷컴, 무단 전재 및 재배포 금지

관련뉴스

    top
    • 마이핀
    • 와우캐시
    • 고객센터
    • 페이스 북
    • 유튜브
    • 카카오페이지

    마이핀

    와우캐시

    와우넷에서 실제 현금과
    동일하게 사용되는 사이버머니
    캐시충전
    서비스 상품
    월정액 서비스
    GOLD 한국경제 TV 실시간 방송
    GOLD PLUS 골드서비스 + VOD 주식강좌
    파트너 방송 파트너방송 + 녹화방송 + 회원전용게시판
    +SMS증권정보 + 골드플러스 서비스

    고객센터

    강연회·행사 더보기

    7일간 등록된 일정이 없습니다.

    이벤트

    7일간 등록된 일정이 없습니다.

    공지사항 더보기

    open
    핀(구독)!