최근 구인·구직 플랫폼에 올라온 ‘알바’ 구인 글이다. 한 문장으로 요약하면 수상쩍어 보이지만 정부와 국내 유망 스타트업이 함께 진행 중인 인공지능(AI) 프로젝트의 일환이다.
과학기술정보통신부는 한국지능정보사회진흥원(NIA)과 ‘2022년 AI 학습용 데이터 구축 사업’을 진행 중이다. 시간 흐름에 따른 인간의 외모 변화를 AI가 학습하게 하는 것이 사업 목표 중 하나다. 이를 위해 동일인의 연령대별 사진 70장씩을 모으고 있다.
이번 사업엔 AI 이미지 처리 기업인 딥핑소스와 알체라가 참여한다. 네이버 손자기업인 알체라는 총 1000명으로부터 사진 7만 장을 확보하는 것을 목표로 삼았다. 유의미한 데이터를 갖추기 위해 과도한 성형 시술을 한 사람의 사진, 얼굴이 가려진 사진 등은 받지 않기로 했다.
돈을 보상으로 건 데엔 이유가 있다. 인간처럼 스스로 인지하고 이해하는 AI를 제대로 구축하기 위해선 최소 수십만 건의 학습용 데이터가 필요하다. 하지만 이를 마련하긴 쉽지 않다. 얼굴 사진 등 개인의 사적 정보는 정부나 기업이 무차별 수집할 수 없어서다.
미국 독일 일본 등 기술 선도국도 AI용 데이터 확보에 애를 먹고 있다.
선한결 기자 always@hankyung.com
관련뉴스