과학기술정보통신부는 AI 데이터 품질의 개념과 범위, 세부 요구사항 등을 담은 표준안을 개발하겠다고 5일 발표했다. 이를 한국정보통신기술협회(TTA) 단체표준으로 제안하고, 국제 표준이 될 수 있게 지원하겠다고 했다. 과기정통부 관계자는 “전문가 의견 수렴 절차를 거쳐 표준안을 내년 6월 최종 확정할 것”이라고 말했다.
AI 데이터 품질은 원시데이터 취득→정제→데이터 가공(라벨링)→활용 등 전 단계에서 요구된다. 이번 표준안에서 AI 데이터 품질은 ‘데이터가 정확성, 다양성, 유효성 등을 확보해 사용자에게 유용한 가치를 줄 수 있는 수준’으로 정의됐다.
구체적으로는 △원시데이터 수집의 다양성·사실성 △원시데이터 파일 포맷·해상도 등의 기술 적합성 △정제 단계에서 데이터 중복 방지 및 비식별화 조치 △가공 단계의 분류체계 및 라벨링 규격 △품질 검수 및 활용 유효성 등의 내용이 담겼다.
이승우 기자 leeswoo@hankyung.com
관련뉴스