국립과학수사연구원은 그동안 러시아와 영국이 개발한 음성분석 모델을 보이스피싱 수사(범죄자 음성감정)에 활용해왔다. 하지만 외국어로 학습된 음성분석 모델 특성상 한국어를 사용하는 범죄자 판별에 한계가 있었고, 여러 사건에 중복 연루된 범죄자들을 분별해내는 데도 애로를 겪었다.
이번에 개발된 음성분석 모델은 AI 딥러닝 기술을 적용해 국내외 6000여 명으로부터 추출한 100만 개 이상의 외국어와 한국어 음성 데이터를 학습했다. 한국어의 경우 국과수가 보유 중인 실제 보이스피싱 사기범의 음성 데이터와 10만 개 이상의 일반인 음성 데이터를 활용해 다양한 학습 과정과 성능 검증 과정을 반복 시행했다. 정확도 검증 결과 범죄자의 음성을 정확하게 판별해내는 판독률이 기존 외국산 분석 모델 대비 77% 향상된 것으로 나타났다.
세계에서 처음으로 범죄가담자를 그룹화하는 기능도 구현했다. 이 기능은 사건별로 범죄자의 목소리를 연쇄 비교해 동일 가담자의 음성 데이터를 식별하는 것은 물론 함께 활동하는 범죄자들을 그룹으로 묶어준다. 국과수는 새 모델을 이달 말부터 보이스피싱 사기범 목소리 감정에 활용할 방침이다.
이정호 기자 dolph@hankyung.com
관련뉴스