먼저, 전립선암 악성도 분류 기준인 글리슨 등급 및 전립선암 유무 확인에 DeepDx Prostate 성능을 확인하는 외부 검증 연구가 진행됐다.
연구팀은 150개의 전립선 절제술 검체를 500개의 타일로 나눴다. 이후 각 타일 내 종양 비율, 종양의 글리슨 등급 및 글리슨 패턴 4와 5의 비율 구분 항목에 따라 DeepDx Prostate와 두 명의 요로병리학자의 분석 결과를 비교했다.
딥바이오 관계자는 “DeepDx Prostate는 전립선 바늘생검 조직 이미지로 학습된 소프트웨어임에도 전립선 절제술 검체 조직 분석 연구에서 정답과의 유사도를 나타내는 일치도 계수(Cohen’s kappa score) 값이 κ0.79(95% CI 0.75 -0.82)로 나타났다”며 “두 명의 요로병리학자가 합의해 생성한 참조 표준과 전반적으로 높은 일치율을 보였다”고 말했다.
특히 양성과 음성, 저위험과 고위험 전립선암을 분류할 때 각각 κ0.927, κ0.858의 일치도 값을 보여 전문가 수준의 성능을 입증했다는 설명이다.
DeepDx Prostate는 전립선 절제술 검체 내 암 유무를 발견하는 데 있어, 수술 전 자기공명영상(MRI) 검사와 조직병리학 간 일치도를 측정하는 데도 사용됐다. 연구에는 전립선 절제술을 받은 남성 30명의 검체가 사용됐다. 검체 이미지는 3차원(3D) 방식을 사용해 MRI에 등록됐다.
DeepDx Prostate는 종양을 찾아내고 악성도 등급을 책정하는 데 사용됐다. 회사에 따르면 DeepDx Prostate가 종양의 크기와 관계없이 모든 암 영역을 확인하고 악성도를 등급별로 나타냈다. 반면 MRI는 전체 종양의 66%를 잡아내지 못했다. 놓친 부분 중 37%는 임상적으로 유의한 종양이었다는 것이다. ‘어노테이션(annotation)’과 악성도 등급 구분에 걸리는 시간도 크게 단축했다는 설명이다.
김선우 딥바이오 대표는 “세계 최고 회원수를 가진 미국 비뇨기과 학회 학술대회에서 연구 결과가 주목받으며 제픔 성능을 입증할 수 있는 계기가 됐다”며 "인공지능(AI) 기반 암 진단 보조 소프트웨어가 현재 병리학이 직면한 인력 부족 현상 및 병리학자간 진단 불일치를 해결할 수 있는 수단으로 주목받고 있는 만큼 DeepDx Prostate의 성능 강화는 물론 사용 분야를 넓히기 위해 노력하겠다”고 말했다.
이도희 기자
관련뉴스