현존하는 딥러닝 기술은 대규모의 고품질 자료(데이터)를 필요로 한다. 그러나 의료 분야의 데이터는 확보 과정과 분류(레이블링)에 높은 비용이 요구된다. 또 인공지능(AI) 학습에 활용하기 위해서는 까다로운 절차를 거쳐야 하는 등 의료 인공지능 개발에 여러 장벽이 존재한다.
신 대표는 소규모의 학습 데이터로 유사한 성능을 낼 수 있는 딥러닝 기술들에 대한 비교 실험을 진행했다. 그 결과가 이번 논문을 통해 공개됐다.
논문에는 화상 심도 평가(burn severity assessment)를 위한 합성곱신경망(CNN) 기반 모델을 기초로 4종류의 소규모 견본(샘플) 데이터에 특화된 딥러닝 기술을 비교한 결과가 게재됐다. 4종류의 기술은 각각 전이 학습(transfer learning), 자기 지도 학습(self-supervised learning), 연합 학습(federated learning) 및 적대적 생성망(Generative Adversarial Network) 기반 데이터 증강 기법이다.
이 중 특히 자기 지도 학습 모델은 소규모의 레이블링된 의료 이미지 데이터만을 이용해 최대 6배 더 큰 자료집합체(데이터셋)로 학습된 CNN 기반 모델과 거의 유사한 수준의 정확도를 냈다는 설명이다. 이러한 샘플 효율적 기법(sample-efficient techniques)은 향후 데이터가 부족하거나 레이블링된 데이터가 제한적인 분야의 의료 AI 개발 시 참고할 만하다고 했다.
신현웅 파인헬스케어 최고의료책임자(CMO)는 “이번 연구 결과는 부족한 다인종 피부질환 데이터 확보의 어려움을 극복하는 계기가 될 것”이라고 말했다.
파인헬스케어는 다인종 의료 데이터 확보를 위해 인도네시아 베트남 가나 모잠비크 등과 글로벌 인프라(여건)를 구축했다.
파인헬스케어는 디지털 헬스케어 기업이다. 딥러닝 기술 기반 피부상처 진단 소프트웨어 의료기기 ‘스키넥스’와 상처 진단 의료용 카메라를 개발 중이다.
이도희 기자 tuxi0123@hankyung.com
관련뉴스