박근태 S2W 최고기술책임자(CTO·사진)는 14일 한국경제신문과의 인터뷰에서 다크웹의 위험성에 대해 이같이 말했다. 다크웹은 원래 익명성을 보장하기 위해 만들어진 네트워크다. 박 CTO는 “제3세계 국가에서는 다크웹이 언론 탄압을 피할 수 있는 수단이 되기도 한다”면서도 “암호화폐 기반 익명 상거래로 범죄 행위의 현금화가 가능해지면서 다크웹 내 불법 시장이 활성화됐다”고 진단했다.
S2W는 2018년 설립된 보안 전문 데이터 기업이다. 다크웹 위협 분석에 특화한 서비스를 제공한다. 이 회사는 현재 약 3억 개에 달하는 다크웹 페이지를 모니터링하고 있다. 기업 및 개인 정보 유출, 해킹, 가상자산 범죄에 대응하기 위해서다. 박 CTO는 “다크웹의 전체 데이터는 웹 페이지 단위로 수십억 개에 달하며 매월 수천만 개가 업데이트된다”며 “사람의 힘으로 대응하기 어려운 규모여서 설립 초기부터 AI 기술 도입을 기본 방침으로 삼았다”고 설명했다.
다크웹의 데이터를 분석하기 위해 S2W는 두 종류의 AI 모델을 개발했다. 지난해 출시한 ‘다크버트’는 다크웹 특화 자연어 처리 모델이다. 다크웹에서 발생하는 다양한 정보를 분석해 진위를 판별한다. 박 CTO는 “다크웹 모니터링의 병목 중 하나는 가짜 범죄 정보와 진짜 정보를 구분하는 것”이라며 “모델 구축에 다크웹 데이터를 활용해 일반 AI 모델보다 식별 정확도를 20~30% 높였다”고 강조했다. S2W는 다크버트의 모델 학습에 자체적으로 구축한 600만 다크웹 페이지 기반의 데이터가 활용됐다고 했다.
지난 6월에는 대규모언어모델(LLM) ‘사이버튠’을 공개했다. 사이버튠은 데이터 분석에 중점을 둔 모델이다. 약 50만 건의 사이버 보안 뉴스와 보고서를 학습해 전문가 수준의 보안 분석을 수행한다. 다크웹에서 식별된 다양한 보안 위협의 중요도를 계산해 우선순위를 설정한다. 기업에 내부망 계정 유출, 랜섬웨어 위협 등 다양한 보안 위협이 발생하면 가장 시급히 대응해야 하는 위협을 선별해 보안팀이 빠르게 조치할 수 있도록 지원한다. 박 CTO는 “다크웹에서는 일반적인 단어들이 다른 의미로 사용되는 경우가 많아 AI 모델이 은어를 학습하고 문맥적으로 해석하는 것이 중요하다”며 “두 모델 모두 지속해서 개선해 나가고 있다”고 덧붙였다.
S2W는 누구나 보안 위협을 예측하고 대응할 수 있도록 모델을 개선하고 있다. 비전문가도 보안 대응을 할 수 있도록 하기 위해서다. 지난 8일에는 통합 사이버 위협 지능형(CTI) 플랫폼 ‘퀘이사’에 AI 비서를 탑재했다. AI가 맥락 파악을 도와 위협 관리의 효율성을 강화할 수 있다는 설명이다.
박 CTO는 “다크웹 위협은 일시적으로 대처하고 마는 문제가 아니다”라며 “기업들이 지속적인 관심을 가지고 사전에 대비할 수 있도록 AI 기술을 더욱 발전시켜 나갈 것”이라고 덧붙였다.
황동진 기자 radhwang@hankyung.com
관련뉴스