![](https://img.hankyung.com/photo/202310/AA.34931907.1.jpg)
GPU 서버는 CPU 서버 대비 AI 추론 처리 능력이 10배 정도 뛰어난 것으로 알려져 있다. 네이버와 인텔은 GPU를 CPU로 안정적으로 대체하기 위해 기술 노하우를 총동원했다. 인텔은 추론에 최적화된 소프트웨어 솔루션을 도입해 CPU의 성능을 높였다. 이를 통해 CPU의 초당 처리 능력(RPS)을 4~7배 개선했다. 네이버는 플레이스 서비스의 위치 정확도를 유지하면서 AI 모델을 경량화해 CPU에 주는 부담을 최소화했다. 두 회사는 CPU 서버를 한 달간 사전 테스트한 뒤 최근 실제 서비스에 적용하기 시작했다.
네이버가 GPU 대체에 나선 건 최근 엔비디아 GPU 기반 서버 비용이 크게 증가하고 원활하게 GPU를 공급받는 게 힘들어졌기 때문이다. ‘AI 기업들이 서비스 업그레이드에 어려움을 겪을 것’이란 우려가 나올 정도다.
최근 ‘H100’ 등 AI 서비스에 특화된 엔비디아의 GPU 가속기는 리드타임(주문 후 수령까지 걸리는 기간)이 52주로 늘었다. 엔비디아 AI용 GPU를 독점 제조하는 대만 TSMC의 생산능력이 수요를 못 따라가고 있어서다. 품귀 현상 때문에 올초 4000만원 안팎이던 유통 가격은 최근 2배 정도인 7000만~8000만원으로 뛰었다.
네이버 관계자는 “CPU 전환과 AI 모델 최적화를 통해 운영비를 절감할 수 있게 됐다”며 “향후 CPU를 확대 적용할 수 있는 기반을 확보했다”고 설명했다.
산업계에선 엔비디아 GPU를 대체하기 위한 AI·반도체 기업 간 협업이 속도를 낼 것이란 전망이 나온다. 엔비디아가 AI GPU에 최적화된 쿠다(CUDA) 소프트웨어를 앞세워 생태계를 장악하고 있지만, 이번에 대체 가능성이 입증됐기 때문이다. 네이버는 인텔의 최신 서버용 CPU(사파이어래피즈)를 활용해 GPU 서버를 추가로 대체할 계획이다.
황정수 기자 hjs@hankyung.com
관련뉴스