![](https://img.hankyung.com/photo/202310/01.34930598.1.jpg)
개당 5000만원에 주문해도 1년 뒤 수령. 명품백 구매대란 얘기가 아니다. 미국 엔비디아가 개발·판매하는 그래픽처리장치(GPU) 기반 인공지능(AI) 가속기 시장 상황이다. 가속기가 AI 서비스 고도화를 위한 필수재로 꼽히면서 '돈 주고도 못 사는' 상황이 벌어졌다. 마이크로소프트 등 AI 개발사들의 불안감은 커지고 있다.
국내 기업 상황도 비슷하다. "가속기가 부족해 업그레이드가 쉽지 않다"는 원성이 쏟아진다. 국내 AI 기업의 맏형 네이버가 묘수를 냈다. 최근 인텔과 손잡고 엔비디아의 가속기를 대체할 수 있는 제품 확보에 성공했다.
보통 GPU 서버는 CPU 서버 대비 AI 추론 처리 능력이 10배 정도 뛰어난 것으로 알려져있다. 두 회사는 GPU의 CPU 대체를 위해 기술 노하우를 총동원했다.
![](https://img.hankyung.com/photo/202310/01.34930648.1.jpg)
인텔은 추론에 최적화된 소프트웨어 솔루션을 도입해 CPU의 활용도를 높였다. 이를 통해 CPU의 초당 처리 능력(RPS)을 4~7배 개선했다. 네이버는 플레이스 서비스의 위치 정확도를 유지하면서 AI 모델을 경량화해 CPU에 주는 부담을 최소화했다.
네이버와 인텔은 CPU 서버에 대한 한 달 간의 사전 최종 테스트를 거친 뒤 실제 서비스에 적용하기 시작했다. 네이버는 서버 전환에 따른 서비스 질 하락이나 추가 장비 투입 없이 GPU 대체로 연 4억원에 달하는 비용을 절감하게 됐다.
'H100' 등 AI 서비스에 특화된 엔비디아의 GPU 가속기의 경우 리드타임(주문 후 수령까지 걸리는 기간)이 최근 '52주'로 늘었다. 지금 주문해도 1년 뒤에 받을 수 있다는 뜻이다. 엔비디아 GPU를 제조하는 대만 TSMC의 생산능력이 수요를 못 따라잡고 있어서다. 품귀 때문에 올초 4000만원 안팎이던 유통 가격도 최근 7000만~8000만원까지 뛰었다.
![](https://img.hankyung.com/photo/202310/01.34930695.1.jpg)
주윤상 네이버 G플레이스 AI개발팀장은 "CPU 전환과 AI 모델 최적화를 통해 운영비용을 절감할 수 있게 됐다"며 "향후 확대 적용할 수 있는 기술 기반을 확보하게 됐다"고 설명했다.
네이버 역시 향후 인텔의 최신 4세대 서버용 CPU(사파이어래피즈)를 활용해 GPU 서버를 추가로 대체할 계획이다. 나승주 인텔코리아 상무는 "CPU를 효율적으로 활용하면 GPU 사용을 최소화하면서도 원하는 성능을 확보할 수 있다"고 강조했다.
황정수 기자 hjs@hankyung.com
관련뉴스