엔비디아의 최신형 인공지능(AI) 가속기 '블랙웰' 샘플에서 '설계상의 결함'이 발견됐다는 외신 보도가 나왔다. AI 가속기는 그래픽처리장치(GPU)와 고대역폭메모리(HBM)을 패키징해 만드는 반도체로 엔비디아의 주력 제품이다. 'B100', 'B200'이란 이름으로 출시될 예정인 블랙웰 AI 가속기는 현재 주력 제품인 'H100', 'H200'의 뒤를 이어 마이크로소프트(MS), 구글, 메타 등 고객사에 수백억달러 어치를 납품될 예정이었다.
블랙웰의 설계 문제는 생산과 패키징(여러 칩을 한 칩으로 작동하게 하는 공정)을 맡은 대만 파운드리(반도체 수탁생산) 기업 TSMC의 엔지니어들이 발견한 것으로 전해졌다. 디인포메이션은 "엔비디아의 2개의 블랙웰 AI 가속기를 연결해서 만드는 'GB200'의 연결 부품에서 문제가 발생했다"고 적었다.
디인포메이션은 이어 "2025년 1분기까지 블랙웰의 대량 양산이 쉽지 않을 것"이라고 덧붙였다. 디인포메이션의 보도는 세계적인 경제전문 통신사 블룸버그도 인용 보도한 상태다.
이번주 초 젠슨 황 엔비디아 최고경영자(CEO)는 "블랙웰 AI 가속기 샘플을 고객사에 제공하기 시작했다"고 발표했다.
블랙웰은 엔비디아가 지난 3월 공개한 차세대 AI 가속기다. 반도체 성능의 지표로 꼽히는 트랜지스터가 2080억개 집적돼있다. 전작 H 시리즈 AI 가속기의 두 배 이상이다. 당시 젠슨 황 엔비디아 CEO는 "블랙웰을 쓰면 AI 훈련 성능이 4배 개선돼 비용과 에너지를 절감할 수 있다"고 설명했다.
블랙웰 납품이 지연된다면 HBM 생산 라인을 HBM3E 중심으로 전환한 SK하이닉스, HBM3E 양산 준비를 마친 삼성전자 모두에 부정적인 영향을 줄 것이란 전망이 나온다. 엔비디아가 H100 등을 중심으로 대응을 한다면, H시리즈에 탑재되는 4세대 HBM인 'HBM3' 수요가 커질 가능성도 있다. H100의 업그레이드 버전으로 현재 출시된 H200엔 HBM3E가 들어가기 때문에 SK하이닉스에 큰 타격이 아닐 것이란 분석도 있다.
반도체업계 관계자는 "디인포메이션에서 연결 다이의 '설계 결함'으로 문제점을 거론했기 때문에 한국 기업이 만드는 HBM의 불량은 아닐 것"이라고 분석했다.
엔비디아는 디인포메이션의 보도에 대해 공식 입장을 내놓지 않았다. 다만 블룸버그에 따르면 엔비디아 관계자는 결함 보도와 관련해 "(블랙웰) 생산은 예정대로 올해 말께 진행될 것"이라고 말했다. 구글, MS 등 고객사 관계자들도 별도 설명을 하지 않았다.
외신에 따르면 미국 법무부는 엔비디아가 클라우드 서비스 제공 업체에 자사 AI칩을 구매하도록 압력을 행사했는지, AMD·인텔 등 경쟁사 AI칩을 구매하는 기업에 자사 네트워크 장치 가격을 더 높게 책정했는지 등을 중점적으로 조사한다. 아직까지 엔비디아의 위법 행위가 발견된 건 아닌 것으로 알려졌다.
황정수 기자 hjs@hankyung.com
관련뉴스