엔비디아가 차세대 AI 인프라를 겨냥한 수랭식 시스템을 본격 선보이며, 냉각 기술의 대전환을 예고했다. 엔비디아는 자사의 블랙웰(Blackwell) 플랫폼 기반 랙 스케일 수랭식 시스템이 기존 공랭식 아키텍처 대비 최대 300배 높은 수자원 효율성을 제공한다고 24일 밝혔다.
전통적으로 데이터센터는 기계식 냉각기를 통해 차가운 공기를 순환시키는 공랭식 방식에 의존해왔다. 그러나 AI 모델의 연산량이 폭증하고, 대규모 추론 작업이 늘어남에 따라 공기만으로 열을 제어하는 방식은 한계에 직면했다. 특히 하이퍼스케일 데이터센터에서는 랙당 전력이 135kW를 넘어서는 상황이다.
이에 따라 엔비디아는 냉각기 의존도를 획기적으로 낮추는 수랭식 기술을 적용, AI 서버의 고성능 유지와 에너지 절감이라는 두 마리 토끼를 동시에 잡았다는 설명이다. 수랭식 방식은 열을 발생 지점에서 직접 제거하며, 냉각수 분배 장치(CDU)를 통한 액체 루프 열전달로 에너지 손실을 최소화한다.
대표적인 수랭식 시스템인 GB200 NVL72와 최신 GB300 NVL72는 각각 40배·50배의 수익 잠재력과 25배·30배의 에너지 효율성을 제공하며, 고밀도 랙 환경에서도 열 관리와 성능을 동시에 확보할 수 있는 것으로 평가된다. 720p 영상 생성부터 수십억 파라미터의 LLM 추론까지 대응 가능한 이들 시스템은 “AI 팩토리의 엔진”으로 불릴 만큼 높은 처리량과 안정성을 자랑한다.
기존 냉각 방식은 데이터센터 전력의 40%를 차지할 정도로 비효율적이었다. 엔비디아는 수랭식 시스템 도입으로 최대 25배의 냉각 비용 절감이 가능하다고 강조했다. 이는 연간 약 400만 달러 규모의 운영비용 절감 효과로, 50MW급 하이퍼스케일 센터를 기준으로 한 수치다.
각종 벤더들도 수랭식 열관리 생태계에 뛰어들고 있다. 버티브는 수랭식 레퍼런스 아키텍처로 연간 에너지 소비를 25% 줄였고, 슈나이더 일렉트릭은 랙당 최대 132kW를 지원해 NVL72 시스템의 효율성을 극대화했다. 쿨IT 시스템즈와 보이드는 고밀도 AI 워크로드에 최적화된 냉각장치와 루프 시스템을 개발하며 신뢰성을 확보했다.
엔비디아는 냉각 기술 혁신이 ‘포스트 무어의 법칙’ 시대의 핵심 과제가 될 것이라 전망한다. 이를 위해 미국 에너지부와 협력해 차세대 수랭식 데이터센터 개발 프로그램 ‘쿨러칩스(COOLERCHIPS)’도 공동 진행 중이다. 이 프로그램은 기존 공랭식 대비 20% 향상된 효율성과 최소 5% 비용 절감을 목표로 한다.
엔비디아는 “AI가 요구하는 고밀도 연산 환경에서는 공기가 아닌 액체가 답”이라며, “지속가능성과 성능을 동시에 충족하는 차세대 데이터센터 패러다임이 도래하고 있다”고 밝혔다.