Must Investment · AI Datacenter Cooling

칩 직접 냉각 (Direct-to-Chip Liquid Cooling)

GPU가 공기 냉각의 물리 한계를 넘어버린 지금, 왜 NVIDIA와 모두가 액냉을 필수로 요구하는가

정리: 머스트브레인 · 2026-05-30 · 출처: 업계 공개자료 + 내부 AlphaSense 전문가 피드 · 팀 내부용
500~600
GB200 칩 발열밀도 (W/cm²)
= 원자로 연료봉 수준
<15
공기 냉각 감당 한계 (W/cm²)
= 칩의 1/40
2,300W
Rubin GPU 1개 TDP
(GB200의 2.3배)
100%
Rubin 액냉 커버리지
(사상 첫 완전 액냉)

01왜 공기로는 안 되나 — 물리적 벽

발열 밀도(W/cm²)가 공기 냉각이 감당 가능한 수준을 수십 배 넘어섬

단위 면적당 발열 (W/cm²) — 로그 아님, 선형 일반 방열판 ~10 ↑ 공기 냉각 한계 ~15 원자로 연료봉 ~500 GB200 GPU 칩 500~600 → AI 칩이 공기 냉각 능력의 40~100배 더 뜨겁다. 공기로는 물리적으로 불가능.
핵심 한 장: GB200 칩의 발열 밀도(500~600 W/cm²)는 원자로 연료봉과 맞먹고, 공기 냉각이 감당 가능한 ~15 W/cm²의 40배 이상. 그래서 공기가 아니라 액체로 칩을 직접 식혀야 함.
뜨거운 열/액체 차가운 액체 공기/금속
공기 냉각 (기존) 방열판(핀) 칩 🔥 한계 ~8~25kW/랙 1MW 빼려면 ~85,000 CFM 송풍 → 소음·구조하중·CRAC 비용 폭발 칩 직접 냉각 (DLC) 차가운 액 IN 뜨거운 액 OUT 콜드플레이트 칩 🔥 CDU 열교환 120kW ~ 1MW/랙 가능 칩 표면 바로 옆에서 액체가 열을 직접 흡수 → CDU가 받아 시설 냉각수로 배출
공기 냉각은 방열판+팬으로 한계가 명확(랙당 ~25kW). DLC는 콜드플레이트가 칩에 직접 붙어 액체로 열을 빼고, CDU(냉각수 분배기)가 받아 시설로 보냄 → 랙당 1MW까지 가능.

02세대마다 TDP·랙 전력이 폭증

칩 1개가 1,000W → 2,300W로 가고, 랙은 120kW → 1MW로

GPU 1개 TDP (W) ↑ 이 위로는 공기로 사실상 불가 700 H100 2023 1,000 GB200 2024~25 1,400 GB300 2025~26 2,300 Rubin 2026~27 ~3,000+ Rubin Ultra/Kyber 2027~
TDP가 H100 700W → Rubin 2,300W → Rubin Ultra 3,000W+로. 어느 지점부터는 공기로 식히는 게 물리적으로 불가능. Rubin Ultra 수치는 방향성 추정.
랙당 전력 (kW) 공기한계 8~25kW 기존 랙 120kW GB200 NVL72 1,000kW 800VDC 1MW 랙 (2027~)
랙 전력이 공기 한계(~25kW)의 5~40배로. 밀도 자체가 액냉을 강제 — 1MW를 공기로 식힐 방법은 없음.

03NVIDIA가 레퍼런스에 못 박음 — 선택이 아니라 강제

세대가 갈수록 액냉 커버리지가 100%로 수렴. 최신 칩을 쓰려면 DLC가 전제

DLC(액냉) 커버리지 비중 GB200 액냉 설계 기본 (랙 직접 액냉) GB300   DLC 90% 공기 10% Rubin DLC 100% — 사상 첫 완전 액냉 모든 GPU·CPU·NVSwitch·NIC에 콜드플레이트가 붙음 (GB300 기준)
NVIDIA GB200 NVL72는 액냉이 디폴트(옵션 아님), GB300은 90% DLC, Rubin은 100% 액냉. 즉 OEM·ODM·하이퍼스케일러가 NVIDIA 최신 칩을 배치하려면 DLC가 강제됨.

04콜드플레이트는 어떻게 식히나 — 그리고 JetCool의 차별점

표준은 "마이크로채널", Flex(JetCool)는 "마이크로제트(microconvective)" — 물을 칩에 직접 때림

표준 — 마이크로채널 물이 칩 표면 위로 "흘러 지나감" 표면 위 수평 흐름 → 열저항 큼
JetCool — 마이크로제트 미세 제트가 칩 표면을 "직접 때림" 칩 (핫스팟) 제트 분사 헤더 수직 충돌 → 열저항 3배 ↓
마이크로채널(표준)은 물을 표면 위로 흘려보내고, JetCool 마이크로제트는 물을 칩 표면에 직접 충돌시킴 → 열저항 3배 감소, 온도 37%↓, 3,000W+ 슈퍼칩 대응. TDP가 오를수록 이 차이가 벌어짐.
전체 냉각 경로 (칩 → 시설) 칩+콜드플레이트 열 흡수 CDU 랙 단위 열교환·분배 시설 냉각수 루프 건물 차원 분배 칠러/냉각탑 외부로 열 방출 대기 방출
칩에서 흡수한 열이 콜드플레이트 → CDU(랙) → 시설 냉각수 → 칠러/냉각탑 → 대기로 단계적으로 빠짐. Flex는 콜드플레이트(JetCool)부터 CDU(2.4MW급)까지 보유.

05그래서 누가, 왜 필요로 하나

주체왜 DLC가 필요한가
NVIDIAGB200/GB300/Rubin을 출하하려면 액냉이 전제 — 레퍼런스 아키텍처가 강제. 안 되면 칩을 못 팖
하이퍼스케일러
(구글·MS·아마존·메타)
1MW 랙 배치 + PUE·전력효율 목표. 희소한 그리드 전력당 컴퓨트를 최대화하려면 액냉 필수
ODM
(Foxconn·Quanta·Wiwynn)
액냉-ready 섀시 제조 필수. Wiwynn 콜드플레이트 섀시 주문 +500% YoY
경제성(TCO)1MW를 공기로 빼려면 ~85,000 CFM 송풍 → 소음·구조하중·CRAC 비용이 액냉 총비용을 초과. 공기가 더 비쌈
성능/ROI잘 식힐수록 칩이 throttle 없이 풀클럭 → $3~4만 GPU의 ROI↑. JetCool 37% 온도↓ = 곧 성능

06우리 피드 — 전문가들이 보는 액냉 (AlphaSense)

"AI DC가 통합 열관리의 복잡성·가치를 높인다. 고밀도 전환으로 액냉↔HVAC 상호작용이 게임을 바꿈"— 前 Carrier 글로벌 디렉터 (VRT 관련, 2026-05-12)
"액냉 수요는 지속적이고 진짜다. 밀도 급증이 견인. 냉각수 화학·시스템 설계 혁신 진행 중"— nVent 엔지니어링 디렉터 (18년 냉각 경력, 2026-04-16)
"고밀도 AI엔 액냉이 핵심, 단 하이브리드(액+공기)는 지속. 콜드플레이트 기술 선정·공급제약·신뢰성이 관건"— Microsoft 매니저 (2026-04-15)
"Vertiv가 고밀도·AI DC 냉각의 강자" / "2028년엔 침지냉각(immersion)이 필수가 될 것"— Siemens Energy PM (5/12) · Alphabet 시니어 TPM (4/6)
피드 종합: "액냉은 이미 필수 + 콜드플레이트 기술/공급/신뢰성이 경쟁축 + 현재 강자는 Vertiv + 다음은 침지(2028)". JetCool 같은 차별화 콜드플레이트가 의미를 갖는 한편, 침지로의 추가 전환은 리스크.

07한 장 요약

문제

칩이 공기 냉각의 물리 한계(500 W/cm²·1000W+)를 넘어버림. 랙은 1MW로. 공기로는 불가능.

칩 직접 냉각(DLC) — 콜드플레이트가 칩에 붙어 액체로 직접 열을 뺌. NVIDIA가 레퍼런스에 강제(Rubin 100%).

→ 그래서 NVIDIA·하이퍼스케일러·ODM 모두가 지금 DLC를 필수로 요구. 고출력으로 갈수록 콜드플레이트 기술차(마이크로채널 vs JetCool 마이크로제트)가 벌어지는 국면이고, 이게 Flex/JetCool의 기술 우위가 의미를 갖는 지점.