AI 인프라 / 전력Bearish on Supply
클라우드 20kW → AI 120kW → Rubin Ultra 600kW → 1MW: 세대마다 배수로 뛴다
Semi Doped 해설자 · 데이터센터 전력 밀도 추이 ·
💡 핵심 통찰
전력 문제는 "AI 데이터센터가 예전보다 전기를 좀 더 쓴다"는 수준이 아니다. 클라우드 pre-AI 시대 대비 랙당 전력이 100배 증가하는 것이고, 그 랙이 수만 개 단위로 클러스터를 이루며 다시 여러 데이터센터가 서로 연결되는 구조다. 공급망(전력망, 변전소, 냉각 설비)이 이 속도를 따라가는 것이 사실상 불가능에 가까워지고 있다.
Pre-AI 클라우드 랙
10~20 kW/랙
현세대 AI 가속기 랙
100~120 kW/랙
Rubin Ultra 세대
600 kW/랙
미래 목표치
1 MW/랙
Pre-AI 대비 증가 배수
×100(1MW 기준)
세대별 전력 궤적: 클라우드 시대엔 랙당 소비 전력이 10~15kW, 잘 쳐줘도 20kW 수준이었다. AI 가속기가 들어오면서 100~120kW로 뛰었고, 지금은 NVIDIA의 Rubin Ultra가 들어가는 이른바 "킬로와트 시대" 랙이 600kW를 소비한다. 그리고 다음 단계로 1MW/랙이 거론되고 있다.
왜 단순 숫자 이상인가: 랙 하나가 1MW를 쓴다고 상상해보자. 데이터센터 한 곳에 수천 개의 랙이 들어가고, 그 데이터센터 수십~수백 개가 scale-out 패브릭으로 연결된다. 총 전력 수요는 기존 인프라 기획의 전제 자체를 뒤흔드는 규모다. 전력망 연결 허가, 변전소 증설, 냉각 시스템 재설계까지 모두 이 속도를 따라가야 한다.
구조적 악화 경향: 이 문제가 특히 까다로운 이유는 AI 칩 세대교체 주기(1~2년)가 전력 인프라 증설 주기(5~10년)보다 훨씬 빠르다는 점이다. 새 칩이 나올 때마다 전력 수요는 다시 점프하지만, 그것을 받쳐줄 전력망은 그때그때 따라갈 수가 없다. "세대가 바뀔수록 문제가 점점 더 커진다"는 진단이 나오는 이유다.
"이건 갈수록 더 커지는 문제다 — AI와 칩의 새 세대가 나올 때마다."
쉽게 풀어보기 — 랙·전력 밀도·scale-out
- 랙(Rack)
- 서버를 꽂아두는 철제 선반 하나. 데이터센터엔 이게 수천~수만 개 있다.
- kW / MW (킬로와트 / 메가와트)
- 전력 소비량 단위. 1MW = 1,000kW. 일반 가정이 약 3~5kW를 쓰니, 1MW짜리 랙 하나가 가정 200~300채 분량의 전기를 혼자 소비하는 셈.
- Rubin Ultra
- NVIDIA의 차세대 AI 가속기(GPU) 플랫폼 코드명. 현세대(Blackwell) 다음 세대.
- Scale-out
- 서버/데이터센터를 하나씩 늘려가며 전체 용량을 키우는 방식. AI 클러스터는 수십~수백 개 데이터센터를 고속 네트워크로 묶어 하나처럼 운용한다.