Must Deep-Dive · China AI Endgame · Vol.2 증보판

중국의 AI 엔드게임:
토큰 디플레이션의 수출

제조업에서 '세계의 공장'이었던 중국은, AI에서 '세계의 추론공장'이 되려 한다. 무기는 SOTA가 아니라 압축 · 전기 · 물량이며, 수출품은 상품이 아니라 토큰이다. 그리고 추론의 입지가 '유저 옆'에서 '전기 옆'으로 이동하는 글로벌 전환이, 이 전략의 순풍이 되고 있다.

DATE 2026.06.10 SOURCES Must Slack DB + GPT 검증메모 + Web(26.6) NEW IN VOL.2 전기가 입지다 · 1GW의 경제학 · 원본캡처 6
서부 잉여 그린전력재생설비 23.4억kW × 국산 칩 추론공장Ascend 950 · SuperPoD × 압축 모델FLOPs 27% · KV 10% = 세계 최저가 토큰의 수출1kWh → 토큰 전환 시 가치 ~22배"전기를 수출할 수 없으니, 토큰에 담아 수출한다"
3줄요약
  1. 논지 성립 — 가설이 아니라 중국의 공식 국가전략이다. 2026 정부업무보고가 'AI 오픈소스 지원 · 초대형 지능연산 클러스터 · 산전협동(算電協同) · 공공클라우드'를 국가과제로 명문화했고, 국가데이터국은 "Token 호출을 특징으로 하는 신업태 가속"을 공식 전망에 못 박았다. 인민일보는 "토큰은 차세대 금광"(26.6.1) 기획을 게재, 간쑤 칭양을 'global token factory'로 — "전기 1kWh를 파는 것보다 토큰으로 전환하면 가치가 ~22배"라는 서사까지 관영매체가 직접 민다.
  2. 공학적 근거는 '곱셈 구조' + 새 순풍 '전기가 입지다'. 태양광 누적 1.2TW · 재생설비 23.4억kW(풍광이 화력 첫 추월)의 잉여전력 × Ascend SuperPoD × DeepSeek 압축(V2 KV캐시 −93.3% → V4 FLOPs 27%)이 중첩돼 美 SOTA 대비 4~20배 가격차를 만든다. 동시에 Reasoning·에이전트 시대에 추론 latency의 지배변수가 거리(RTT 80ms)에서 생성시간(30,000ms)으로 바뀌며 — 전 세계 추론이 '유저 옆'에서 '전기 옆'으로 이동 중(MS 북유럽, Google 핀란드, Stargate Abilene, IREN 남호주 800MW). 중국 동수서산은 이 흐름의 국가 단위 선행 버전이다.
  3. 실증과 착시를 분리해서 본다. OpenRouter 주간 토큰: 중국 4.12조 vs 미국 2.94조 — 사상 첫 추월(WIC/China Daily), 중국 일일 토큰 140조(26.3). 그러나 최다사용 모델의 OpenRouter 일매출은 $5.6k 수준(15개 프로바이더 합산) — 물량의 전쟁은 이겼지만 가치의 전쟁은 아직이며, 화웨이 고급칩 연 20만개 상한설(美 상무부) · CXMT HBM 수율 · CUDA 생태계가 3대 병목이다.
VERDICT
논지 성립 ✓
+축 확장

한줄설명 — 중국은 "제일 똑똑한 놈 1등" 게임이 아니라 "조금 덜 똑똑해도 너무 싸고 빨라서 다들 쓰게 만드는 놈" 게임을 한다(GPT 메모 동일 결론). 그리고 추론 입지의 글로벌 룰이 '고객 옆 → 전기 옆'으로 바뀌면서, 전기가 가장 싸고 가장 많이 남는 나라의 전략적 이점이 구조적으로 커지고 있다.

Eureka Points · 엇 이거!
EUREKA 01

토큰 = 캡슐화된 전기, 그리고 22배

추론 원가의 80~90%가 전력+감가상각. 관영 CCTV는 "1kWh를 그대로 파는 것보다 토큰 서비스로 전환하면 가치가 약 22배"라는 환산까지 보도 — 전기의 부가가치화 공식이 국가 서사가 됐다.

EUREKA 02

추론의 latency 산수가 뒤집혔다

30초짜리 reasoning 응답에서 대륙횡단 RTT 80ms는 0.27% — 반올림 오차. 배치 API 50% 할인은 "위치가 아무래도 좋은 토큰"이 이미 별도 상품으로 거래된다는 증거. 추론이 '이동 가능한 전력수요'가 되는 순간, 중국 서부·호주 사막·텍사스가 같은 게임판에 오른다.

EUREKA 03

MoE는 추론을 흩뿌리지 않는다, 빨아들인다

대규모 expert parallelism + prefill/decode 분리는 트래픽을 한곳에 모을수록 토큰당 원가가 급락하는 구조. "학습은 집중, 추론은 분산"이라는 코로케이션 업계 컨센서스가 틀렸다는 것 자체가 알파다.

EUREKA 04

가격인하 트리거 = 칩 공급 일정

V4 Pro 75% 영구 인하의 공식 사유가 "2H26 Ascend 950 클러스터 가동". 샤오미·MiniMax 즉각 동조 — 카르텔이 아닌 '원가 곡선 동기화'. 토큰 가격이 칩 캐파의 함수가 됐다 = 제조업 학습곡선의 AI 이식.

EUREKA 05

DeepSeek이 IDC 설계 엔지니어를 뽑는다

모델 회사가 부지선정·전력계통·액침냉각 인력을 직접 채용 = GW급 자체 인프라 신호(Poe Zhao). 모델→칩→데이터센터→전력까지, 수직계열화가 모델 레이어에서 아래로 내려가는 중.

EUREKA 06

점유율 착시가 곧 전략의 증거

주간 토큰 4.12조로 미국 첫 추월 vs 최다사용 모델 일매출 $5.6k. "물량 먼저, 수익 나중" — 국가자본·바우처(算力券)·크로스보조 없이는 불가능한, 전형적 중국식 침투 패턴.

Prologue · 히말라야에서 시작하는 이야기

부탄은 어떻게 폭포를 수출했나 — 그리고 중국은 무엇을 보았나

히말라야 산중의 인구 78만짜리 왕국 부탄에는 기묘한 고민이 하나 있었다. 전기가 너무 많았다. 빙하가 녹아 떨어지는 수력발전은 넘쳐나는데, 나라 안에는 그 전기를 받아줄 공장도, 도시도 없었다. 선택지는 셋이었다. 이웃 인도에 헐값으로 넘기거나, 알루미늄 제련소 같은 전력 먹는 하마를 유치하거나 — 아니면 뭔가 다른 짓을 하거나.

부탄 국부펀드 DHI가 고른 것은 세 번째였다. 2019년부터 이 나라는 조용히 수력발전소 옆에 채굴기를 꽂고 비트코인을 캐기 시작했다. 폭포를 배에 실어 수출할 수는 없지만, 폭포로 해시를 돌려 만든 BTC는 광케이블 하나로 전 세계 시장에 팔 수 있었다. 로이터에 따르면 이 '디지털 폭포'의 수익은 한때 공무원 월급 지급에까지 쓰였다. 전기를 수출할 수 없는 나라가, 전기를 디지털 상품에 담아 수출하는 법을 찾아낸 것이다.

자, 이제 이 문장에서 단어 세 개만 바꿔보자. '부탄'을 중국 서부로, '수력'을 사막의 태양광으로, 'BTC'를 토큰으로. — 이것이 이 보고서 전체의 논지다.

FIG.00 — 전력 차익거래의 두 세대: 채굴기에서 추론기로
1세대 (2015~) — 비트코인 채굴: 전기 → 투기적 디지털 금 잉여 전기부탄 수력 · 쓰촨 우기 · 신장 석탄 채굴기 (ASIC)컨테이너에 꽂으면 끝 해시 → BTC어디서 캐도 똑같은 상품 글로벌 시장국부펀드 → 공무원 월급 2세대 (2025~) — AI 추론공장: 전기 → 유용한 디지털 노동력 잉여 그린전력닝샤 태양광 · 남호주 · 텍사스 추론기 (Ascend·GPU)+냉각·광·운영·SLA 필요 FLOPs → 토큰품질·언어·신뢰가 붙는 상품 글로벌 API 시장개발자·에이전트·글로벌 사우스 차이: 1세대는 투기적 금을 만들었고, 2세대는 업무를 대신해주는 노동력을 만든다 — 그래서 정당성·고객기반·정책지원이 비교가 안 된다
SOURCEReuters "Bhutan turns to green cryptocurrency"(2025.4) · arXiv hashprice 논문(채굴 부하 = 전기료와 채굴수익의 함수) · AI Greenferencing(풍력단지 옆 모듈형 DC 라우팅으로 추론 goodput +80%).

비트코인 채굴은 처음부터 전기 차익거래 산업이었다. 중국 채굴업자들은 우기에는 쓰촨·윈난의 수력으로, 건기에는 신장·내몽골의 석탄으로 채굴기를 철새처럼 옮겨 다녔다. 전기료가 조금만 올라도 채굴기는 꺼졌다 — 텍사스 데이터를 분석한 최근 논문은 채굴 부하가 정확히 전기료와 hashprice의 함수로 켜지고 꺼진다는 것을 보여준다. 그리고 이 산업이 남긴 유산이 지금 AI로 상속되고 있다: 전력 접속, 부지, 변전설비, 냉각 경험, 전력시장 대응 능력. CoreWeave도, Crusoe도, Applied Digital(1.4GW IT load, 2.15GW 계통연결 확보)도, 남호주 800MW의 IREN도, KEEL(舊 Bitfarms)도 — 전부 채굴장이 추론공장으로 변태(變態)하는 같은 이야기다. 채굴업자의 진짜 자산은 채굴기가 아니라 '확보된 전력'이었음이 드러난 것.

그런데 여기서 정직해지자. AI 추론은 비트코인보다 덜 순수한 전기 차익거래다. 비트코인은 어디서 캐도 똑같지만 토큰에는 품질·언어·데이터주권·latency·신뢰가 붙는다. 채굴장은 컨테이너로 이사하지만 AI 데이터센터는 광케이블·부품 공급망·운영인력·고객 SLA가 필요하다. 그리고 채굴기는 24시간 같은 해시를 돌리면 되지만, GPU는 수요가 없으면 놀고 — 노는 GPU의 감가상각은 즉시 피가 된다. 그래서 정확한 명제는 "전기 싼 곳이 전부 추론공장이 된다"가 아니라, "전기 싸고 + 네트워크 있고 + 자본 싸고 + 가동률을 채울 수요가 있는 곳"이 이긴다이다.

그리고 바로 이 지점에서 중국이 무서워진다. 저 패키지 전체를 국가가 한 묶음으로 제공하는 유일한 나라이기 때문이다. 전기(서부 잉여 그린전력)와 네트워크(동수서산 일체형 컴퓨트망)와 자본(특별국채·그린ABS·바우처)과 수요(외산칩 금지 + 국가 프로젝트)까지. 산업화 시대에 중국은 이 공식 — 싼 투입재 × 국가 자본 × 압도적 물량 — 으로 철강을, 조선을, 태양광을, 배터리를 차례로 깎아내리며 세계 제조업의 28%를 가져갔다. 모두가 "품질이 안 되는데?"라고 비웃는 동안에. 그 공식이 이번에는 토큰을 향하고 있는가? — 이것이 이 보고서가 검증하려는 질문이고, 결론부터 말하면: 그렇다, 이미 시작됐다.

똥멍청이도 이해하는 설명부탄: "폭포를 수출 못 하니까 폭포로 디지털 금화(BTC)를 찍어 팔자." 중국: "사막 태양광을 수출 못 하니까 그걸로 디지털 알바생(토큰)을 찍어 팔자." 같은 본능, 다른 상품 — 그런데 금화는 투기지만 알바생은 전 세계 회사들이 매달 쓰는 인건비라서, 시장이 비교가 안 되게 크다. 그리고 산업화 때 "메이드 인 차이나가 다 그렇지"라고 비웃다가 어떻게 됐는지 우리는 안다.
Chapter 01 · The Analogy

제조업 디플레이션 1.0 → 토큰 디플레이션 2.0

중국의 2023년 제조업 부가가치는 $4.66조 — 전 세계의 28%(CSIS/World Bank). 태양광에서 기록적 저가경쟁으로 가격곡선을 붕괴시켰던 그 나라가, AI에서 같은 게임을 시작했다. 중국이 역사적으로 잘하는 게임은 '최상단 프리미엄 독점'이 아니라 공급망·규모·자본·정책으로 원가곡선을 붕괴시키는 게임이다.

요소제조업 1.0 (1995–2015)토큰 2.0 (2025– )
핵심 투입재저임금 노동 + 석탄전력저가 그린전력 + 엔지니어 인재풀
기술 조달기술이전·리버스엔지니어링·합작오픈소스 패스트팔로우 + 자체 압축혁신
자본국유은행 정책대출, 지방정부 토지보조빅펀드·특별국채·그린ABS·리츠 + 지방정부 算力券(컴퓨트 바우처)
가격전략학습곡선 선반영 덤핑 → 글로벌 디플레 수출토큰 단가 75%↓ 영구 인하 → 토큰 디플레 수출
결과"세계의 공장" — 제조업의 28% 점유(가설) "세계의 추론공장" — 주간 토큰점유 첫 추월
미국의 대응관세(301조 등)칩 수출통제 + 상원 '중국 AI 해외판매 견제' 법안 준비

핵심 유사점: 양쪽 모두 '최상단 가치사슬'이 아니라 대량생산 가능한 중간 가치사슬에서 원가 우위로 진입한다. AI에서의 전장은 frontier training이 아니라 inference at scale이다. 국가데이터국은 추론 수요가 훈련 수요의 3:1 이상이 될 것으로 전망 — 큰 쪽 시장을 정조준한 것.

핵심 차이점: ① 토큰은 해저케이블만 있으면 되는 무관세·무물류 상품 — 침투 마찰이 제조업보다 작다. ② 단, 데이터주권·보안이라는 비관세 장벽은 관세보다 강력하다(5G 화웨이의 데자뷔 — 모건스탠리도 token export의 핵심 변수로 지정학을 지목). ③ 제조업은 품질이 수렴했지만 AI는 SOTA 격차가 frontier에서 계속 재생성된다.

"중국은 AI에서 '제일 똑똑한 놈'이 되려는 것보다, '조금 덜 똑똑해도 존나 싸고 빨라서 다들 쓰게 만드는 놈'이 되려는 그림이 더 유력합니다."— GPT 검증메모 〈중국의 AI Endgame은 무엇인가〉 결론부, 본 보고서와 독립적으로 동일 결론 도달
Chapter 02 · Compression Revolution

압축혁명 — V2에서 V4까지, '원가절감 보고서'의 계보

DeepSeek의 기술보고서들은 모델 성능 보고서가 아니라 AI 제조원가 절감 보고서에 가깝다. 그리고 혁신은 모델 가중치보다 더 깊은 층 — 스토리지·네트워크·파일시스템까지 내려간다.

FIG.01 — DeepSeek 압축의 계보: 세대별 원가 절감 수치
2024.5 V2 236B 중 21B 활성 · MLA KV캐시 −93.3% 처리량 ×5.76 학습비 −42.5% MoE+MLA의 원형 2024.12~25.1 V3 / R1 671B 중 37B 활성 무보조손실 로드밸런싱 Multi-Token Prediction R1: 순수 RL + GRPO → '딥시크 먼데이' 2026.4 V4 Pro / Flash 1.6T/49B · 284B/13B 활성 1M 네이티브 · 32T 토큰 학습 FLOPs 27% · KV 10% CSA+HCA · mHC · Muon (vs V3.2, Pro 기준) 인프라 레이어 Fire-Flyer 2 · 3FS PCIe A100 ×10,000으로 DGX-A100급 성능 근접 구축비 −50% · 전력 −40% 3FS: 6.6TiB/s 분산 FS 커널·스토리지까지 원가절감
SOURCEDeepSeek V2/V3/R1/V4 기술보고서(arXiv·HuggingFace), Fire-Flyer AI-HPC 논문, 3FS 공개자료 — GPT 검증메모 교차확인. V4는 하이브리드 어텐션(CSA 압축희소+HCA 고압축밀집), mHC(잔차강화), Muon 옵티마이저로 1M 컨텍스트를 사실상 공짜에 가깝게 구현. FAIR단, DeepSeek 스스로 "최고난도 복합 프롬프트·멀티턴에선 Claude Opus 4.6이 아직 우위"라고 기술문서에 인정 — frontier를 따라잡았다가 아니라 frontier 근처에서 비용효율을 더 세게 민다가 정확한 독해.

2-1혼자가 아니다 — 산업 표준가의 형성

"딥시크 먼데이가 역설적으로 컴퓨팅 수요에 역사상 가장 긍정적인 사건임은 당시에도 명백했다. 아시아 AWS 가격이 2배로 뛰었고 GPU 가용성은 떨어졌다."— Gavin Baker, Colossus "Watts and Wafers" · 압축은 수요를 죽이지 않고 제번스 역설로 폭발시킨다
똥멍청이도 이해하는 설명압축혁명 = 같은 답을 내는 데 필요한 '뇌세포 가동량'을 줄이는 경쟁. 미국이 더 큰 뇌를 만드는 동안, 중국은 뇌의 3%만 켜고 답하는 법(MoE), 긴 문서를 요약 쪽지로 기억하는 법(KV 압축), 심지어 창고와 배송망(스토리지·네트워크)까지 싸게 짓는 법을 갈고닦았다. 그래서 75%를 깎아도 남는 장사가 된다.
Chapter 03 · Price War Evidence

토큰 디플레이션의 실증 — 추월의 차트와 착시의 차트

2026년 들어 두 장의 차트가 동시에 존재한다. 하나는 "중국이 미국을 추월했다"는 차트, 다른 하나는 "그런데 돈은 안 된다"는 차트다. 둘 다 진실이며, 둘을 같이 보는 것이 이 논지의 정직한 독해다.

FIG.02 — 1M 토큰당 가격 지형도 (인풋 기준, 2026.6)
美 SOTA 모델 (blended)$4.00 DeepSeek V4-Pro (인하 전)$1.74 V4-Pro 75%↓ 영구 / MiMo Pro$0.435 V4-Flash / MiMo-V2.5$0.14 — 24/7 에이전트용 최저선 Qwen3.5-Flash (본토)$0.029 · V4 Flash 캐시히트는 $0.0028 — 사실상 0에 수렴 $0$1$2$3$4 美 SOTA 대비 4~20배(캐시히트 포함 시 1,000배+) — 인하의 공식 트리거는 "Ascend 950 클러스터 가동"
SOURCEDeepSeek 공식 API 문서 · Alibaba Cloud 고시가 · GS(中 $0.2~1 vs 美 ~$4) · 삼성증권 26.5.28. 멀티모달(Seedance 2.0 $4~7)은 예외적 프리미엄 유지.
CAPTURE — 추월의 차트: 中 모델, 주간 토큰 소비 美 첫 추월
OpenRouter 주간 토큰 소비 — 중국 모델이 미국 모델 추월 (Prof G Media)
READOpenRouter 톱9 주간 토큰: 2026년 1분기부터 중국(주황)이 미국(녹색)을 구조적으로 역전. WIC/China Daily 집계로는 주간 중국 4.12조 vs 미국 2.94조 토큰 — 사상 첫 추월. nxthompson: "올해 초부터 미국 AI 스타트업들이 중국 모델을 적극 도입하는 놀라운 전환."
CAPTURE — 착시의 차트: 1위 모델의 일매출은 $5.6k
Piotr Mazurek — OpenRouter 최다사용 모델 일매출 $5.6k, DeepSeek V4 Flash 사용량 차트
READOpenRouter 최다사용 모델(V4 Flash, 일 700B+ 토큰)의 아웃풋 토큰 일매출은 15개 프로바이더 합산 ~$5.6k. ① 단가가 그만큼 낮다 = 토큰 디플레이션의 실물 증거이자 ② OpenRouter 데이터로 시장 전체를 추론하는 것의 위험(Mazurek의 경고). 물량 점유 ≠ 매출 점유를 한 장으로 보여주는 캡처.

3-1물량 전쟁의 스코어보드 (2026.3~6)

Chapter 04 · The New Geography of Inference

추론의 새 지리학 — 전기가 곧 입지다

Vol.2 신규 축. "학습은 오지, 추론은 유저 옆"이라는 2023년식 프레임이 무너지고 있다. 추론이 '이동 가능한 전력수요(relocatable electricity demand)'가 되는 순간, 데이터센터 입지는 고객 밀집지에서 전력 잉여지로 이동한다 — 그리고 중국 동수서산은 이 글로벌 전환의 국가 단위 선행 버전이다.

FIG.03 — Latency 산수의 붕괴: 응답시간에서 '거리'가 차지하는 비중
2015년식 웹 검색 (~200ms) RTT 80ms = 40% → 서버는 유저 옆 (절대원칙) 챗봇 단답 (~3,000ms) 2.7% Reasoning 응답 (~30,000ms) 0.27% — 버지니아냐 호주냐가 만드는 차이 = 반올림 오차 에이전트 멀티스텝 / 배치 (10분~24h) RTT ≈ 0% — 이미 배치 API 50% 할인으로 별도 상품화 (OpenAI·Anthropic 공통) 네트워크 왕복은 첫 토큰에 한 번 더해지는 고정비, 응답시간을 지배하는 건 토큰 생성시간(TPOT)의 수천 번 반복 — 분모가 커지며 분자(거리)가 사라졌다
FRAME내부 매거진 〈추론의 새 지리학〉 + arXiv "AI Inference as Relocatable Electricity Demand"(2026.5) — 추론을 '이동 가능한 전력수요'로 정식화: 요청이 가장 가까운 사이트에서 처리될 필요가 없다면, 추론은 전력을 송전하는 대신 수요를 가상으로 이동시키는 메커니즘이 된다.

4-1MoE는 추론을 흩뿌리지 않는다 — 빨아들인다

Latency 산수는 "멀리 가도 된다"까지만 설명한다. "멀리 가야 한다, 그것도 크게 모여서"를 만드는 것이 MoE 추론 경제학이다. 수백 개 expert를 수많은 GPU에 펼치고(대규모 expert parallelism) 거대한 배치로 트래픽을 흘려야 expert 가동률이 차고 토큰당 원가가 깨진다 — DeepSeek이 보여준 prefill/decode 분리(disaggregation)가 정확히 이 구조다. 작은 사이트에 쪼개면 expert가 놀고 원가가 폭등한다. 하드웨어도 같은 방향: NVL72→NVL576 랙스케일, 랙당 전력밀도 120kW→600kW+는 도심 코로케이션이 물리적으로 수용 불가 — 추론을 그린필드 초대형 캠퍼스로 밀어내는 힘.

코로케이션 업계(Iron Mountain·CoreSite류)는 여전히 "추론은 sub-50ms, 인구밀집 인근"이라 쓴다 — 컨센서스가 구프레임에 머물러 있다는 사실 자체가 이 논지의 알파가 살아있다는 증거다(도심 자산을 팔아야 하는 이해상충도 감안).

실증 사례 (2024–2026)무엇을 했나입지 논리
Microsoft 북유럽"데이터센터 확장은 이제 사용자 수요지가 아니라 무탄소 전력 풍부지가 결정"(AI 인프라 담당 공식 발언)한랭기후 + 안정 전력망 + 무탄소 전력
Google 핀란드€10억 추가 투자 — 기존 핀란드 DC는 97% carbon-free energy 운영풍력 잉여 + 냉각 + CFE
Crusoe / OpenAI Stargate Abilene, TXStargate 1단계 — stranded energy(송전 못 태우는 에너지)를 컴퓨트로 전환하는 회사가 시공풍광 과잉으로 전력가 음수 구간 발생 지역
xAI Memphis전력 부족으로 가스터빈 동원 — 300MW 요청, 150MW 승인, 변전소 확보전입지 1번 변수 = GPU가 아니라 전기임을 역증명
Meta El Paso, TX$15억 투자, 최대 1GW 확장 가능 사이트, 100% 재생 매칭강한 전력망 명시
Applied Digital미공개 하이퍼스케일러와 210MW AI Factory 15년 리스 — 기본 $52억, 갱신 포함 $127억전력 연결 확보된 부지 자체가 상품이 됨
Antimatter (프랑스)2030년까지 모듈형 마이크로 DC 1,000개·40만 GPU — 풍력·태양광·수력·바이오가스 옆에 직접 부착그리드 증설 대기 없이 막힌 에너지를 현장 추론으로 전환
Anthropic × 호주 / IREN 남호주Anthropic 호주 정부 MOU("DC·에너지 투자 검토"), IREN 호주 최대 800MW 캠퍼스 — 남호주는 낮시간 도매전력의 절반이 0원 이하, AEMO 파이프라인 5.4GW유저(시드니)가 아니라 전기가 공짜에 수렴하는 곳을 선택
중국 동수서산동부 데이터·수요 → 서부 전력·컴퓨트 허브. 허브가 신규 컴퓨트 60%+, 녹전 80%+, 허브 밖 대형 DC 신설 억제(NDRC 2023 시행의견)이 구조를 국가 단위로, 가장 먼저, 가장 노골적으로 — 민간 버전들의 선행 모델
유저 옆에 남는 것 (LOCAL)
  • 실시간 음성·영상 — 수백 ms 왕복이 대화 리듬을 깸
  • 코딩 자동완성 등 TTFT 초민감 워크로드
  • KV캐시·라우팅·세션 상태 등 얇은 서빙 레이어
  • EU 등 데이터주권·규제가 위치를 강제하는 워크로드
  • 금융 등 ms가 곧 돈인 특수 도메인
전기 싼 곳으로 가는 것 (REMOTE) — 성장의 주력
  • Reasoning 추론 (thinking 토큰 수천 개)
  • 에이전트·백그라운드 워크플로우 트래픽
  • 배치/비동기 추론 — 이미 50% 할인으로 상품화
  • 무거운 prefill (disaggregation으로 물리적 분리 가능)
  • 학습·파인튜닝·합성데이터 생성 (원래부터)
CAPTURE — 모델 회사가 데이터센터 설계자를 뽑기 시작했다
Poe Zhao — DeepSeek IDC 설계기획 엔지니어 채용공고
READDeepSeek이 'IDC 설계기획 엔지니어'(부지선정·전력계통·액체냉각·랙 배치·건설사양)를 직접 채용 — Poe Zhao의 독해: "GW급을 계획하고 있다는 신호. 완전히 다른 차원의 프로젝트." 모델 회사가 전력·부동산 레이어로 직접 내려가는 수직계열화 — '전기가 입지다'의 가장 미시적인 실증이자, OpenAI Stargate의 중국 버전 전조.
똥멍청이도 이해하는 설명옛날 인터넷 장사는 손님 가까운 곳에 가게(서버)를 내야 했다. 그런데 AI 추론은 손님이 어차피 30초 기다리는 장사라, 가게가 버지니아든 호주 사막이든 닝샤든 상관없어졌다. 남는 기준은 딱 하나 — 월세(전기료)가 제일 싼 곳. 전기를 들고 도시로 못 오면, AI 공장을 전기 싼 사막으로 보내서 거기서 토큰을 찍는다. 미국 빅테크도, 호주도, 중국도 지금 전부 이 게임을 하고 있다.

논지 접합부(논문에 그대로 쓸 문장): "AI 추론은 디지털 형태의 전력수요다. 전력망으로 전기를 보내기 어렵다면, 광케이블로 추론 요청을 보내면 된다. 이 순간 데이터센터 입지는 고객 밀집지가 아니라 전력 잉여지로 이동한다. 중국의 동수서산은 단순한 데이터센터 지방분산 정책이 아니라, 전력 잉여 지역을 토큰 생산지로 바꾸는 산업정책이다. 미국 하이퍼스케일러도 같은 문제를 풀고 있다 — AI의 병목은 칩만이 아니라 전기다. 다만 모든 추론이 이동하는 것은 아니다. 실시간은 유저 곁에 남고, 장문·비동기·에이전트형 반복작업이 전기 싼 곳으로 이동한다. 이 분리가 중국의 토큰 디플레이션 전략을 가능하게 만든다."

Chapter 05 · The Economics of 1GW

1GW의 경제학 — 미·중 토큰 원가 구조 정면 비교

"칩은 미국이 좋은데 왜 토큰은 중국이 싼가"를 한 장으로. 답은 토큰퍼와트(token/W)가 아니라 토큰퍼달러(token/$)의 게임이기 때문이다 — 와트당 효율의 열세를 와트의 가격으로 뒤집는 구조.

CAPTURE — 출발점: 1GW 컴퓨트 구축비의 미·중 격차 (그리고 2026년의 반전)
Zephyr — 2025년 중국 하드웨어 기준 1GW 구축비 2~2.3배 저렴, FLOPS 기준 동등, 2026 부품 인플레로 Atlas 800T 서버 2배 상승
READ① 2025년: 중국산 HW로 1GW 구축 시 2~2.3배 저렴. ② 단 FLOPS 기준으론 동등 — NVIDIA의 Flop/W가 2.5~3배(fp16) 우위라서. ③ 2026년 반전: CPU·메모리·광·스토리지 부품 인플레 + GPU 품귀로 Atlas 800T 서버가 80만~100만 위안 → 180만~200만 위안으로 2배 폭등. → 칩 자급의 대가가 '컴포넌트 인플레'로 청구되는 중 — 토큰 디플레 전략의 단기 역풍이자, CXMT/국산 부품 램프가 중요한 이유.
FIG.04 — 토큰 원가 분해: 와트당 효율의 열세 vs 와트 가격의 우위
🇺🇸 미국 스택 (NVIDIA) 🇨🇳 중국 스택 (Ascend) 항목 칩 효율 (Flop/W, fp16) 2.5~3× 1× (기준) 1GW 구축비 ($/W, 2025) 2~2.3× 1× — 절반 이하 산업용 전기요금 1× (美 기준) 中·印 < 美 ≪ EU(美의 ~2배) IEA 2025 산업 전기요금 비교 · 서부 허브 직공급 PPA는 추가 할인 + 음수가격 구간 모델 효율 (토큰당 FLOPs) SOTA dense+MoE V4 = V3.2의 27% (압축 우위) 자본비용·보조 주식시장 · FCF 적자 감수 특별국채·그린ABS·算力券 10~50% = 결과: 토큰퍼와트는 미국 우위, 토큰퍼달러는 중국 우위 미국의 승리 조건 전력이 병목인 한 Flop/W가 왕 frontier 능력 = 가격결정력 유지 가치($)의 전쟁에서 승리 중 중국의 승리 조건 전기가 남아도는 한 와트는 싸다 — 효율 열세 4.1×를 전기·정책·압축으로 상쇄 물량(token)의 전쟁에서 승리 중 단, 2026년 컴포넌트 인플레(Atlas 800T ×2)가 중국 측 구축비 우위를 한시적으로 잠식 — 국산 부품(CXMT·광·전력) 램프가 회복의 열쇠
SOURCEZephyr(@zephyr_z9) 캡처 · IEA 2025 산업 전기요금(EU≈美×2, 中·印은 그보다 50%+ 낮음) · CloudMatrix384 전력 4.1× (슬랙 딥다이브) · Ember: 中 전력의 42%가 청정전원(2025).

5-1"전기 1kWh → 토큰 = 가치 22배" — 전력의 부가가치 사다리

국가데이터국이 소개한 CCTV 보도는 간쑤 칭양을 'global token factory' 프레임으로 설명하며 "전기 1kWh를 그대로 파는 것보다 토큰 서비스로 전환하면 가치가 약 22배"라는 환산을 제시했다. 알루미늄(전기 → 금속), 비트코인(전기 → 해시)에 이은 전력 부가가치화의 3세대 공식 — 차이는 토큰이 알루미늄보다 마진이 크고, 비트코인과 달리 생산성과 직결된 '유용한' 산출물이라는 점. 중국 입장에서 토큰 수출은 잉여 그린전력의 최종 수요처이자 최고 마진 수출 경로다.

Chapter 06 · The Silicon Stack

화웨이 추론공장 — 시스템으로 싸우고, 내수로 학습곡선을 산다

"최고급 레이싱카는 못 만들어도, 택시와 물류트럭을 세계에서 가장 많이 깐다"(GPT 메모). 칩 한 장이 아니라 칩+인터커넥트+액체냉각+클러스터 SW를 묶고, 국가 프로젝트가 학습곡선을 보장하는 내수시장이 된다.

FIG.05 — Ascend 로드맵: 추론공장의 생산라인
2025.5 양산 910C 910B ×2 결합 구조 Atlas 900 A3 SuperPoD: 384칩+192 Kunpeng 300+세트 · 20+고객 1Q26 출시완료 950PR Prefill·추천 특화 HiBL 1.0 · 128GB 1.6TB/s · 자체 HBM FP8 1P/MXFP4 2PFLOPS "HBM3E/4E보다 저원가" Atlas 350로 데뷔(26.3) 4Q26 950DT Decode + 학습 HiZQ 2.0 · 144GB 4TB/s · IC 2TB/s(×2.5) ★ V4 공동설계 타깃 V4 Pro 추가인하 트리거 2026 출하목표 ~75만개 4Q27 960 Blackwell 패리티 목표 288GB · 9.6TB/s 격차 5년 → 2년 2028 970 Rubin+ 패리티 첫 '동세대' 도전 FP4 4 ZFLOPS 신규 포맷 FP8 · MXFP8 · MXFP4 · HiF8 + Prefill/Decode 칩 분리 = 압축혁명의 하드웨어 버전 (NVIDIA Rubin CPX보다 빠른 상용화) 반론 데이터: 美 상무부 "화웨이 고급 AI칩 2025년 생산은 연 20만개 상한" — 75만개 목표와의 갭이 2026년 최대 검증 포인트
SOURCEHuawei Connect 2025 Xu Zhijun 키노트 · Atlas 900 A3 SuperPoD 공식 스펙(384×128GB, 300/Z 호환 PFLOPS, 양방향 784GB/s) · Reuters(910C 양산, 20만개 상한 발언) · 슬랙 'Compute King'(75만개 목표).

6-1파운드리·캡티브 수요 — 폐회로가 굵어진다

Chapter 07 · The Memory Bottleneck

메모리 — NAND는 따라왔고, DRAM은 크는 중이고, HBM이 병목이다

CAPTURE — CXMT의 다음 수: 3D DRAM 미국 특허 (US12376279B2)
Fred Chen — CXMT 3D DRAM 특허 도면, 2022년부터 개발
READ리소그래피 전문가 Fred Chen: "CXMT는 2022년, 혹은 그 이전부터 3D DRAM을 개발해왔다 — 이미 미국 특허." 함의: ① CXMT의 야심이 'HBM 추격'에서 끝나지 않고 차세대 아키텍처(3D DRAM) 선행 베팅까지 걸쳐 있음. ② 2D 미세화에서 막힌 후발주자가 3D 적층으로 '차선 변경 추월'을 노리는 전형적 패스트팔로워 전략 — YMTC가 NAND에서 Xtacking으로 했던 것과 동일한 플레이북의 DRAM 버전. ③ 단, 특허 ≠ 양산 — 수율 리스크는 그대로.
Chapter 08 · Power & Patient Capital

전력과 인내자본 — 국가가 추론공장의 재무제표를 짠다

2025년 말 재생에너지 설비 23.4억kW(전체의 ~60%), 풍광 18.4억kW가 사상 처음 화력을 추월. IEA 기준 중국 산업 전기요금은 미국보다 낮고 EU의 절반 이하다. 이 전기 위에 국채·그린ABS·리츠·바우처가 얹힌다.

FIG.06 — 미·중 전력 레이스: 누적 발전설비 (2000–2030E, GW)
01,0002,0003,0004,0005,000 2000200520102015202020252030E 中 2035 풍광 목표만 3,600GW (시진핑 UN 선언, 25.9) = 美 전체 그리드의 ~2.8배 미국 ~1,300GW 25년간 +50% · 계통연결 대기열 수년 중국 ~3,900GW 재생 23.4억kW(60%) · 풍광>화력 첫 역전 2011년경 발전량 美 추월 → 이후 격차는 한 방향 연간 신규 설비 (2025): 중국의 1년 ≈ 미국의 8년 中 ~500GW (태양광 315GW 포함) 美 ~60GW (역대 최고치인데도)
SOURCENEA·CEC·EIA·Ember·IEA 종합(수치는 근사치, 2030E는 추세 외삽 + 정책목표). 독해 3줄: ① 2000년 중국 그리드는 미국의 1/3이었다 — 지금은 3배다. ② 미국이 25년에 걸쳐 더한 용량(+450GW)을 중국은 1년 만에 더한다. ③ AI의 병목이 칩에서 와트로 이동하는 순간(Gavin Baker "Watts and Wafers", xAI의 가스터빈 동원이 그 증상), 이 차트가 곧 토큰 생산능력 차트가 된다 — 추론공장 전쟁의 탄약 비축량.
CAPTURE — 헤드라인: 2조 위안($295B) 전국 AI 인프라 플랜
Bloomberg — China Prepares $295 Billion Plan to Fund Nationwide AI Buildout
READBloomberg(26.6.9): NDRC 주도 5년 2조 위안 — 국유통신사가 DC 운영+연결망, 재원은 초장기 특별국채+전략산업펀드, 핵심기술 80% 국산(화웨이 중심) 조달 조건, 전력망 통합 시 $700B+ 확장 시나리오. 내부 계산: IT설비 ~$28B/yr → 광모듈 순증 ~$4~5B/yr(현 시장 +50~65%), HBM 수요 ~$2.5~3B/yr. scale-across 구조라 long-haul DCI(800G→1.6T)가 capex 본체 — 광은 중국 직접수혜(Innolight·Eoptolink), 메모리는 한국 간접수혜.
FIG.07 — 전력·DC 대시보드 + 자본조달 3종 세트
발전: 풍광, 화력을 첫 추월 18.4억kW풍력+태양광 화력사상 첫 역전 재생 합계 23.4억kW (~60%) · 태양광 12억kW · 풍력 6.4억kW Ember: 中 전력의 42%가 청정전원 · 글로벌 태양광 증가분의 절반+가 중국 DC: 32GW('25말) → 60GW+('30), 소비 289TWh · 허브 신규 DC 녹전 80%+ 의무 전국 지능산력 188만 PFLOPS(26.3) · 국가 플랫폼이 72% 통합 모니터링 — 컴퓨트의 유틸리티화 자본: 공급·수요 양쪽에서 원가를 깎는 정책믹스 ① 공급측 — 자산 유동화 VNET: 中 IDC 최초 보유형 그린ABS(사모 REIT) 발행 + 26.3월 REIT 2건 상장 = 자본회수 모델 완성 ② 수요측 — 컴퓨트 바우처 (算力券·模型券·语料券) 톈진 10% · 후난 최대 30% · 중산 최대 50% + 토큰 호출비까지 보조 대상 ③ 국가자본 — 빅펀드의 모델 레이어 진입 반도체 빅펀드, DeepSeek $450억 밸류 협상 — LLM 투자 첫 사례 = '파운드리급 국가 인프라' 승격 + 산업자본 — CATL의 AIDC 풀스택 중헝(HVDC 49%) → Hyperstrong(나트륨 60GWh) → VNET 38.1%($942M) 5주 3연타
SOURCENEA 2025 통계 · Ember · Rystad · 국가데이터국(15.5계획 109개 중대공정에 전국일체형 컴퓨트망 포함) · VNET IR · 지방정부 바우처 공고 · FlashPoint · JPM/MS. 산전협동 실물 1호: 따탕 닝샤 중웨이 500MW 태양광 DC 직공급(26.5 상업운전, 연 970GWh).
똥멍청이도 이해하는 설명미국 AI는 주주 돈(3년 안에 수익 요구)으로 짓고, 중국 AI는 ① 30년짜리 국채 ② 데이터센터를 리츠로 만들어 회수한 돈 ③ 지방정부가 뿌리는 'AI 사용 상품권'(토큰 호출비의 최대 50% 보조!) ④ 세계 1위 배터리회사의 잉여현금으로 짓는다. 손님(수요)에게도 보조금, 가게(공급)에도 보조금 — 양쪽에서 토큰 원가를 깎아주는 나라와 가격경쟁을 하는 셈이다.
FIG.08 — 시그니처: 토큰 원가의 곱셈 구조 (논문의 구조도)
① 잉여 그린전력 — 재생설비 23.4억kW, 풍광 > 화력 서부 커테일먼트·음수가격 구간 → 1kWh를 토큰으로 바꾸면 가치 ~22배 최저가 그린 전기 ② 추론공장 IDC — 동수서산 = '전기가 입지다'의 국가 버전 허브 신규 컴퓨트 60%+ · 녹전 80% 의무 · 그린ABS/리츠 조달 · 따탕 직공급 저원가 컴퓨팅 시간 ③ Ascend SuperPoD — 외산칩 금지 + 국산 80% 조달의 캡티브 수요 성능/와트 열세(전력 4.1×)를 전기료·정책으로 상쇄 — 토큰퍼달러의 게임 저원가 FLOPs ④ 압축 모델 — V2 KV −93.3% → V4 FLOPs 27% · 인프라까지 원가절감(3FS) MoE 집적 경제학이 ②의 초대형 캠퍼스를 요구 — 모델과 입지의 공진화 저원가 토큰 ⑤ 주간 토큰 美 첫 추월(4.12조 vs 2.94조) → 토큰 수출 (산터우 검증 · Token Hub) 각 층이 아래층의 절감을 증폭하는 곱셈 구조 — 4~20배 가격차의 공학적 출처
NOTE전력 우위 × 클러스터 정책상쇄 × 모델 FLOPs −73%의 중첩 — 토큰 원가는 한 자릿수 배율이 아니라 수십 배 절감 가능.
Chapter 09 · The Pareto Frontier

파레토 곡선 — 중국이 점유하는 영역의 정밀 정의

FIG.09 — 품질-가격 평면: 가치의 전쟁 vs 물량의 전쟁
토큰 단가 ($/1M) → 태스크 난이도 · 가치 → 美 SOTA Frontier — 가치의 전쟁 (Anthropic ARR 단월 +$110억) 中 압축 모델 — 물량의 전쟁 (주간 토큰 첫 추월) 품질 충분선 — frontier가 능력을 올릴 때마다 위로 이동 중국 점유 영역: 충분선을 넘는 모든 영역의 좌하단 경계 에이전트 경제학이 중국에 유리한 이유 태스크당 토큰 10~50배(Jensen Huang) 중 다수는 도구호출·검색요약·반복 루프 = 반복적·검증가능·저위험 + 추론 수요는 훈련의 3:1 이상(국가데이터국 전망) → 물량의 무게중심은 구조적으로 저가 모델·전기 싼 입지로
FRAMEGS 이분화 프레임 + 본 분석 종합. 침투 순서: ① 글로벌 사우스 B2C/B2B → ② 개발자/스타트업 백엔드(美 스타트업의 중국모델 채택 — nxthompson) → ③ 오픈웨이트 셀프호스팅('레시피 수출') → 한계선: 美·EU·日 정부/금융 규제 워크로드.
Chapter 10 · Steelman the Bear Case

반론과 리스크 — 논문의 신뢰도를 만드는 부분

RISK 01 · 물량의 상한

"연 20만개" vs "75만개" — 칩 생산량 논쟁

美 상무부: "화웨이가 2025년 생산 가능한 고급 AI칩은 20만개 이하." 중국 측 2026년 목표 75만개와 3.75배 갭. SMIC 7nm 수율·캐파가 진실의 심판자.

↳ 검증: Atlas 출하·서버 가격(컴포넌트 인플레 완화 여부)·V4 Pro 추가 인하 실행 여부가 프록시.
RISK 02 · 단일 최대 변수

CXMT HBM 수율 + 컴포넌트 인플레

TrendForce, 26년 초에도 中 HBM 기술장벽·지연 경고. 그 사이 Atlas 800T 서버가 2배 폭등(80만→180만 위안) — 칩 자급의 대가가 부품 인플레로 청구되며 1GW 구축비 우위(2~2.3배)를 잠식 중.

↳ 3D DRAM 특허(US12376279B2)는 장기 차선변경 옵션이지 단기 해법 아님.
RISK 03 · 소프트웨어 락인

CUDA 생태계의 관성

중국산 칩 채택은 NVIDIA SW 생태계 의존성 때문에 예상보다 더딜 수 있음(Reuters). 듀얼트랙 의혹(V4 실제 학습은 내몽골 Blackwell설)도 같은 줄기 — frontier 학습은 여전히 회색 NVIDIA.

↳ 단, 토큰 수출의 본체인 추론 단은 국산 칩 + 자체 서빙스택으로 충분 — 논지 자체는 무사.
RISK 04 · 지정학 차단

美 상원 '중국 AI 해외판매 견제' 법안

이미 입법 준비 중(Reuters). 5G 화웨이의 데자뷔 — 성능·가격이 좋아도 정부·공공·규제산업에선 "어디산 모델인가"가 구매조건. 토큰 수출은 '전 세계'가 아니라 정치적으로 허용되는 시장을 먼저 먹는 게임.

↳ 본 논지의 최대 꼬리위험. 모건스탠리도 token export의 핵심 변수로 지정학 지목.
RISK 05 · 통계 착시

OpenRouter 점유 ≠ 시장 점유

최다사용 모델의 일매출 $5.6k(Mazurek 캡처) — 가격민감 개발자 편중 '실험실' 데이터를 전체 시장으로 외삽 금지. 물량 점유(50~61%)와 매출 점유(한 자릿수%)를 반드시 병기.

RISK 06 · 품질·latency의 부활

충분선의 상향 + 효율화의 역설

DeepSeek 스스로 최고난도 멀티턴에선 Claude Opus 우위 인정. 또 모델 효율화로 30초 응답이 3초가 되면 latency 민감도가 부분 부활할 수 있음 — 다만 그 효율은 더 많은 thinking에 재투자돼온 게 패턴(Jevons).

↳ 베어케이스: HBM 지연 + CUDA 관성 + 美·EU 제도 차단이 겹치면 → '세계 토큰 디플레이셔너'가 아니라 '자국 내 AI 유틸리티 강국'에 그침.
Chapter 11 · Portfolio Mapping

투자 함의 — Must 포트폴리오 관점 매핑

레이어중국 직접수혜한국 · 글로벌 간접수혜역풍
전력·ESSCATL(AIDC 2nd Curve), 중헝전기, 디젤 3대장(CYD·Weichai·Chongqing M&E)변압기·HVDC 수출주 — 中 대형변압기 수출 26년 1~2월 +225%美 전력기기와 신흥국 출혈경쟁
데이터센터VNET(CATL 앵커+500MW MoU+그린ABS/리츠, MS Top Pick $16), GDSFRMI · IREN · KEEL — '전기가 입지다'가 파밴들·남호주형 원격 GW 캠퍼스의 최대 반론("추론은 유저 옆 필요")을 무력화. FRMI thesis의 핵심 방어논리CATL 지정학 전이 / MOU 단계 리스크(Anthropic 호주)
광통신Innolight·Eoptolink — scale-across long-haul DCI 수혜, 27~28년 주문 확보장거리 백본이 새 단일 장애점 = 해저케이블·코히어런트 투자 기회중국 내수 위주 구조
메모리CXMT(IPO 추진 — 3D DRAM 옵션)삼성·하이닉스 — 中 자급 발버둥 = 글로벌 HBM/DRAM 타이트닝 간접수혜 + 中 컴포넌트 인플레가 가격 지지CXMT 수율 성공 시 범용 D램 장기과잉
모델·앱MiniMax(GS Buy, Bull HK$1,600), Zhipu, Kingsoft Cloud일매출 $5.6k가 보여주는 수익화 거리, 7월 락업
미국 측AVGO/ASIC — 中 효율압박발 추론단가 하락은 ASIC 수요에 양날의 검(Hock Tan) → 차기 분기 핵심 워치토큰 디플레가 美 추론 마진·캐펙스 ROI 압박 / 도심 코로케이션 프리미엄 희석
Monitoring Checklist

분기별 모니터링 지표 10선

01DeepSeek/MiMo/MiniMax API 고시가격 — 추가 영구인하 = Ascend 950 램프 순항의 프록시
02OpenRouter 물량 vs 매출 점유 갭 — $5.6k/day가 $56k/day가 되는가 (수익화 전환)
03Ascend 출하 20만 vs 75만 논쟁의 판정 — Atlas 서버가·SMIC 가동률·CXMT HBM3 수율
04컴포넌트 인플레 완화 여부 — Atlas 800T 180만→? 위안 (1GW 구축비 우위 복원)
052조 위안 집행 — 특별국채 발행·국유통신사 capex·국산 80% 룰 적용 사례
06토큰수출 시범구 확대(산터우/칭양) + 토큰 선물시장 제도화 + Token Hub 해외 리전
07美 상원 중국 AI 해외판매 견제 법안 진행 — 논지의 최대 꼬리위험
08'전기가 입지다' 트래킹: Anthropic 호주 부지/PPA 공시, IREN 800MW 착공, AEMO 5.4GW 파이프라인, FRMI 테넌트
09DeepSeek IDC 채용 후속 — 부지·전력계약 공시 = GW급 자체 인프라 가설의 확정 신호
10VNET: SDHG 잔여지분 처분, CATL BESS/HVDC 계약 가시화, REIT 추가 상장, 홍콩 상장
Chapter 12 · Sources

핵심 소스 리스트

슬랙 내부 + GPT 검증메모 + 내부 매거진 〈추론의 새 지리학〉 + 웹(26.6). 추정치는 논문 인용 시 'estimates' 표기 권장.

정책 2026 정부업무보고 — AI 오픈소스·초대형 지능연산 클러스터·산전협동·공공클라우드 국가과제화
정책 국가데이터국 — "Token 호출 신업태", 15.5계획 109개 중대공정(전국일체형 컴퓨트망), 188만 PFLOPS·72% 통합관제, 추론:훈련 3:1
정책 NDRC 2023 동수서산 시행의견 — 허브 신규컴퓨트 60%+, 녹전 80%+, 허브 외 대형DC 억제
관영 China Daily/인민일보 "Tokens are China's next goldmine"(26.6.1) · WIC 주간 4.12조 vs 2.94조 첫 추월 · CCTV 칭양 'token factory'/1kWh→22배
캡처 Bloomberg(26.6.9) $295B 플랜 / Zephyr 1GW 구축비·Atlas 800T ×2 / Fred Chen CXMT 3D DRAM 특허 / Poe Zhao DeepSeek IDC 채용 / Mazurek $5.6k·V4 Flash 차트 / Prof G 주간토큰 추월
기술 DeepSeek V2/V3/R1/V4 기술보고서 · Fire-Flyer 2 · 3FS(6.6TiB/s) · DeepSeek 공식 API 가격(V4 Flash $0.14/$0.28, 캐시히트 $0.0028)
기술 Huawei Connect 2025(Ascend 950/960/970, HiBL/HiZQ) · Atlas 900 A3 SuperPoD 공식 스펙 · Reuters 910C 양산
반론 Reuters — 美 상무부 "20만개 상한" · CUDA 생태계 의존 · 상원 중국 AI 견제 법안 · 듀얼트랙(내몽골 Blackwell) 보도
파운드리 SMIC 연차보고(월 105.9만장·93.5%·capex $8.1B·유일 7nm·NAURA) · 국산장비 50% 룰 · 외산칩 금지 지침
메모리 CXMT(HBM3 26년말·점유 4%·IPO) · YMTC(Xtacking 4.0·캐파 2배) · TrendForce 경고 · US12376279B2
전력 NEA 2025(재생 23.4억kW·풍광>화력) · Ember(청정 42%) · IEA 산업 전기요금 · Rystad(DC 32→60GW) · 따탕 중웨이 직공급
자본 VNET 그린ABS/REIT 2건 상장 · 算力券(톈진 10/후난 30/중산 50%) · 빅펀드-DeepSeek(FlashPoint) · CATL 3연타(JPM/MS)
지리학 내부 매거진 〈추론의 새 지리학 — 전기가 입지다〉 · arXiv "AI Inference as Relocatable Electricity Demand"(2026.5) · Anthropic 호주 MOU · IREN 800MW · AEMO 5.4GW
지리학 Reuters MS 북유럽/Google 핀란드 €1B/Meta El Paso/Applied Digital $5.2B · TIME Crusoe Abilene · BI xAI Memphis · TechRadar Antimatter
시장 GS 미·중 가격비교($0.2~1 vs $4)·이분화 프레임 · 삼성증권 가격인하 트렌드 · Gavin Baker 채록 · SemiAnalysis V4 Day0→43 · Reuters 일일 140조 토큰·토큰 선물시장
검증 GPT 메모 〈중국의 AI Endgame은 무엇인가〉 — 독립 검증으로 동일 결론(UNIDO/CSIS 제조업 28%, 정부문서 원문 인용 다수)