출처: Citrini Research · 테마 리뷰 뉴스레터MUST ASSET — 시황 데일리

오늘의 시황

AI 인프라 랠리 이후 찾아온 "토큰 패닉" — 비용 현실화와 오픈소스 부상이 테마의 판도를 흔들다

3줄 요약

  1. Citrini 6대 테마 바스켓 중 4개가 미국 시장 대비 아웃퍼폼 — AI·로보틱스 선두, NatGas·재정지출이 변동성 완충 역할.
  2. 기업 AI 비용 폭발로 "토큰 패닉" 확산 중 — Anthropic ARR $45B(연초 대비 5×), MS·Google·OpenAI 전원 사용량 기반 과금 전환.
  3. 프런티어 대비 10~25× 저렴한 중국 오픈소스(Deepseek V4·Qwen 3.7)가 OpenRouter 점유율 1위 등극 — 로컬 추론·경량화·스마트 라우팅 테마 부상.
오늘 한눈에 — Coverage at a Glance
테마/종목하우스핵심 한 줄
AI 인프라 전반 Citrini Research Cautious 반도체 섹터 2개월 만에 시총 2배, 이제 포지션 과열 경계
Token Panic Citrini Research Negative 기업 AI 예산 소진 속출, 무료 AI 종료·토큰 이코노믹스 시대 개막
OpenAI / Anthropic Citrini Research Negative Anthropic ARR $45B, 동시에 MS가 Claude Code 라이선스 취소
Deepseek / 중국 오픈소스 Citrini Research Positive 미국 대비 10~25× 저렴, OpenRouter 토큰 처리 1위 등극
Cursor (코딩 에이전트) Citrini Research Positive xAI 컴퓨트 + Moonshot 베이스모델, 미국 프런티어 대비 10× 저렴·동급 성능
테마 포트폴리오 성과 Citrini Research Positive GOOG 9개월 2배·KOSPI 3배·TWSE QQQ 대비 +60% 등 과거 콜 적중
CitrindexPositive

3년 성적표 — GOOG 2배, KOSPI 3배, TWSE QQQ 대비 +60%

Citrini Research · State of the Themes: June 2026 · 관련: GOOG, KOSPI, TWSE, QQQ
💡 유레카 포인트

Citrini의 테마 바스켓은 단순 섹터 ETF와 달리 "수혜 기업은 계속 바뀌지만 기저 드라이버는 불변"이라는 원칙으로 운영된다. 작년 8월 State of Themes에서 한국·대만을 미국 대비 아웃퍼폼으로 찍은 뒤 KOSPI가 3배, TWSE가 QQQ를 60%p 이상 아웃퍼폼했다는 사실은 테마 프레임의 유효성을 보여준다. 다만 올해 초 메모리 익스포저를 일찍 축소한 건 실책으로 자평.

GOOG (8월 2025 콜 이후)
+100% 9개월 누적
KOSPI (한국 강세 콜 이후)
+200% 트리플
TWSE vs QQQ
+60%p 아웃퍼폼
6대 테마 중 미국 시장 아웃퍼폼
4 / 6 2026 YTD

무엇이 바뀌었나: AI·로보틱스가 성과를 주도했고, NatGas Energy와 Fiscal Primacy가 이란發 매도세 구간에서 포트폴리오 완충 역할을 했음. 반도체 시총은 2개월 만에 2배로 급등 — 이제는 과열 여부를 점검해야 할 시점.

구조적 특이점: 테마 내 수혜 기업은 Fiscal Primacy(정부 지출)처럼 집권 정부에 따라 매년 달라질 수 있고, Dynamic AI는 하드웨어 → 소프트웨어 → 건설·엔지니어링으로 수혜 축이 이동하지만, 기저 드라이버 자체는 유효하다는 게 Citrini의 일관된 논리.

AI COSTNegative

"토큰 패닉" — Q1에 연간 AI 예산 소진, 이제 비용 현실화 국면

Citrini Research · 관련: Anthropic, OpenAI, MSFT, GOOGL
💡 유레카 포인트

불과 몇 달 전 "토큰 맥시멀리즘" 분위기가 지배했다면, 지금은 기업 고객의 AI 비용 폭발이 미디어 아발란체 수준으로 번졌다. Uber가 4개월 만에 AI 예산을 소진한 사례, 익명의 $500M 과소비 사고, Sam Altman의 직접 언급까지 — "비용"이 AI 내러티브의 두 번째 핵심 키워드가 됐다. 이는 단순 불만이 아니라 VC 교과서적 보조금 → 수익화 사이클의 본격 전환점을 의미한다.

Anthropic ARR (2026년 5월)
$45B 연초 대비 5×
익명 오버스펜드 사례
$500M 단일 사건
Claude Opus 4.7→4.8 토크나이저
+35% 동일 텍스트 대비 토큰 증가

무엇이 바뀌었나: 세 가지 요인이 동시에 터졌음. ① 에이전트·고급 추론 모델은 일반 모델 대비 압도적으로 많은 토큰을 소비. ② 기업들이 광범위하게 툴을 배포하면서 일반 사용자까지 대규모 비용을 무의식적으로 집행. ③ 상장 준비를 앞둔 랩들이 무한 보조금 지속 불가 판단하에 일제히 사용량 기반 과금으로 전환.

빅4 과금 전환 타임라인: 2026년 4월 2일 OpenAI — Codex를 메시지당 정액 → API 토큰 사용량 과금으로 변경. 5월 19일 Google — Gemini 구독을 "일일 프롬프트 제한"에서 "사용 컴퓨트" 모델로 변경. 6월 1일 Microsoft GitHub Copilot — 사용량 기반 과금으로 전환.

파장: 기업들은 AI 기능을 제한하고 관측 가능성(Observability)·비용 추적 툴에 투자 시작. 과학적 실험성 에이전트·호기심성 워크플로우는 오픈소스 모델로 오프로드되거나 폐기될 전망. AI 예산 vs 헤드카운트 트레이드오프도 부상.

쉽게 풀어보기 — 토큰 이코노믹스란?
토큰(Token)
AI 모델이 텍스트를 처리하는 최소 단위. 단어 하나가 보통 1~2개 토큰. 대화가 길수록, 추론이 복잡할수록 토큰이 기하급수적으로 늘어남.
토크나이저 변경
같은 문장을 더 잘게 쪼개 토큰 수를 늘리면 사용자 입장에선 요금이 오르는 효과. Anthropic Opus 4.7→4.8에서 동일 텍스트가 최대 35% 더 많은 토큰으로 처리될 수 있음.
사용량 기반 과금(Usage-based Billing)
정액제 대신 실제 사용한 토큰만큼 청구. 쓸수록 더 낸다는 의미. 파워유저·에이전트 무제한 사용 보조금이 사라짐.
Observability(관측 가능성)
어떤 AI 기능이 얼마의 비용을 발생시키는지 실시간 추적하는 소프트웨어 범주. 비용 현실화 국면에서 급성장 예상.
Anthropic / MSFT / GOOGLNegative

MS, Claude Code 라이선스 취소 — "Anthropic은 지나치게 비싸다"

Citrini Research · 관련: Anthropic, MSFT, OpenAI, GOOGL
💡 유레카 포인트

Microsoft의 AI 수장이 Claude Code 라이선스를 5월에 직접 취소하고 "Anthropic은 극도로 비싸며 많은 이들이 대안을 찾고 있다"고 발언한 건 단순 불만 표출이 아니다. 최대 유통 파트너가 공개적으로 경쟁 대안을 탐색 중임을 시사하는 신호. Anthropic ARR이 5배 성장한 이면에 단가 압박이 동시에 터지고 있다.

Sam Altman 발언 (직접 인용): "비용이 두 번째로 큰 테마가 됐다. 사람들이 '우리 회사가 2026년 예산을 Q1에 다 썼다, 더 효율적으로 만들어 달라'고 한다. 연초엔 전혀 언급이 없었는데 갑자기 엄청난 이슈가 됐다."

구조적 딜레마: 랩들은 상장을 앞두고 수익화에 돌입해야 하지만, 수익화 가속은 고객 이탈과 중국·오픈소스 대안으로의 전환을 촉진하는 딜레마. 무한 보조금의 시대가 끝나고 ROI 검증의 시대가 실시간으로 전개 중.

Deepseek / Qwen / CursorPositive

미국 대비 10~25× 저렴한 중국 오픈소스 — OpenRouter 점유율 1위 탈환

Citrini Research · 관련: Deepseek V4, Qwen 3.7, Cursor, xAI, Nvidia Nemotron
💡 유레카 포인트

Deepseek V4 Pro·Flash(4월 출시) 이후 Deepseek는 OpenRouter 토큰 처리량 기준 Anthropic을 제치고 1위에 올라섰다. 벤치마크에서는 Opus 4.8·GPT 5.5에 뒤지지만 가격은 10~25× 저렴하다는 점이 결정적 무기. 코딩 에이전트 Cursor의 신모델은 xAI 컴퓨트 + 중국 Moonshot 베이스모델로 프런티어 동급 성능을 태스크당 10× 저렴하게 구현했다. "좋은 게 최고"가 아닌 "충분히 좋은 게 최고"의 시대.

Deepseek vs 미국 프런티어 가격
10~25× 저렴 Qwen 3.7 포함
Cursor 신모델 비용
태스크당 1/10 GPT-5.5 대비
OpenRouter 점유율
Deepseek 1위 Anthropic 추월

무엇이 바뀌었나: Cursor는 xAI와 $10B 규모 딜을 통해 컴퓨트를 공급받고, Moonshot(중국 오픈소스) 베이스모델을 자사 고객 데이터로 포스트트레이닝. 결과물은 Deepseek보다도 강한 성능, GPT-5.5·Claude 4.7 동급 품질을 10분의 1 비용에 제공. 미국 대기업의 중국 모델 직접 채택을 막는 규제·컴플라이언스 장벽이 있어 대규모 엑소더스는 제한적이나, 애플리케이션 레이어 기업들이 오픈소스 베이스모델을 포스트트레이닝하는 흐름은 가속될 전망.

Nvidia Nemotron 최신 패밀리: 범용 고성능 모델 + 로컬 배포·에이전트 특화 초경량 모델로 구성. 프런티어 레벨 인텔리전스의 추론 비용이 계속 하락하는 구조적 증거.

투자 함의: 로컬 추론, 모델 경량화(Miniaturization), 스마트 라우팅, Observability 소프트웨어, 효율적 모델 아키텍처 관련 기업의 수혜 가능성. 동시에 프런티어 모델 단독 의존 기업에는 경쟁 압박 심화.

쉽게 풀어보기 — 오픈소스 AI와 포스트트레이닝
오픈소스 모델
가중치(모델 파라미터)가 공개돼 누구나 무료로 다운로드·수정·배포 가능한 AI 모델. Deepseek, Qwen, Llama 등이 대표적.
포스트트레이닝(Post-training)
공개된 베이스모델을 자사 도메인 데이터로 추가 학습시켜 특정 업무(코딩, 법률 등)에 최적화하는 작업. Cursor가 자사 고객 코딩 데이터로 Moonshot 모델을 재훈련한 게 이 방식.
스마트 라우팅
쿼리 복잡도에 따라 비싼 프런티어 모델과 저렴한 소형 모델에 자동으로 요청을 분배해 비용을 최적화하는 미들웨어 기술.
OpenRouter
다양한 AI 모델 API를 단일 인터페이스로 연결해주는 플랫폼. 여기서의 토큰 처리량 순위는 실질 채택률을 반영하는 지표로 활용됨.
AI THEME OUTLOOKCautious

랠리 이후의 AI — 비용·효율 테마로 중심축 이동

Citrini Research · 관련: AI 인프라, 반도체, 엣지 AI, 에이전틱 유틸리티
💡 유레카 포인트

Citrini의 핵심 판단: 랩·하이퍼스케일러 매출은 계속 성장하지만, 이제 성장의 질과 효율 경쟁이 시장을 가른다. 단기 컴퓨트 제약은 해소되지 않겠지만, 비용·효율 내러티브가 갈수록 강해지며 로컬 추론·소형화·관측 가능성·프라이싱 경쟁 테마가 부각될 것. 프런티어 모델의 프리미엄은 고부가가치 틈새 시장에서만 유지 가능.

지속되는 것: 프런티어 모델의 하이엔드 수요(기술·금융 등 고위험 의사결정). 데이터센터 컴퓨트 투자 사이클(제약 지속). 랩·하이퍼스케일러 매출 성장.

새롭게 부상하는 것:로컬/엣지 추론 — 중앙 클라우드 없이 기기 자체에서 AI 실행. ② Observability·비용 추적 소프트웨어. ③ 스마트 라우팅 — 복잡도 따라 모델을 자동 선택. ④ 오픈소스 포스트트레이닝 특화 기업. ⑤ 도메인 특화 경량 모델(법률·코딩 등) 빌더.

리스크: 금요일 급락이 보여줬듯 혼잡한 포지션에서의 자연스러운 되돌림 가능성. 레버리지·포지셔닝·리플렉시비티가 얽혀 있는 구간에서 내러티브 전환 속도는 예상보다 빠를 수 있음.