AI 인프라 랠리의 심장부에 균열 — '토큰패닉'이 할인율 재조정 트리거
Citrini Research가 경고를 꺼냈다. AI 인프라 랠리의 다음 리스크는 외부가 아니라 내부에서 온다 — 토큰 비용 폭등이 오픈소스 대체를 촉발하고, 프런티어 모델 수익화가 압박받으면, $NVDA 중심 AI 인프라 트레이드 전반의 할인율이 강제 재조정된다는 시나리오다.
$Anthropic ARR이 연초 대비 5배인 450억 달러로 폭증했지만, 이 숫자가 역설적으로 '토큰패닉'의 근거가 됐다. 기업들의 AI 예산이 분기 내 소진되는 사태가 속출하자, $OpenAI·$Anthropic·$MSFT·Google이 일제히 사용량 기반 과금으로 전환했다. 반사이익은 Qwen·Deepseek 같은 중국 오픈소스 모델 — 프런티어 대비 10~25배 저렴해 OpenRouter 점유율이 급등 중이다.
Citrini의 다음 수혜 방향은 로컬 추론·소형화·스마트 라우팅·관측성(observability)이다. 프런티어 모델이 아니라, 비용 효율을 잡는 인프라 레이어가 다음 타깃이라는 논리다. $NVDA의 아키텍처 거부 움직임이 하이퍼스케일러 사이에서 감지되고 있다는 SemiAnalysis 리포트까지 겹치며, 오늘 장에서 AI 인프라 트레이드는 랠리와 경계감이 동시에 공존했다.