출처 Stratechery · Ben ThompsonWWDC 2026 / 6.8$AAPL $GOOGL $NVDA
Apple은 frontier 레이스를 포기하고 컨텍스트라는 해자를 택했다
질문은 "Siri가 GPT-5.5만큼 똑똑한가"가 아니다. 진짜 질문은 — 가장 똑똑한 모델조차 commodity가 되는 세상에서, 18억 대의 기기에 잠긴 개인 컨텍스트는 누구의 자산이 되는가이다. 그리고 그 답이 Apple만의 것이 아닐 수 있다.
01
레이스를 의도적으로 이탈
가장 무거운 추론 모델(AFM 3 Cloud Pro)조차 Gemini를 "교사"로 distill해 제작. 자체 SOTA를 더는 추구 안 함.
02
전장은 성능이 아닌 분배·컨텍스트
온디바이스 orchestrator가 개인데이터를 모아 구조화된 프롬프트만 클라우드로 송출. raw 데이터는 기기를 안 떠남.
03
수혜는 Apple보다 그 공급망
Google·Nvidia·온디바이스 메모리가 더 직접적 수혜. 분배 채널의 실주인이 Google일 수 있다는 게 반전.
💡 유레카 포인트
"모델은 상품화(commoditizing)되고 있다 — DeepSeek은 $0.28/M까지 내려왔다"는 명제를, Apple이 재무제표로 증명해버린 사건이다. frontier 학습 capex 수십조를 쓰는 대신 연 약 $10억으로 Google에서 빌려 쓴다. 즉 "frontier가 상품이면 해자는 데이터·분배"라는 thesis의 가장 비싼 실증이다. 단, 함정이 있다 — 그 분배 채널을 빌려준 대가로 Google이 18억 대의 iPhone 위에 자기 모델 DNA를 침투시켰다. Apple의 해자를 파는 삽을 Google이 쥐고 있는 구조.
SPEC SHOWDOWN
와꾸비교 — 두 개의 다른 게임
왼쪽과 오른쪽은 같은 리그가 아니다. Apple은 "기기 안에서 충분히 작동"을 목표로 설계했고, frontier 진영은 "절대 지능 정상"을 두고 군비경쟁 중이다.
▍Apple AFM 3 — "충분히 작동"
5개 모델 패밀리 · 기기를 중심으로, 가벼운 건 로컬·무거운 건 사설 클라우드
AFM 3 CoreON-DEVICE · 3B
dense 3B. 모든 기기의 일상 올라운더. 자체평가 선호도 45.6%(전세대 23.3%)
AFM 3 Core AdvancedON-DEVICE · 20B
20B sparse(MoE), 요청당 1~4B만 활성. 네이티브 멀티모달(텍스트·이미지·음성). A19 Pro 칩 필수 → 신형 강제
AFM 3 CloudPCC · 워크호스
PT-MoE 서버 모델. 사설 클라우드의 다용도 일꾼
ADM 3 Cloud (Image)PCC · 이미지
이미지 생성·편집, Image Playground, Genmoji
AFM 3 Cloud ProPCC · 에이전틱
최강 모델. 에이전틱 툴·복잡추론. Gemini Frontier급 품질, Gemini distill 기반
설계 목표 = 절대 성능이 아니라 "프라이버시 × 기기 내 컨텍스트 × 충분한 품질". 정상이 아니라 충분함을 판다.
DeepSeek V4 $0.28/M — frontier 품질이 빠르게 commodity화되는 증거
설계 목표 = "무엇이든 가장 잘하는 1등 모델". 하지만 1등은 매달 바뀌고, 가격은 무너지는 중. → 모델 자체로는 해자가 안 남는다.
떠먹여주기: Apple의 최강 모델(Cloud Pro)이 frontier 진영의 Gemini를 distill해 만들어졌다는 건, Apple이 "성능 1등"을 아예 목표에서 뺐다는 자백이다. 대신 그 무게중심을 "개인 컨텍스트를 안전하게 다루는 능력"으로 옮겼다. 성능 표에서 Siri와 GPT-5.5를 비교하는 건 — Apple 입장에선 잘못된 채점표다.
THE MECHANISM
전략의 심장 — "오케스트레이터 분리"
왜 타사 AI가 Apple의 컨텍스트를 복제 못 하는가? 답은 데이터가 흐르는 방식에 있다. raw 데이터는 벽을 못 넘고, 정제된 프롬프트만 나간다.
핵심이 "벽"이 곧 Apple의 해자다. ChatGPT·Gemini 앱은 메시지·사진·앱 데이터에 시스템 레벨로 접근할 수 없다. Apple만이 raw 컨텍스트를 기기 안에서 정제해 쓸 수 있다. 동시에 — 클라우드로 나간 무거운 일은 결국 Google·Nvidia 인프라가 처리한다. 해자는 Apple 것이지만, 그 안에서 돌아가는 엔진은 남의 것.
DECODING THE MOVES
전략적 선택, 떠먹여서 해석
표면적으론 "Siri가 늦었다"는 얘기지만, 모든 선택이 한 방향을 가리킨다 — 비용은 빼고, 통제권은 쥐기.
선택 A
Gemini를 사지 않고 "빌렸다"
frontier capex 회피
자체 SOTA 학습에 수십조를 태우는 대신 연 ~$10억으로 Google 모델을 distill. 모델이 commodity가 될 거라 본다면, 이건 자본배분의 정답이다. Apple은 "모델 군비경쟁에 안 낀다"를 재무적으로 선언했다.
선택 B
20B를 기기 안에 욱여넣었다
실리콘 = 재부상한 차별화
AFM 3 Core Advanced(20B sparse)는 A19 Pro 칩이 있어야 돈다. 즉 AI 기능이 곧 하드웨어 업그레이드 강제 장치가 된다. 온디바이스 추론은 메모리·전력 요구를 끌어올린다 — 공급망에 새 수요.
선택 C
에이전트 자율실행은 일부러 안 했다
"설정"까지만, 실행은 안 함
Siri는 리마인더를 설정까지만 하고 추첨 참가를 대신 실행하진 않는다. Thompson 해석 — 소비자 AI 수요는 레시피·DIY·이미지 수준에서 충족된다는 베팅. 자율 에이전트는 의도적 후순위.
선택 D
iPhone을 허브, 나머지를 위성으로
컨텍스트 단일 소유권
Mac·Watch·Vision 모두 iPhone이 쥔 컨텍스트를 공유받는 위성. 개인 데이터의 단일 소유 지점을 iPhone으로 고정 → 생태계 락인을 AI 레이어로 한 겹 더 강화.
SO WHAT'S NEXT · 투자 관점
넥스트 — 진짜 돈은 어디로 흐르나
"Apple AI 좋아졌다"가 아니라, 이 구조가 강제하는 자금 흐름을 읽어야 한다. 수혜는 의외로 Apple 바깥에 더 많다.
Google$GOOGL · 숨은 승자
18억 대 iPhone에 자기 모델 DNA를 침투시켰다. 연 ~$10억 라이선스 + Google Cloud 인프라 매출 + frontier 분배 채널 확보. 분배클라우드매출 Apple의 해자를 빌려준 대가로 가장 안전한 frontier 포지션을 챙김.
Nvidia$NVDA · 인프라 픽
AFM 3 Cloud Pro가 Google Cloud의 Nvidia GPU에서 구동. Apple마저 자체 학습 대신 외부 클라우드 추론으로 가면, frontier 추론 수요의 종착지는 결국 GPU. AI인프라추론수요 모델 상품화는 칩 수요를 줄이지 않는다 — 오히려 추론 볼륨을 키운다.
메모리·실리콘온디바이스 공급망
20B 모델을 기기에서 돌리려면 대용량·고대역 메모리와 첨단 SoC가 필수. 온디바이스 AI 보편화 = 스마트폰 DRAM/저장장치 단가·용량 상향 압력. 메모리교체사이클 A19 Pro 강제 → 하드웨어 교체 사이클 자극.
Apple$AAPL · 본진
capex는 거의 안 쓰고 컨텍스트 해자 + 하드웨어 사이클을 동시에 챙기는 자본효율 구조. 소비자 시장에선 "충분히 작동"으로 족하다는 게 맞다면, 리스크 대비 보상이 좋다. 자본효율생태계락인
최대 리스크베팅이 틀릴 경우
"소비자는 자율 에이전트를 원하지 않는다"는 선택 C의 가정이 깨지면 — 즉 진짜 에이전트가 차세대 킬러앱이 되면 — Apple은 분배는 가졌으나 능력이 없는 처지가 된다. 동시에 Gemini 의존이 깊어질수록 Google의 협상력↑. 빌린 엔진이 해자의 약점이 될 수 있다. 의존심화에이전트역전