Siri, 두 번째엔 작동했다 — 최첨단은 아니지만 소비자 시장엔 충분
Apple의 진짜 AI 강점은 모델 성능이 아니라 '개인 컨텍스트 독점'이다. 메시지인지 이메일인지 보이스메일인지 몰라도 Siri는 찾아준다. 타사 AI는 이 데이터에 접근 자체가 불가능하다. 동시에 소비자는 에이전트식 생산성 향상을 원하지 않는다는 냉정한 현실이 Apple의 에이전트 지각(遲刻)을 전략적 위협에서 노이즈로 격하시킨다. iPhone이 숏폼 비디오를 보는 가장 좋은 기기인 한, Siri가 "충분히 작동"하면 그걸로 족하다.
무엇이 달라졌나: 2024년 WWDC에서 Apple은 Apple Intelligence와 새 Siri를 발표했지만 실제로 작동하는 기능이 거의 없어 '베이퍼웨어' 비판을 받았음. 2026년 WWDC에서는 사전 녹화 키노트에 실제 스피닝 인디케이터까지 담긴 라이브 데모를 공개했고, 실제로 작동했음. Mike Rockwell은 콘서트 티켓 추첨 리마인더 설정을 음성으로 시연 — 컨텍스트 인식과 Reminders 앱 조작(App Intents 프레임워크)이 모두 정상 동작.
그럼에도 여전히 뒤처진 부분: 해당 데모에서 Siri는 리마인더를 '설정'하는 데 그쳤음. 진정한 최신 AI라면 때가 됐을 때 직접 추첨 참가까지 실행했을 것. 즉, 인간의 상호작용 패러다임 바깥에서 자율 행동하는 에이전트 역량은 아직 부재. Thompson은 이것이 Apple이 전통적으로 지배해온 '인터랙션 패러다임' 안에 여전히 머물고 있음을 보여주는 증거라고 분석.
하지만 소비자 시장에선 상관없다: Apple의 타깃은 소비자이고, 소비자의 AI 수요 대부분은 레시피 검색, DIY 팁, 이미지 생성 수준에서 충족됨. 더 중요한 것은 Siri가 이제 세계 지식 접근과 이미지 생성 능력을 갖추면서, iPhone에 축적된 개인 정보(메시지·이메일·화면 내용·앱 데이터)를 가로지르는 유일한 AI가 됐다는 점. Spotlight 시맨틱 인덱스와 App Intents를 통해 서드파티 앱 데이터에도 접근 가능하며, 이는 타사 AI가 로컬 Mac/PC의 대규모 보안 희생 없이는 복제할 수 없는 구조.
기술 구현의 핵심 전략적 시사점: 온디바이스 200억 파라미터 MoE 모델은 토큰 단위가 아닌 쿼리 단위로 전문가를 선택해 iPhone의 제한된 메모리에서도 구동 가능하도록 설계됐음. Private Cloud Compute는 Nvidia 칩·Google 데이터센터로 확장됐지만, 핵심 전략은 일관됨 — iPhone이 중심이고 다른 모든 기기는 그 컨텍스트를 공유받는 위성. 이는 Apple이 대규모 capex 지출 없이 타사가 쌓는 클라우드 인프라를 앱을 통해 활용하는 구조와도 일치.
쉽게 풀어보기 — 에이전트·씬클라이언트·MoE
- 에이전트(Agent)
- 사용자가 "티켓 사줘"라고 한 마디 하면 검색→결제→확인까지 알아서 처리하는 AI. 중간 과정에 사람이 개입할 필요 없음. 현재 Siri는 이 단계에 못 미침.
- 씬클라이언트(Thin Client)
- 기기 자체엔 연산 능력이 거의 없고, 실제 작업은 서버(클라우드)에서 처리. Project Solara는 이 개념의 극단 — 기기는 그냥 '창문'이고 AI는 구름 속에 삶.
- MoE(Mixture of Experts)
- 큰 모델을 여러 '전문가' 조각으로 나눠, 매 질문마다 필요한 전문가만 꺼내 쓰는 구조. 전체 모델을 다 메모리에 올리지 않아도 되니 iPhone처럼 메모리가 작은 기기에서 큰 모델을 돌릴 수 있음.
- KV Cache
- AI가 긴 대화를 이어갈 때 앞서 나온 내용을 임시 저장해두는 메모리. 에이전트가 복잡한 작업을 처리할수록 이 캐시가 폭증해 서버 처리가 훨씬 유리해짐.
- App Intents / Spotlight 시맨틱 인덱스
- 앱 개발자가 "내 앱이 이런 동작을 할 수 있어요"라고 Apple에 등록하면, Siri가 해당 앱을 직접 조작할 수 있게 해주는 프레임워크. 타사 AI는 이 채널이 없음.