엔지니어 출신 CMO 패트릭 스톡스(Patrick Stokes)가 말하는 Agentforce 12억 달러의 다음 단계 — Headless 360, 에이전트 라이선스, 그리고 "코딩 다음의 킬러앱은 지식노동"이라는 선언. AI가 SaaS를 죽인다는 공포에 대해, 그는 "그 AI 랩들이 우리의 가장 헤비한 유저"라고 답했다.
Anthropic·OpenAI 같은 랩들은 Salesforce UI에 로그인하지 않는다. Claude Enterprise·Codex에서 MCP로 연결해 쓴다. 그런데 API 소비량은 기존 대형 고객을 능가. "AI가 SaaS를 대체한다"는 쇼트 thesis의 반례가 바로 그 AI 회사들의 사용 데이터라는 역설. → 시트 감소 ≠ 소비 감소, 오히려 소비 확장.
현재 토큰 소비 1위는 압도적으로 코딩(엔지니어 1명이 월 $10만 청구 가능). 스톡스는 Salesforce의 연 $3억 Anthropic 지출 중 "상당히 의미 있는(very material) 비중이 이미 비(非)코딩 지식노동자"라고 공개 — 마케팅·영업·예측 업무가 MCP로 토큰을 태우고 있다. AI 인프라(컴퓨트·전력·네트워킹) 수요 thesis에서 '코딩 이후 수요 절벽' 우려를 정면 반박하는 기업 내부 데이터.
외부 에이전트가 Salesforce 데이터를 쓰려면 인간처럼 신원 등록을 해야 하고, 여기에 라이선스가 붙는다("almost certainly"). 시트 모델 종말론의 한가운데에서, 시트의 과금 단위를 인간 → 에이전트로 갈아끼우는 발상. 에이전트 수가 인간 수를 넘어서는 순간 TAM은 오히려 커진다.
Claude·ChatGPT는 1인용(single player). Slack 채널에 에이전트를 멤버로 넣으면 프롬프트가 모두에게 보이는 다인용(multiplayer) 환경이 되고, "상사가 Claude로 돌린 편향된 분석"의 신뢰 문제가 구조적으로 해소된다. AI 랩들이 "멀티플레이어 Claude Code"를 Slack 위에서 실험하고 싶어한다는 발언은 주목할 만. Slack 고가 인수 논란의 서사가 바뀔 수 있는 변곡점.
단연 Agentforce의 성장세입니다. $8억에서 $12억 규모로 올라섰고, 고객들이 꽤 정교한 유즈케이스로 '진짜 스케일'에 도달하기 시작했어요. 그리고 그만큼 흥분되는 게 AWU(Agentic Work Units, 에이전트 작업 단위)의 성장입니다.
토큰 입출력은 결국 '추론의 양', 즉 지능의 측정치일 뿐 실제로 일이 얼마나 처리됐는지의 측정치가 아닙니다. 그래서 우리가 Q4에 '실제 완료된 작업'을 재는 단위로 AWU를 도입했고, 토큰 성장과 나란히 AWU가 크는 걸 보고 있습니다. 산업별·세그먼트별로 사용 패턴이 어디서 솟아나는지도 보이기 시작했고요. 마지막으로 3월 개발자 컨퍼런스(TDX)에서 발표한 Headless 론칭 — 이게 에이전트 시대에 Salesforce의 역할을 완전히 새로 정의하는 출발점입니다.
두 가지입니다. 첫째는 Agentforce Script. 에이전트를 처음 만들면 "사람 말로 지시문만 쓰면 코딩 끝!"이라며 신나는데, 결국 그건 프롬프트일 뿐이에요. 다단계 복잡한 워크플로우를 시키려고 "이걸 해, 근데 저게 일어나면 이걸 해…"라고 쓰기 시작하면 에이전트는 아주, 아주 빨리 혼란에 빠집니다. LLM은 확률적(probabilistic) 시스템이라 같은 질문에 다른 답을 내놓죠. 업무 실행에는 그게 치명적입니다. 그래서 프롬프트 안에 '스크립팅의 마이크로 순간들'을 심어 결정론적(deterministic)으로 — 시킨 대로, 매번 똑같이 — 움직이게 만들었습니다. 규제 산업이나 정책 준수가 필요한 환경에서 스케일을 내려는 고객들에게 큰 돌파구였어요.
둘째는 음성(Voice). 사람마다 말하는 방식이 다르고, 끼어들기와 레이턴시 문제까지 — 직접 만들어보면 "이거 진짜 어렵네" 싶은 컴퓨터과학 프로젝트였습니다. 3개월 전이라면 "갈 길이 멀다"고 했겠지만, 지금은 Salesforce의 1-800 대표번호 자체가 Agentforce Voice로 돌아갑니다. 지금 전화하면 에이전트가 받아요. Q2 실적발표쯤엔 대규모 음성 고객 사례들을 이야기하게 될 겁니다.
처음부터 그랬습니다. 멀티클라우드를 안 건드리는 Salesforce 사용이란 사실상 없어요. 리드 자격심사를 시키면 그 리드를 마케팅 캠페인에 넣고 싶어지고, 케이스 처리를 시키면 열린 영업기회 여부를 알아야 하죠. 그래서 구매도 그렇게 묶었습니다. 'A for X'(Agentforce for Sales/Service/Commerce…) 최상위 에디션은 플랫폼 전체가 통째로 따라옵니다. 부품 단위로 사지 않게요.
데이터가 먼저 말해줍니다. 시트는 여전히 늘고 있고, 코어 비즈니스도 성장 중입니다. 그런데 정말 흥미로운 건 그 다음이에요. 그 AI 랩들을 들여다보면 — 우리가 아는 사람들이 GTM 조직을 이끌고 있는데 — 그들 전원이 우리 최대 고객사들보다도 Salesforce를 더 많이 씁니다.
다만 지난 20년의 방식이 아닙니다. UI에 로그인해서 콜 기록하고 영업기회를 입력하는 게 아니라, Claude Enterprise나 Codex 같은 자기들의 에이전트 인터페이스에서 MCP로 연결해 Salesforce를 씁니다. 그게 바로 Headless가 등장한 맥락이고요. 결과는? 사용량과 소비량의 '확장'입니다. 시트 논쟁과 분리해서 보면, 이 새로운 사용 방식에서 사용량이 치솟고 있습니다(spike up). 우리에겐 대단히 고무적인 신호죠.
"AI 랩들은 Salesforce에 로그인하지 않는다.
Claude를 통해, MCP를 통해, 우리 최대 고객보다 더 많이 쓴다."
정확합니다. 영감은 단순했어요. 사람들이 Salesforce를 '다르게' 쓰는 걸 그냥 지켜봤습니다. AI 랩들과의 파트너십 덕에 API 데이터가 보이는데, 소비량이 천장을 뚫고 있어요. Slack을 통해, 자기들 Claude 인터페이스를 통해 쓰고 있더군요. X·Reddit·Discord의 개발자 채널에서도 같은 패턴이 끓고 있었고요.
사람들이 감지한 건 이겁니다 — '새로운 일하는 방식'이 온다. 기능별로 따로 만들어진 수십 개 앱을 오가는 마찰이 사라지고, 그 앱들의 '기저 능력'과 대화하는 새 인터페이스가 그 자리를 차지한다. 애플리케이션은 사라지지 않지만, UI는 대대적으로 파괴됩니다(massively disrupted).
업계의 다른 회사들도 같은 걸 봤습니다. 그리고 "유저를 잃기 싫다, UI를 잃기 싫다"며 공포에 질렸죠. 우리는 정반대로 갔습니다. "좋다, 인정한다(endorse). 다 열어주겠다." 수익화는 풀어야 할 숙제지만, 패턴 자체는 노브레이너입니다. SaaS 비관론이 몇 달간 시장을 눌렀는데, "우리는 이 미래를 보고 있고, 가능하게 만들겠다"는 메시지로 다시 앞에 선 것 — 일종의 리셋 모먼트였다고 봅니다.
그렇습니다(Absolutely). 지금 토큰 소비의 압도적 1위 유즈케이스는 코딩입니다. 킬러앱이죠. 엔지니어 한 명이 월 $10만 청구서를 만드는 건 일도 아닙니다. 효율적이냐는 논쟁은 차치하고, 랩들은 이 토큰으로 큰돈을 벌고 있어요. 언젠가 정상화(normalization)나 정산(reckoning)의 순간은 오겠지만, 랩들이 찾는 건 "다음 킬러앱은 무엇인가"입니다.
우리는 그게 지식노동(knowledge work)이라고 봅니다. 매일 회의하고, 분석하고, 의사결정하는 — 여러분 같은 사람들이요. 낮은 마찰로 정보에 접근하고, 그걸 AI의 지능과 연결하고 싶어하죠. 그 연결을 제공하는 게 바로 우리입니다.
퍼즐은 두 갈래입니다. 첫째, 기술적 결정 — 외부에서 만든 에이전트가 우리 플랫폼의 데이터를 소비하려면, 인간 유저처럼 자신의 신원을 우리에게 식별시켜야 합니다. 거버넌스·라이선싱·권한관리의 토대니까요. 이 결정들의 결과로 '에이전트 유저 라이선스'가 등장할 것이 거의 확실합니다(almost certainly). 인간 라이선스처럼, Salesforce 위에서 돌리는 에이전트를 등록하게 되는 거죠.
둘째, 과금 — 25년 시트 과금의 유산이 있는 회사라 "그럼 에이전트 라이선스에 과금하면 되겠네"가 자연스러운 답처럼 들리지만, 그 '레거시 편향'이 스며들지 않게 의식적으로 경계하고 있습니다. 지금 고객·파트너들에게 가서 이렇게 묻고 있어요. "백지수표다. 계약서를 지금 다시 쓸 수 있다면, 원하는 Headless 무제한 사용 환경의 계약이 어떤 모습이면 좋겠나?" 이 방에 계신 여러분이 성장 모델링을 위해 가격모델을 간절히 원하는 거 압니다. 우리도 드리고 싶어요. 다만 틀린 모델을 드렸다가 다 같이 틀리는 일은 피하려는 겁니다.
공정한 비판입니다. 아직 못 찾은 '골디락스'가 있어요. 처음엔 고객이 뭘 기대해야 할지 몰라 소비량 과금을 원했고, 줬더니 너무 복잡했습니다. 자기 사용량 예측도 어려운데 그걸 커머셜로 환산하는 건 더 어려웠죠. 그래서 "AELA 사고 무제한으로 쓰라"고 단순화했더니, 단순한 대신 비쌌습니다. 고객이 '어느 쪽 악(evil)을 고를까' 고민하게 만드는 건 우리가 원하는 그림이 아닙니다. 우리 바깥에서 출현하는 흥미로운 모델들도 보고 있고, 결국 기준은 '우리에게 유리한 모델'이 아니라 '고객에게 유리한 모델'입니다. 실험을 많이 할 거고, 그 과정이 "시장을 혼란시킨다"로 보일 수 있다는 것도 압니다. 한시적 국면입니다. 믿고 지켜봐 달라는 말씀을 드릴 수밖에요.
| 단계 | 과금 모델 | 장점 | 한계 (스톡스 자평) |
|---|---|---|---|
| 1세대 | 대화(Conversation)당 과금 | 직관적 출발점 | 사용량 예측 불가, 커머셜 환산 난해 |
| 2세대 | 액션(Action)당 과금 | '일한 만큼' 정밀화 | 오히려 더 복잡해짐 |
| 3세대 | Agentforce 1 에디션 (구독) | 예측 가능성 확보 | 유연성 부족 |
| 4세대 | AELA (무제한 ELA, 대형 커밋) | "쓰고 싶은 만큼" 단순함 | 너무 비쌈 — "고객이 악을 골라야 하는 구조" |
| 차기 | 에이전트 유저 라이선스 (사실상 확정) + 고객과 공동설계 중인 신모델 | 에이전트 신원 = 거버넌스 + 과금 단위 통합 | 세부 미정 — H2 모델링의 최대 변수 |
Contentful의 본질은 '헤드리스 퍼스트' 플랫폼이라는 점입니다. 콘텐츠의 UI가 어떻게 생길지엔 애초에 큰 공을 들이지 않았어요. 콘텐츠란 결국 캠페인의 한 기능이고, 캠페인은 마케팅의 한 기능이니까요. SaaS 시대는 — 마케팅 LUMAscape를 보시면 압니다 — 목적별 앱의 거대한 난립(sprawl)을 만들었습니다. Contentful은 "세상은 그쪽으로 가지 않는다"고 봤죠. 어떤 지능이 실시간으로 캠페인을 오케스트레이션하고 1:1 개인화를 수행하는 세계 — 그 지능이 필요할 때 콘텐츠를 꺼내 쓸 수 있도록 충분한 메타데이터와 컨텍스트를 갖춘 헤드리스 CMS가 필요하다고 본 겁니다.
그래서 이 인수의 매력은 둘입니다. 제품 조직에 헤드리스 DNA를 더 주입하는 것, 그리고 수년간 마케팅클라우드 전략의 공백이던 부분을 메우는 것.
시장은 Slack을 Teams와 같은 통에 넣고 '협업툴'이라 부르는데, 꽤 순진한(unsophisticated) 시각입니다. Slack의 출발은 개발자 플랫폼이었어요. 채널 때문이 아니라 GitHub·Jira와의 연결성(connectivity) 생태계 때문에 개발자의 업무방식에 끈끈하게 박혔죠. 지금 그 현상이 전 직군으로 번지고 있습니다. 특히 신규 로고, 그리고 AI 랩들 — 시총 $1조짜리인데 직원은 2,000명인 회사들이 비즈니스 전체를 Slack 위에서 돌립니다.
그리고 더 흥분되는 쪽 — Slack은 이미 '대화형 인터페이스'라서 에이전트 시대에 준비된 그릇입니다. "Claude나 ChatGPT도 이미 인간+에이전트 아니냐"고 하실 텐데, 그건 1명의 인간과 1개의 에이전트, 싱글플레이어 환경입니다. 유용하죠. 하지만 우리 대부분은 팀으로 일합니다. Slack은 본질적으로 멀티플레이어 환경이고, 거기에 에이전트를 넣는 순간 완전히 새로운 사용 패턴이 출현합니다. 한 사람이 묻고 에이전트가 답하면, 두 번째 사람이 이어서 묻는 식의 상호작용. 싱글플레이어인 Claude Code를 멀티플레이어 경험으로 쓰는 것 — 랩들이 지금 우리와 하고 싶어 하는 일이 바로 이런 겁니다.
그리고 '신뢰'의 문제가 있습니다. 상사가 보낸 분석자료, 딱 보면 Claude로 쓴 티가 나죠? 우리 모두 그 스파이디센스가 생겼습니다. 동시에 또 하나 — 그 프롬프트에 상사의 편향이 가득했으리란 감각도요. AI 분석이 요청자의 입맛과 일치하는 건 우연이 아니라 인간 본성입니다. 그런데 멀티플레이어 환경으로 옮기면? 프롬프트가 모두에게 보입니다. 답이 어떻게 도출됐는지 보이고, 여러 명이 동시에 프롬프트를 보태니 다관점이 반영된, 훨씬 신뢰할 수 있는 답이 나옵니다. 아직 아무도 시연하지 못한 패러다임이고, 우리가 그 길 위에 있습니다.
Slackbot조차 지금은 싱글플레이어입니다. 상상해 보세요 — 채널 멤버 15명 중 2명이 에이전트인 풍경. 채널에 질문을 던지면 에이전트가 답하는. 그 인터랙션 모델은 아직 미개척지이고, Slack이 가는 방향이 바로 거기입니다.
제품을 만들 때 우리는 늘 "지금 희소한 것이 무엇인가"를 묻습니다. 지능은 이제 희소하지 않습니다(GPU에 전력을 얼마나 공급하느냐의 한계는 있지만). 희소한 것은 컨텍스트와 신뢰입니다. LLM과 대화를 시작하면 답이 똑똑해 보여서 신나지만, 곧 깨닫죠 — 이 녀석은 우리 회사에 대해 아무것도 모른다는 걸. 그래서 정보를 들이붓기 시작하는데, 컨텍스트 윈도우엔 한계가 있습니다.
지금 100만 토큰까지 넣을 수 있지만, 그러면 호출 한 번이 미친 듯이 비싸지고, 많이 넣을수록 LLM은 더 혼란스러워집니다. 그 순간 필요한 '정확한 컨텍스트'만 추출하고, 맞는 모델을 고르고, 답을 전달하는 엔지니어링이 필요한데, 그게 우리가 무대 뒤에서 하는 일입니다. 그리고 아무도 진지하게 생각하지 않는 마지막 컨텍스트 조각 — 조직 구성원들의 제도적 지식, 곧 Slack 안의 대화들입니다. 데이터·메타데이터에 이 대화 데이터까지 얹어, 질문이 던져지는 순간 토큰 지출을 최적화하며 주입한다 — 우리의 미래 가치는 거기에 있다고 봅니다.
리더보드 보여드릴까요? 지금 Slack에서 바로 띄워서 팀별로 누가 제일 쓰는지 볼 수 있습니다(웃음). 엔지니어링 조직의 혁신 속도는 솔직히 '미쳤다(insane)'는 표현밖에 없습니다. 특히 Slack 팀이 압권인데, 제가 월요일에 아이디어를 들고 가면, 그 아이디어가 월요일에 프로덕션에 올라가 있습니다.
그런데 더 깊은 이야기가 있습니다. 그 지출의 대부분이 코딩이긴 한데, 전부는 아니에요. 시장이 아직 따라잡지 못한 게 이겁니다 — 상당히 의미 있는(very material) 비중이 그냥 지식노동자들입니다. 제 마케팅팀, 영업, 예측(forecasting)을 돌리는 미겔 같은 사람들. 코딩이 아니라 MCP 서버를 연결해서 Anthropic 토큰을 소비하며 지식노동을 하고 있어요. 다음 큰 파도는 거기서 온다고 봅니다.
"시장이 아직 못 따라온 게 있다 — 토큰 지출의 상당 부분은
이미 코딩이 아니라 '지식노동자'들이 만들고 있다."