AI or Nothing 1편: 엔비디아가 그리는 그림

핵심 요약

메모리 부족이 심각한 문제로 대두.
AI 컴퓨팅의 지휘권이 랙 단위로 CPU에 집중.
엔비디아는 단순히 서버 제조사를 넘어 AI 공장(데이터센터) 구축 기업으로 진화 중.
향후 컴퓨팅 파워(칩+전력 등)가 곧 기업의 매출로 직결되는 시대 도래.
베라 루빈(Vera Rubin) 아키텍처는 에이전트 AI를 위해 특별히 설계된 포괄적인 시스템.
칩 설계(Cadence)에도 에이전트 AI를 적용하여 칩 개선 속도 가속화.
COSMOS 파운데이션 모델을 통해 피지컬 AI 개발 생태계를 엔비디아(NVIDIA) 플랫폼으로 락인(lock-in)하려는 전략.
피지컬 AI 개발(COSMOS)부터 본체 구동(Isaac GR00T)까지 엔비디아 플랫폼으로 통합.

AI 산업의 진화와 엔비디아의 역할

2023년 챗GPT 모멘텀 이후 AI 산업은 지속적으로 성장하고 있으며, 2026년부터는 엔비디아(NVIDIA)가 만드는 생태계를 중심으로 투자 성과가 양극화될 것으로 예상됩니다. 엔비디아는 컴퓨텍스 2026에서 최신 전략을 발표하며, 이러한 추세 속에서 엣지 인더스트리(MLCC, CPO, 기판 등)를 포착하는 것이 중요하다고 강조했습니다. 젠슨 황 CEO는 대만의 막대한 공급망 생태계가 엔비디아의 성장과 대만 GDP의 10% 성장에 기여하고 있음을 언급하며, 자사의 생태계가 업스트림 공급망부터 다운스트림 최종 사용자까지 전 범위에 걸쳐 있다고 설명했습니다.

에이전트 AI의 부상과 경제적 파급력

AI의 다음 물결은 에이전트 AI (Agentic AI)이며, 이는 이제 실용적인 수준에 도달했습니다. 소프트웨어 코딩 분야에서 에이전트 AI의 초기 적용 사례를 볼 수 있습니다.

연도	GitHub 커밋 수	설명
2023	3억 건
2024	4억 건
2025	5억 건
2026 (초)	전년 대비 약 3배 증가	에이전트 AI 도입 효과

약 3천만~4천만 명의 소프트웨어 개발자(연봉 3조 달러)가 에이전트 AI를 통해 실질적으로 9조 달러에 달하는 생산성을 창출하고 있으며, 이는 AI가 일자리를 줄이는 것이 아니라 더 많은 고용을 창출하고 있음을 시사합니다. AI가 수익 및 GDP 생성기가 되면서 토큰(Token)에 대한 수요가 폭발적으로 증가하고 있으며, 이는 곧 컴퓨팅 수요 급증으로 이어지고 있습니다. 에이전트는 대규모 언어 모델(LLM), 이를 조율하는 하네스(harness), 그리고 다양한 도구(tools)(예: 스프레드시트, 웹 브라우저, 데이터베이스 엔진)로 구성됩니다. 에이전트는 입력값을 이해하고, 관찰, 추론, 행동, 도구 사용을 통해 작업을 수행하며, 작업 기억(working memory)을 포함한 메모리 관리 시스템이 핵심적인 역할을 합니다. 프롬프트 하나로 코드, GIF, 3D 프린팅용 CAD 파일 등을 생성하는 것은 에이전트 AI의 강력한 잠재력을 보여줍니다.

엔비디아의 새로운 컴퓨팅 모델: 에이전트와 툴

에이전트 AI 시대에는 소프트웨어 회사가 더 많은 도구를 개발해야 할 기회가 많아질 것이며, 엔비디아의 CUDA-X 라이브러리는 에이전트를 위한 핵심 도구가 될 것입니다. 이 라이브러리들은 20년 전부터 구축된 가속 컴퓨팅 아키텍처인 CUDA를 기반으로 하며, 에이전트가 인간보다 훨씬 효과적으로 사용할 수 있도록 기술(매뉴얼)과 함께 제공될 예정입니다. 에이전트의 각 단계는 다양한 하드웨어에서 실행됩니다:

대규모 언어 모델(LLM)의 사고 및 문맥 처리: Grace Blackwell NVLink 72 랙 활성화.
도구 사용(C 컴파일러, Python, JavaScript, 가속 컴퓨팅): CPU 사용.
보안 하네스: CPU 및 BlueField DPU (보안 프로세서).
전체 작업 조율: CPU.

이처럼 에이전트는 궁극적으로 분해되고 분산된 컴퓨팅 모델을 기반으로 합니다.

베라 루빈: AI 메모리 혁명과 시스템의 진화

AI 컴퓨팅에서 메모리(KV 캐싱, 데이터 검색, 온톨로지 처리)의 복잡성은 가장 어려운 부분 중 하나입니다. 엔비디아는 이 문제를 해결하기 위해 차세대 아키텍처인 베라 루빈(Vera Rubin)을 개발했습니다. 베라 루빈은 단순한 칩이 아니라 GPU(Vera Rubin NVL72), Vera CPU, 혁신적인 스토리지 시스템, ConnectX-9, DOCA 소프트웨어 스택, 보안 프로세서 등을 포함하는 엔드 투 엔드 전체 시스템입니다. 이는 엔비디아 역사상 가장 야심 찬 노력으로, 4만 명의 엔지니어가 참여했습니다. 베라 루빈 시스템은 모든 것이 암호화된 기밀 컴퓨팅(confidential computing)을 준수합니다. 엔비디아는 과거의 GPU 회사에서 시스템 회사로, 이제는 고객이 AI 공장을 구축하도록 돕는 AI 공장(데이터센터) 구축 기업으로 진화하고 있습니다. 고객들은 단순히 컴퓨터를 구매하는 것이 아니라, 복잡한 AI 인프라를 구축하고자 합니다.

NVIDIA DSX: AI 공장 구축을 위한 청사진

AI 공장 구축은 인류 역사상 가장 큰 인프라 프로젝트로, "컴퓨팅이 곧 매출"이라는 인식 하에 칩, 랙, 네트워크, 전력, 냉각, 전력망 등 모든 레이어가 함께 설계되어야 합니다. NVIDIA DSX는 AI 공장을 최대의 효율성과 수익성으로 구축하고 운영하기 위한 참조 설계 청사진입니다. NVIDIA DSX의 주요 구성 요소 및 기능은 다음과 같습니다:

DSX Sim (옴니버스 기반): 파트너들이 AI 공장(엔비디아 베라 루빈 AI 공장)을 설계하고 검증하는 디지털 트윈. 배치 계획, 전력 및 냉각 시뮬레이션, 네트워크 설계, 통합 검증 등을 지원.
DSX OS: AI 공장 인프라의 프로비저닝, 운영, 모니터링, 복구를 제어하여 신뢰성, 멀티 테넌트 방식, 회복 탄력성을 확보.
DSX MaxLPS: 현재 AI 공장의 최대 40%에 달하는 과도한 전력 프로비저닝 문제를 해결, 동일 전력 예산 내 더 많은 GPU를 안전하게 배포하여 연간 수십억 달러의 추가 매출 창출.
고온 액체 냉각 (45°C): 물과 에너지 사용을 줄여 더 많은 전력을 컴퓨팅에 할당.
동적 전력 할당 및 랙 내 전력 평활화: 랙 간 전력 조향 및 피크 전류 서지 평탄화.
DSX Flex: 전력망과 협력하여 실시간 전력망 신호를 읽고 동적으로 전력을 재조정하는 유연한 에너지 자산.

엔비디아는 1기가와트(GW) 규모의 AI 공장이 초기 200억~300억 달러에서 곧 800억~1,000억 달러에 이를 것으로 추정하며, 이 십 년(decade) 말까지 100기가와트 규모의 AI 공장이 온라인으로 전환될 것으로 예상합니다. 엔비디아는 이처럼 거대한 AI 공장 생태계의 핵심 파트너로서 전체 스택을 구축하고 있습니다.

시사점

엔비디아는 GPU 공급을 넘어 AI 공장 전체를 설계, 구축, 운영하는 풀스택 솔루션 제공자로 진화하며 AI 시대의 핵심 인프라 지배력을 강화하고 있습니다. 이는 엔비디아 생태계 내 반도체, 전력, 냉각, 소재 등 엣지 인더스트리 전반에 걸쳐 새로운 투자 기회를 창출할 것으로 예상됩니다.

원문 전문 보기

투자 전략 및 기타아이디어

AI or Nothing 1편: 엔비디아가 그리는 그림

2026.06.10. 오전 12:32
by 해기사투자자
24
SNS 보내기

글씨 크기 조정

- 본 포스팅에 수록된 내용은 어떠한 경우에도 투자 결과에 대한 법적 책임소재의 증빙자료로 활용될 수 없습니다.

- 본 포스팅은 어떠한 기업에 대해서 매수나 매도에 대한 추천을 하는 것이 아닙니다. 상기에 언급된 기업들을 추천했다고 착각하시지도 마시고, 이에 따라 사지도 마십시오. 스타테일 리서치 팀은 구독자 여러분 스스로 공부하시기 위한 자료와 아이디어를 제공드릴 뿐입니다.

- 콘텐츠에 수록된 내용은 개인적인 견해로서, 해당 포스팅은 그 정확성이나 완전성을 보장할 수 없습니다.

- 저자는 포스팅 제공 시점 기준 일부 보유할 수 있어 편향된 시각일 수 있으며, 별도의 공지 없이 언제든지 매수 및 매도할 수 있습니다. 그러니 절대로 이 글만 믿고 따라사지 마시길 바라며, 별도의 투자 상담을 해드리지 않습니다.

안녕하세요, 해기사투자자입니다. 2023년부터 시작된 챗지피티 모멘텀부터하여 AI산업이 지속적으로 성장하고 있습니다. 2025년까지는 국내외 성장하는 다양한 산업과 미중분쟁에서 일어나는 많은 아이디어에서도 수익이 좋은 투자를 할 수 있었습니다.

하지만 올해부터 엔비디아가 만드는 생태계를 중심으로 투자성과가 양극화되기 시작했으며 이러한 추세는 AI버블이 오면서 더욱 더 심해질 가능성이 높아보입니다. 만약에 양극화가 일어나지 않더라도, AI안에서 파생되는 엣지 인더스트리를 포착하는 것만큼 높은 수익률을 기록하기 쉽지 않을 것입니다.

2026년 MLCC, CPO, 기판 등 단기간에 텐베거가 발생한 엣지인더스트리가 많습니다. 하반기에도 이러한 기회를 바로 포착할 수 있도록 우리는 엔비디아의 생태계를 파악할 필요가 있습니다.

1편은 최근 6월1일 대만에서 발표한 컴퓨텍스2026 입니다. 왜냐하면 제일 최신에 업데이트된 젠슨황의 그림이기 때문입니다. 개인적으로는 이런 중대한 자료는 요약본보다 행간에서 얻을 수 있는 것들이 많다고 생각합니다. 그리하여 전문을 번역했습니다.

***핵심****

1. 메모리 부족은 심각하다

2. 이제는 랙을 CPU가 지휘하게 된다

3. 엔비디아는 서버 만드는 기업을 넘어서서 AI공장(데이터센터)을 만드는 기업이 되어가고 있다

4. 컴퓨팅파워(칩+전력+등등)이 곧 기업의 매출이 되는 시대가 올 것이다

5. 베라루빈은 에이전트 AI 를 위해 만들어졌다

6. 에이전트AI를 칩설계(Cadence)에도 붙였다. 칩개선속도도 가속화될 것이다

7. COSMOS 파운데이션 모델로 피지컬AI 개발도 엔비디아로 락인 시키겠다

8. 피지컬AI 개발도 우리껄(COSMOS)로 하고, 피지컬AI 본체 구동(Isaac GR00T)도 우리 플랫폼으로 하자

[인트로 영상]

이것이 지능이 만들어지는 방식입니다. 새로운 종류의 공장입니다. 토큰의 생성기입니다. AI의 구성 요소입니다. 토큰은 데이터가 지식, 추론, 행동으로 바뀌는 새로운 지평을 엽니다. 그들은 여러분이 결코 볼 수 없었던 복잡성 속의 패턴을 드러냅니다. 그들은 우리를 안전하게 지키기 위해 우리 도시를 경비하고, 우리를 그 도시들 위로 높이 들어 올립니다. 토큰은 로봇이 우리로부터 배우고, 우리와 함께 일하도록 돕습니다 우리는 그들이 갈 수 없는 곳으로 갑니다. 상처와 치유 사이의 격차를 좁혀 그들이 더 쉽게 숨 쉴 수 있도록 합니다. 그리고 가장 작은 심장이 더 강하게 뜁니다. 토큰은 우리가 목표에 도달할 수 있도록 결코 시도된 적 없는 새로운 지평을 깨도록 돕고 있습니다. 무한한 공간 저 너머로... 함께. 인류 전체를 위한 밝은 미래로 다음 위대한 도약을 하십시오. 그리고 여기, 타이베이에서 이 모든 것이 시작됩니다.

[재닌] 엔비디아(NVIDIA) 창립자이자 CEO인 젠슨 황(Jensen Huang)을 무대로 모시겠습니다.

[젠슨]

대만 GTC에 오신 것을 환영합니다. 여러분 모두를 뵙게 되어 정말 기쁩니다. 집에 돌아와서 정말 좋습니다. 제가 부모님을 모시고 고향에 왔습니다. 제 부모님은 어디 계시죠? 모두 제 어머니와 아버님께 박수를 보내주십시오. 그리고 신사 숙녀 여러분, 저희 프리게임 쇼의 슈퍼스타들에게도 박수를 보내주십시오. 그들이 얼마나 사랑스러운지 보세요. 대만의 슈퍼스타들입니다. 오늘 여기에 정말 많은 분이 와 계십니다. 저희는 지금 이것을 대만 전역의 다른 70개 론칭 파티에 생중계하고 있습니다. 70개의 서로 다른 컨퍼런스가 동시에 진행되고 있습니다. 모두가 이것을 라이브로 시청하고 있습니다. 여러분께 드릴 말씀이 정말 많고, 감사해야 할 파트너분들도 너무 많습니다. 대만에서 저희의 생태계가 얼마나 거대해졌는지 믿기지 않을 정도입니다. 대부분의 경우, 사람들이 생태계에 대해 생각할 때 저희의 소프트웨어 스택을 생각합니다. 그들은 엔비디아가 구축하는 컴퓨팅 시스템 위의 개발자 생태계를 생각합니다. 하지만 엔비디아의 생태계는 이 모든 것이 시작되는 여기 대만의 모든 공급망 업스트림에서부터 데이터 센터, 그리고 결국 최종 사용자 다운스트림에 이르기까지 전 범위에 걸쳐 있습니다. 오늘 저희는 생태계의 거의 모든 것에 대해 이야기할 것입니다. 감사해야 할 사람들이 정말 많습니다. 저는 여기 있는 제 생태계를 사랑합니다. 아주 많은 놀라운 회사들, 제가 가장 좋아하는 생태계 파트너들 중 일부가 있습니다. 대만의 풍부한 생태계 - 세계 최고의 공급망 생태계입니다. 믿을 수 없습니다. 자, 여기 와주신 모든 분께 감사드립니다. 그리고 올해, 저희가 함께하는 비즈니스는 엄청나게 성장하고 있습니다. 사실, 어젯밤 누군가 저에게 대만의 연간 GDP가 거의 10% 성장할 것이라고 말했습니다. 믿을 수 없습니다. 자, 시작해봅시다.

[에이전트 AI의 시작]

2년 전 제가 여기 있었을 때, 저는 여러분에게 AI가 어떻게 생성형 AI로부터 이동했는지, 그리고 다가오고 있는 다른 AI의 물결들에 대해 이야기하기 시작했습니다. AI의 다음 물결은 에이전틱 AI(agentic Al)였습니다. 그리고 오늘 우리는 에이전틱 AI가 도래했다고, 유용한 AI가 도래했다고 말할 수 있습니다. 이제, 이것은 무엇을 의미할까요? 이것은 깃허브(GitHub)입니다. 이것은 물론 에이전틱 AI의 첫 번째 애플리케이션 중 하나인 소프트웨어 코딩입니다. 가장 가치 있는 직업 중 하나이며, 엄청나게 큰 생태계인 3,000만 명, 4,000만 명의 전문 소프트웨어 개발자가 있고, 아마도 학생이나 애호가 등이 또 다른 수억 명 있을 것입니다. 하지만 세상의 약 3,000만 명, 4,000만 명의 소프트웨어 개발자가 생계를 위해 코딩을 한다고 해봅시다. 그리고 이것이 그들 대부분을 나타냅니다. 이것은 깃허브입니다. 풀 리퀘스트(pull request)는 그들이 소프트웨어를 다운로드하고 수정할 때이며, 커밋(commit)은 그것을 다시 밀어 올릴 때입니다. 그리고 그래서, 만약 여러분이 2023년에 이것을 보신다면 커밋 수는 3억 건이었고, 2024년에는 4억 건, 2025년에는 5억 건의 커밋이 있었습니다. 2026년 첫 몇 달 동안에는 거의 세 배로 증가했습니다.

이제 그것은 무엇을 의미할까요? 약 3조 달러 가치의 GDP를 대표하는 3,000만 명의 소프트웨어 개발자, 그것이 그들이 받는 급여이며, 연간 3조 달러 가치의 급여는 나머지 산업의 경제 성장을 창출하고 있습니다. 전 세계 산업의 약 100조 달러가 3조 달러 가치의 급여에 의해 영향을 받고 - 생성된다고 해봅시다. 그 3조 달러 가치의 급여가 이제 거의 세 배나 많은 아웃풋을 생산하고 있습니다. 이는 연봉 3조 달러로부터 실질적으로 9조 달러의 생산성이 나오는 것입니다. 이것이 이해가 되십니까? 그 차이는 절대적으로 놀랍습니다. 이것이 잠재력입니다. 이것이 AI의 약속입니다. 소프트웨어 엔지니어의 수는 실제로 증가하고 있습니다. 사람들이 AI가 일자리를 줄인다고 말하는데 - 완전히 터무니없는 소리입니다. 그것은 더 많은 소프트웨어 엔지니어가 고용되도록 만들고 있으며, 그 이유는 매우 간단합니다. 만약 소프트웨어 엔지니어를 고용해서 9조 달러 가치의 생산적인 작업을 생성할 수 있다면, 왜 더 많은 소프트웨어 엔지니어를 고용하고 싶지 않겠습니까? 만약 그 선이 평평했다면 당연히 사람들은 소프트웨어 엔지니어를 덜 고용했을 것입니다. 하지만 아웃풋이 너무나 믿을 수 없을 정도로 훌륭하기 때문에 사람들은 소프트웨어 엔지니어를 더 많이 고용하고 싶어 합니다. 이것은 머지않아 우리 경제에 나타날 것입니다. 그리고 그래서 첫 번째는: 유용한 AI가 도래했다는 것입니다. 이제 그것이 산업의 관점에서는 무엇을 의미할까요? 그것은 토큰에 대한 수요가 이제 엄청나다는 것을 의미합니다. 왜냐하면 여러분이 이것을 할 수 있다면, 그것을 더 많이 생산하고 싶어 할 것이기 때문입니다. 그리고 토큰은 이제 수익성 있는 단위이기 때문에 토큰은 이제 수익성 있는 매출 단위입니다. 그것이 이제 수익성이 있기 때문에, AI 회사들은 훨씬 더 많은 토큰을 만들고, 훨씬 더 많은 토큰을 생성하고, 더 많은 AI 공장을 짓기를 원하며, 이것이 바로 여기 대만에서 컴퓨팅 수요가 하늘을 찌르는 이유입니다. 이것이 바로 여러분 모두가 그렇게 바쁜 정확한 이유이며, 여러분의 비즈니스가 잘되고 있는 정확한 이유입니다

사실, 그것은 여러분의 주가 중 일부처럼 보입니다. 컴퓨팅 패턴이 바뀌었습니다. 모든 것이 바뀌었습니다. 그래서 첫 번째 아이디어는 유용한 AI가 도래했다는 것입니다. AI는 이제 수익 생성기입니다. AI는 이제 GDP 생성기입니다. 그 이면에는 단순히 대규모 언어 모델뿐만 아니라 에이전트라는 완전히 새로운 종류의 컴퓨팅 패턴이 있습니다. 오늘날 우리가 이야기할 거의 모든 것은 이것에 기반할 것입니다. 그러니 잠시 시간을 내어 제가 무슨 말을 하고 있는지 보여드리겠습니다. 이것은 에이전트, 에이전트 애플리케이션입니다. 옛날에는 이것이 애플리케이션이었고 이것이 코드였으며, 이것이 운영체제였을 것입니다. 애플리케이션, 애플리케이션 내부에서 실행되는 코드, 운영체제 내부 말입니다. 오늘날 그것은 하나 또는 여러 개의 대규모 언어 모델로 구성되어 하네스(harness) 내부에 자리 잡은 에이전트이며, 그 하네스는 그것이 생산적인 작업을 하도록 조율하는 것을 돕습니다. 이것이 입력이며 그 입력이 들어오면 그것은 이해하고, 관찰하고, 추론하고, 행동하고, 도구를 사용해야 합니다. 그 도구는 예를 들어 스프레드시트, 웹 브라우저, 데이터 처리 엔진, 데이터베이스 엔진일 수 있습니다. 이것은 조율됩니다 - 이 하네스가 이러한 정보의 라우팅을 조율합니다. 그것이 접촉할 때마다 - 문맥을 처리하거나, 무슨 일이 일어나고 있는지 이해하거나, 무엇을 할지 추론하거나, 그것이 행동할 계획을 세우는 등 - 그 조율은 소프트웨어에 의해 관리됩니다. 그리고 그래서 이것은 근본적으로 에이전트입니다. 그것은 우리와 마찬가지로 작업 기억(working memory)이라 불리는 단기 기억과 장기 기억을 다룹니다. 그리고 그래서 메모리 관리 시스템은 믿을 수 없을 정도로 중요합니다. 이 전체 시스템을 에이전트라고 부릅니다. 대규모 언어 모델은 생각을 하는 데 사용되고, 하네스는 운영체제처럼 모든 것을 함께 연결합니다. 놀랍습니다 그리고 그래서 이것이 새로운 컴퓨팅 모델입니다. 이것이 에이전트가 할 수 있는 일입니다 - 놀라운 일들 말입니다. 이것이 큰 돌파구입니다: 이제 생각하고, 추론하고, 계획하고, 도구를 사용하는 일을 정말 잘할 수 있게 된 대규모 언어 모델들과, 메모리를 관리하고 조율을 관리하며 도구를 사용하는 이러한 하네스들을 우리가 이제 갖추게 되었다는 사실의 동시적인 수렴입니다. 우리는 이제 놀라운 일들을 할 수 있습니다.

몇 가지 예를 보여드리겠습니다. 이것은 프롬프트입니다. 이것은 생성된 코드이며, 이것이 결과물로 나옵니다. 여러분은 어떻게 생각하십니까? 정말 놀랍죠? 보세요, 우리는 여기서 클로드 코드(Claude Code)를 사용하지만, 코덱스(Codex) 역시 놀라운 일을 해냅니다. 여기 또 다른 예가 있습니다. 이것은 입력입니다: "검은색 배경에 엔비디아 녹색 점들이 있는 GIF를 만드세요, 흩어졌다가 대만 101 빌딩을 형성하고, NVLink GTC Taipei 2026, 엔비디아 로고로 변형되었다가 다시 흩어지기를 반복합니다." 맞죠? 방금 보신 것이 프롬프트였습니다. 여기 다음 예가 있습니다: "원격 제어 배터리 클립을 분실했습니다. 이렇게 생겼습니다. CAD 파일을 만드세요." 그것은 도구를 사용하여 새로운 것을 3D 프린팅할 준비가 된 CAD 파일을 생성합니다. 이해가 되시나요? 이것이 이제 새로운 컴퓨팅 패턴입니다. 우리가 애플리케이션을 실행하고 클릭하고 타이핑하던 시절과 달리, 이제 우리는 그것을 AI에게 우리가 원하는 것 - 우리의 의도 - 을 설명하는 것으로 대체하고 AI가 코드를 생성하거나 도구를 사용하여 필요한 결과물을 생산합니다. 이것이 미래에 컴퓨터가 작동할 방식입니다. 이것이 에이전틱 AI입니다. 2년 동안 우리는 이것을 향해 구축해 왔고, 이제 그것이 도래했습니다.

이제 큰 돌파구 중 하나는 물론 도구 사용입니다. 많은 사람이 "젠슨, 에이전틱 AI가 오고 있으니 모든 소프트웨어 회사가 망할 것입니다"라고 말했습니다. 저는 정확히 그 반대라고 말했습니다. 왜냐하면 아주 많은 에이전트가 존재할 것이고 세상은 더 이상 사람의 수에 의해 제한되지 않기 때문입니다. 따라서 그 에이전트들은 그 어느 때보다 더 많은 도구를 사용할 것입니다. 지금은 실제로 소프트웨어 회사가 되기에 놀라운 시기입니다. 하지만 소프트웨어는 에이전트가 사용할 수 있는 방식으로 에이전트에게 제시되어야 합니다. 이것은 큰 돌파구이며, 실제로 우리가 한 일, 엔비디아의 보물은 우리의 모든 CUDA 라이브러리입니다. 저는 그것들을 CUDA-X 라이브러리라고 부릅니다. 이것이 엔비디아의 보물입니다. 오늘날, 우리는 이제 이러한 CUDA-X 라이브러리를 인간보다 훨씬 더 효과적으로 사용할 수 있는 에이전트들에게 제시할 수 있습니다. 그리고 그래서 지금은 CUDA-X 라이브러리에게 아주 멋진 시기입니다. 그냥 한번 보세요. 20년 전 우리는 가속 컴퓨팅을 위한 단일 아키텍처인 CUDA를 구축했습니다. 우리는 컴퓨팅을 재발명했습니다. 수천 개의 CUDA-X 라이브러리가 개발자들이 과학 및 공학의 모든 분야에서 돌파구를 마련하도록 돕습니다. CUDA-X 라이브러리는 에이전트를 위한 도구입니다. 컴퓨터 리소그래피를 위한 cuLitho. 의사결정 최적화를 위한 cuOpt. 직접 희소 솔버를 위한 cuDSS. 정형 및 비정형 문서 전반에 걸친 심층 연구를 위한 AI-Q. AI RAN을 위한 Aerial. 미분 가능한 물리학을 위한 PhysicsNeMo. 유전체학을 위한 Parabricks. 그 기초에는 알고리즘이 있으며, 그것들은 아름답습니다. 수학에 박수를 보내주십시오 수학은 아름답습니다. 소프트웨어의 컴퓨팅 패턴은 바뀔 것입니다. 사실, 이것으로 다시 돌아와 봅시다. 이것은 에이전트, 즉 궁극의 분해되고 분산된 컴퓨팅 모델입니다. 이 에이전트를 처리하기 위해 참으로 많은 서로 다른 컴퓨터가 활성화될 것입니다. 에이전트는 모델, 하네스, 도구, 기술, 그리고 런타임으로 구성됩니다. 이 모든 것이 데이터 센터의 서로 다른 곳에서 실행되고 있습니다. 여러분은 모델을 두뇌로, 하네스를 몸으로, 그리고 그것이 사용하는 도구들이 런타임에서 작동하는 것을 - 작업장으로 생각할 수 있습니다. 그래서 이것은 작업장에서 도구를 가지고 일하는 사람, 노동자입니다. 물론 이것은 대단히 큰 규모로 수행되고 있습니다. 그리고 그 단계 각각은 컴퓨터의 서로 다른 부분에서 실행되고 있습니다.

여러분은 대규모 언어 모델이 생각하고 문맥을 처리하고, 환경을 관찰 및 이해하고, 추론하고, 계획을 세우고, 계획에 따라 행동하는 것을 볼 수 있습니다. 그것이 일어날 때마다 그레이스 블랙웰(Grace Blackwell) NVLink 72의 전체 랙이 활성화됩니다. 대규모 언어 모델로 생각하는 것입니다. 그것이 도구를 사용할 때마다 CPU가 사용됩니다. 그 도구는 C 컴파일러일 수도 있습니다. 파이썬(Python)일 수도 있습니다. 자바스크립트(JavaScript)일 수도 있습니다. 아니면 가속 컴퓨팅일 수도 있습니다. 오늘날의 에이전트들은 상대적으로 단순한 도구 사용자입니다. 내일 그들은 매우 정교한 도구 사용자가 될 것이며, 이것이 제가 보여드린 CUDA-X 라이브러리가 에이전트들에게 엄청나게 인기를 끌게 될 이유입니다. 그것들은 세상이 알고 있는 가장 중요한 문제 일부를 해결합니다. 그리고 우리의 모든 CUDA-X 라이브러리는 이제 AI가 사용하는 방법을 배울 수 있는 기술과 함께 제공될 것입니다. 그래서 CUDA-X 라이브러리는 기술 - 기본적으로 매뉴얼 - 과 함께 제공되며, AI는 그것을 읽고 "아하, 그렇게 사용하는 거구나"라고 합니다. 에이전트들이 이러한 라이브러리를 사용하는 능력은 놀라울 것입니다. 그리고 그래서 도구는 CPU와 GPU, 그리고 대규모 언어 모델에서 실행됩니다. 보안 하네스는 CPU와 엔비디아의 블루필드(BlueField)라 불리는 보안 프로세서인 DPU에서 실행됩니다. 이 모든 것의 조율은 CPU에서 실행됩니다. 이것이 모든 작업을 조율하는 CPU들인 전체 하네스입니다.

[베라CPU와 메모리]

가장 어려운 부분 중 하나는 메모리입니다. 여러분은 상상하실 수 있을 것입니다: KV 캐싱(KV caching)이라 불리는 작업 기억은 무엇을 기억해야 할지에 관한 것입니다. 압축뿐만 아니라 어떻게 검색할 것인가에 대한 것입니다. 정형 데이터를 검색합니까? 비정형 데이터를 검색합니까? 이러한 모든 서로 다른 데이터 구조들의 온톨로지, 즉 상호 관계는 무엇입니까? 그 전체 처리는 믿을 수 없을 정도로 복잡합니다. AI의 메모리 시스템은 스토리지 시스템을 완전히 혁신하게 만들 것입니다. 보시다시피, 이 컴퓨팅 모델의 모든 측면 - 이 컴퓨팅 패턴, 에이전트라 불리는 이 새로운 애플리케이션은 한 무리의 소프트웨어가 바이너리 내부, 운영체제 내부에 자리 잡은 기존의 애플리케이션 실행 방식과는 근본적으로 다릅니다. 이 분해되고 분산된, 이종적인 컴퓨팅 문제가 바로 우리가 차세대인 베라 루빈(Vera Rubin)을 구축한 정확한 이유입니다. 베라 루빈은 칩 하나가 아닙니다. 베라 루빈은 GPU 전용이 아닙니다. 그것은 GPU로 시작하지만, 베라 루빈은 놀랍습니다. 이 전체가 베라 루빈입니다. 엔드 투 엔드로 그것은 GPU들 - 베라 루빈 NVL72를 가지고 있습니다. 그것은 제가 더 말씀드릴 베라 CPU들에 의해 조율됩니다. 스토리지 시스템들은 혁신적입니다. 베라는 커넥트X-9(ConnectX-9), 도카(DOCA)라고 불리는 우리의 소프트웨어 스택과 함께, 내부에 보안 프로세서가 있어 휴식 중일 때나, 이동 중일 때뿐만 아니라 사용 중일 때도 모든 것이 암호화됩니다. 이 전반에 걸친 모든 것이 안전한데 왜냐하면 AI 모델이 너무나 소중하기 때문입니다. 이것이 이 전체 시스템이 기밀 컴퓨팅(confidential computing)을 준수하는 이유입니다. 이러한 시스템 각각은 그 자체로 완전한 혁명일 것입니다.

베라 루빈은 우리 회사 역사상 가장 야심 찬 노력입니다. 전 사원이 베라 루빈에 매달렸으며 4만 명의 엔지니어 전체가 참여했습니다, 여러분 모두는 말할 것도 없고요. 여러분 모두가 이 전체 시스템의 창조에 참여했습니다. 베라 루빈은 정말 기적이며, 단지 하나의 칩이 아니라 아주 많은 칩입니다. 자, 그것은 심지어 그 이상입니다. 오래전에 엔비디아는 GPU 회사였습니다. 하지만 수년에 걸쳐 우리는 시스템 회사가 되도록 진화했습니다. 여러분은 여기서 지금까지 설계된 것 중 가장 복잡한, 가장 복잡한 바닥부터 설계된 시스템을 보고 계십니다. 하지만 궁극적으로 우리의 고객들과 우리의 파트너들은 컴퓨터를 사고 싶어 하지 않습니다. 그들은 AI 공장을 짓고 싶어 하며, 이것이 엔비디아가 또다시 우리 자신을 변화시키기 시작한 이유입니다. 여러분은 당사의 많은 기술 역량이 이제 전체 인프라 규모에 있음을 보실 수 있습니다. 우리의 파트너들은 인프라 규모의 발전기, 냉각 시스템, 전력망 공급업체들입니다. 너무나 많은 산업 기업들이 이제 우리의 생태계의 일부인데, 왜냐하면 궁극적으로 우리는 전체 스택을 구축하려고 노력하고 있기 때문입니다 - 마치 GPU처럼, 우리가 그레이스 블랙웰 NVLink 72를 구축할 때처럼, 바로 지금 우리는 고객들이 놀라운 AI 인프라를 구축할 수 있도록 풀스택 시스템을 구축하고 있습니다. 한번 보시죠.

[엔비디아DSX-AI팩토리]

[영상 내레이션]

세계는 인류 역사상 가장 큰 인프라 구축인 AI 공장을 짓기 위해 경주하고 있습니다. AI 공장은 믿을 수 없을 정도로 복잡합니다. 컴퓨팅이 곧 매출이기 때문에 칩, 랙, 네트워크, 전력, 냉각, 전력망 등 모든 레이어가 처음부터 끝까지 함께 설계되어야 합니다. 엔비디아 DSX는 청사진입니다: 최대의 효율성과 수익성으로 AI 공장을 구축하고 운영하기 위한 참조 설계입니다. 그것은 옴니버스(Omniverse) 청사진인 DSX Sim으로 시작합니다. 파트너들은 단 하나의 랙을 주문하기도 전에 엔비디아 베라 루빈 AI 공장을 설계하고 검증합니다. 그들은 배치를 계획하고, 전력과 냉각을 시뮬레이션하고, 네트워크를 설계하고, 모든 통합을 검증하고, 디지털 트윈(digital twin)에서 모든 변경 사항을 테스트합니다. 공장의 전원이 켜집니다. DSX OS가 제어합니다 - 인프라를 프로비저닝, 운영, 모니터링 및 복구하여 설치된 시스템을 신뢰할 수 있고, 멀티 테넌트(multi-tenant) 방식이며, 회복 탄력성이 있는 AI 지원 용량으로 전환합니다. 오늘날의 AI 공장은 전력을 최대 40%까지 과도하게 프로비저닝합니다. DSX MaxLPS를 통해 운영자는 동일한 전력 예산 내에서 더 많은 GPU를 안전하게 배포하여 연간 수십억 달러의 추가 매출을 올릴 수 있습니다. 섭씨 45도의 획기적인 고온 액체 냉각은 물과 에너지를 덜 사용하여 더 많은 전력이 매출을 창출하는 컴퓨팅으로 이동하게 합니다. 놀랍습니다. 동적 전력 할당은 랙에서 랙으로 전력을 조향하여 고립된 와트를 회수하고, 작업이 진행 중인 곳으로 보냅니다. 랙 내 전력 평활화는 피크 전류 서지와 전력 급증을 평탄화합니다. 공장 전체에서 AI 에이전트 팀이 DSX MaxLPS와 함께 작업하며, 워크로드 수요를 충족하기 위해 냉각과 전력의 균형을 맞추도록 지속적으로 조율합니다. DSX AI 공장은 전력망과 협력하여 작동하는 유연한 에너지 자산입니다. DSX Flex는 실시간 전력망 신호를 읽고 전력망의 완화가 필요할 때 동적으로 전력을 다시 조정합니다. 이 십 년(decade)이 끝나기 전에 100기가와트의 AI 공장이 온라인으로 전환될 것입니다. 엔비디아 DSX AI 공장은 최고 효율로 작동하고, 최저 비용의 토큰을 생산하며, 전력망을 더 강하게 만냅니다.

[젠슨]

저는 엔비디아의 컴퓨팅 레이어와 소프트웨어 스택이 다른 사람들의 플랫폼 - 최종 시장에 서비스를 제공하는 제3자 플랫폼 및 라이브러리 - 에 통합되는 과거의 생태계 슬라이드를 보여드린 적이 있습니다. 그것은 컴퓨팅 생태계였습니다. 이것은 AI 공장 생태계입니다. 이것은 여러분 모두의 훨씬 다운스트림에 있습니다. 저의 업스트림에는 여러분 모두가 있고, 우리의 다운스트림에는 이 생태계가 있습니다. 엔비디아는 궁극적으로 단지 GPU를 만드는 것이 아니고 단지 시스템을 만드는 것이 아니라 고객들이 이토록 엄청나게 복잡한 AI 공장, 이 AI 인프라를 구축하도록 돕고 있기 때문입니다. 이들 각각은 1기가와트 수준에서 200억 달러, 300억 달러로 시작했습니다. 그것은 500억 달러, 600억 달러에 달하며 곧 기가와트당 800억 달러, 1,000억 달러가 될 것입니다. AI 공장에 1,000억 달러가 들어갑니다. 처음부터 작동해야 하고 즉시 제대로 작동해야 합니다. 자본 비용이 엄청납니다. 복잡성이 엄청납니다. 그래서 보시다시피 우리는 과거에 컴퓨터 내부에 칩을 설계하곤 했습니다. 그러고 나서 우리는 컴퓨터 내부에서 시스템을 시뮬레이션했습니다. 오늘 여러분은 방금 모든 것이 옴니버스에서 구축된 것을 보셨습니다. 저는 오랫동안 여러분 모두와 함께 옴니버스로 작업해 왔습니다. 이것은 우리가 땅을 파고 돈을 쓰기 훨씬 전에 디지털 프레임워크 내부, 디지털 시뮬레이터 내부, 디지털 세계 내부에서 세상이 만들고 싶어 하는 만큼 거대한 시스템을 구축할 수 있도록 꿈이 실현된 것이었습니다. 그래서 이것이 우리의 생태계입니다. 우리는 이것을 DSX라고 부릅니다. RTX는 우리의 GPU를 위한 것이고, DGX는 우리의 시스템을 위한 것이며, 이제 DSX는 기본적으로 인프라입니다. 시스템과 소프트웨어를 포함하여 이 전체 스택에서 우리가 하는 작업 덕분에, 우리는 소규모 회사들과 협력하여 그들이 세계 최고 수준의 AI 클라우드가 될 수 있도록 지원할 수 있습니다. 제가 보여드리려는 이들 각각은 불과 얼마 전까지만 해도 소규모 회사였습니다. 그리고 이제 코어위브(CoreWeave)는 500억, 600억, 700억 달러 가치를 지니며 믿을 수 없을 정도로 빠르게 성장하고 있습니다. 최근에 우리는 네비우스(Nebius)와 협력했으며 다시 한번 말씀드리지만, 그들 역시 믿을 수 없을 정도로 빠르게 성장하고 있습니다. 이러한 각각의 클라우드에는 놀라운 고객들이 있습니다: 소프트웨어 코딩 회사인 커서(Cursor); 이미지 생성 분야의 블랙 포레스트 랩스(Black Forest Labs); 월드 재단 모델인 월드 랩스(World Labs); 선도적인 금융 서비스 AI 기업인 레볼루트(Revolut); 그리고 쇼피파이(Shopify)입니다. 여기 또 다른 회사인 엔스케일(Nscale)이 있습니다, 그리고 그들의 고객은 브리티시 텔레콤(British Telecom), 구글 — 구글은 우리의 AI 클라우드 중 하나를 사용하고 있습니다. 씽킹 머신즈(Thinking Machines), 프론티어 랩스 회사로 매우 흥미롭습니다. 여기 한국의 네이버 클라우드(NAVER Cloud), 한국은행, 현대 등 수많은 놀라운 회사들이 있습니다. 여기 인도의 요타(Yotta)가 있습니다. 놀라운 회사들입니다. 여기 싱가포르에 기반을 두고 호주에 구축 중인 회사가 있습니다 — 투게더 AI(Together AI), AI 싱가포르(AI Singapore). 그리고 여기 인도네시아에 하나가 있습니다. 이 회사들 각각은 글로벌 고객뿐만 아니라 지역 고객에게도 서비스를 제공하고 있습니다. AI는 어디에서나 실행될 것입니다. 모든 기업이 그것에 의해 구동될 것이고, 모든 지역이 그것을 구축할 것입니다. 인도셋(Indosat), 여러분은 인도네시아에 계시고, 여기 대만에는 GMI가 있습니다. 박수치셔도 좋습니다.

놀랍고 놀라운 회사들, 놀라운 기회이지만 그들 모두는 몇 가지가 필요합니다. 물론 그들은 컴퓨팅 스택이 필요합니다 그 아래에 있는 이 전체 스택 말입니다. 이것이 바로 엔비디아를 유명하게 만든 것입니다. 당사의 모든 하드웨어와 소프트웨어, 라이브러리, 그리고 전 세계 제3자 개발자 생태계와의 연결을 통해 누구나 AI 클라우드를 세울 수 있습니다. 하지만 AI 클라우드는 이제 너무나 복잡합니다. 이것은 소프트웨어 버전, 즉 컴퓨터 과학 버전입니다. 돈 버전, 즉 자산 버전은 제가 아까 보여드린 거대한 공장입니다. 이 능력 하나만으로는 충분하지 않으며, 이것이 엔비디아가 AI 인프라 회사가 된 이유입니다. 이것을 잘 해내는 것, 고객들이 AI 공장을 짓고 AI 공장을 배포하도록 돕는 일에 믿을 수 없을 정도로 능숙해지는 것은 대단히 중요하며, 그 이유는 이겁니다: 컴퓨팅이 이제 매출입니다. 컴퓨팅은 이익입니다. 매출과 이익의 부재는 곧 손실입니다. 그래서 이것이 AI 인프라가 온라인으로 제공되는 하나의 예라는 점을 깨닫는 것이 정말 중요합니다. 그것은 빨리 온라인으로 들어올 수도 있고, 시간이 걸릴 수도 있습니다. 그 처리량(throughput)은 높을 수도 있고 낮을 수도 있습니다. 회복 탄력성, 즉 신뢰성은 좋을 수도 있고 나쁠 수도 있습니다. 그리고 유용성의 수명은 길 수도 있고 짧을 수도 있습니다. 이것은 500억 달러, 600억 달러에서 1,000억 달러로 향하는 것을 의미하기 때문에 이 곡선은 대단히 중요하며, 이것이 바로 엔비디아가 이토록 훌륭한 파트너인 이유입니다. 당사의 완전히 통합된 역량 덕분에 저희와 함께 일하는 것은 단순히 파워포인트 슬라이드 하나를 들고나온 것이 아닙니다. 저희는 전체 인프라를 만들었습니다. 저희는 모든 것을 함께 연결했습니다. 모든 것이 잘 작동하도록 저희 스스로 수십억, 수백억 달러 규모로 빌드했습니다.

그 결과, 당사의 첫 번째 토큰까지 걸리는 시간(time to first token), 첫 번째 추론까지 걸리는 시간, 훈련이 켜지기까지의 시간이 훨씬 빠릅니다. 둘째, 와트당 처리량 — 와트당 토큰이 완전히 세계 최고 수준이기 때문입니다. 그리고 그 이유는 우리가 모든 것을 통합하고, 모든 것을 바닥에서부터 설계하고, 전체 시스템을 시뮬레이션하고, 극한의 공동 설계(extreme co-design)를 사용하기 때문입니다. 방금 제가 베라 루빈 랙으로 보여드린 것처럼, 이 믿을 수 없는 처리량을 제공하기 위해 모든 것이 설계되었습니다. 여러분의 데이터 센터가, 여러분의 공장이 1기가와트를 가지고 있다면, 그것은 더 이상 가지지 못할 것입니다 — 그것이 여러분이 가질 수 있는 전력 발전의 전부입니다. 여러분이 1기가와트의 전력을 가지고 있다면, 와트당 처리량이 곧 매출입니다. 왜냐하면 모든 토큰이 수익성이 있기 때문입니다. 모든 토큰이 매출입니다. 이것이 미래입니다. 컴퓨팅이 곧 매출입니다. 와트당 성능이 여러분의 매출입니다. 단순히 칩이 더 저렴하다는 이유만으로 잘못된 아키텍처를 선택하는 것은 통하지 않습니다. 말이 되지 않습니다. 여러분은 와트당 매출을 확실히 해야 합니다. 더 많이 살수록 더 많이 벌게 됩니다. 그리고 셋째는 신뢰성입니다. 만약 여러분이 이러한 데이터 센터를 볼 기회가 있다면, 정말 많은 움직이는 부품들과 수백만 개의 케이블이 있습니다. 그 모든 컴퓨터가 조화롭고 신뢰성 있게 작동하는 능력은 극도로 어렵습니다. 우리는 이제 매우 오랜 시간 동안 대규모로 운영해 왔습니다. 그 경험이 중요합니다. 그 차이 그리고 마지막으로, 이것은 매우 어렵습니다: 항상 변하는 것입니다.

4년 전 호퍼(Hopper) 시절 — AI는 완전히 바뀌었습니다. 6년 전 암페어(Ampere) 시절 — AI는 완전히 바뀌었습니다. 우리는 처음에 인터럽트 간 평균 시간(mean time between interrupts)이 극도로 중요하다는 이야기를 시작했습니다. 이 시스템들의 수명입니다. 소프트웨어는 CNN에 관한 것이었습니다. 그다음 우리는 트랜스포머(Transformers)에 대해 이야기했습니다. 그다음 우리는 전문가 혼합(mixture of experts)에 대해 이야기했습니다. 이제 우리는 에이전틱 시스템(agentic systems)에 대해 이야기하고 있습니다. 매 세대마다, 매 몇 달마다 소프트웨어 산업은 새로운 기술을 내놓고 있습니다. 여러분의 아키텍처가 유연하지 않다면, 여러분의 생태계가 풍부하지 않다면, 이 곡선은 길어질 수 없습니다. 여러분의 시스템이 얼마나 오래 버틸지 예측할 수 없습니다. 저는 할 수 있습니다. 엔비디아 시스템은 전 세계에 있습니다. 소프트웨어 개발자들은 엔비디아 CUDA로 시작합니다. 그리고 정의상, 따라서 생태계의 수명, 유용한 자산은 훨씬 더 길어질 것입니다. 그 차이는 본질적으로 비용입니다. 여러분은 그것을 매출로 생각할 수도 있지만, 매출의 반대편은 비용입니다. 자산의 수명이 길면 TCO(총소유비용)는 낮아집니다. 이것이 차이점입니다. 컴퓨팅이 이런 방식으로 작동할 때의 모습입니다 — 더 많이 살수록 더 많이 벌게 됩니다. 이제 여러분 모두 저와 함께 이것을 경험하고 계십니다, 그렇지 않습니까? 여러분의 모든 수요, 여러분의 공장들은 매우 열심히 일하고 있고, 여러분의 직원들은 대만 전역에서 매우 열심히 일하고 있습니다, 왜냐하면 모든 사람이 돈을 벌고 싶어 하기 때문입니다. 그들은 유용한 AI가 여기 와 있다는 것을 깨달았습니다. 수익성 있는 AI가 여기 있습니다. 컴퓨팅 수요는 엄청나게 높으며, 컴퓨팅 수요가 제약 요인입니다. 그리고 그래서, 우리 모두 정말, 정말 열심히 일해서 세상이 AI 공장을 구축하도록 도웁시다

[베라 루빈과 핵심기술]

어디에서나 말입니다. 이것이 이것이 왜 이토록 중요한지에 대한 이유입니다. 저는 매우 행복합니다. 여기 제가 여러분 앞에 서 있습니다 — 베라 루빈은 본격적인 생산(full production)에 들어갔습니다. 베라 루빈은 본격적인 생산에 들어갔습니다. 우리가 베라 루빈을 위해 만든 공급망은 그레이스 블랙웰보다 두 배나 큽니다. 믿을 수 없습니다. 그리고 예전에 그레이스 블랙웰 랙 하나를 조립하는 데 2시간이 걸리던 것이 이제는 단 5분밖에 걸리지 않습니다. 따라서 용량이 더 높을 뿐만 아니라 처리량도 훨씬 빠르며, 우리는 수요를 지원하기 위해 이 모든 것이 필요합니다. 이 생태계는 놀랍습니다. 그레이스 블랙웰을 지원하기 위해 수백만 평방 피트가 온라인으로 전환되었으며, 현재 베라 루빈을 준비하고 — 램프 업(ramping up)하고 있습니다. 여러분 모두에게 감사드리고 싶습니다. 베라 루빈은 이제 본격적인 생산에 들어갔습니다. 감사합니다. 한번 보시죠.

[영상 내레이션]

대규모 언어 모델은 답변을 생성합니다. 이제 AI 에이전트는 일을 할 수 있습니다. 하지만 에이전틱 AI를 처리하는 것은 완전히 다른 종류의 문제입니다. 에이전트는 관찰하고, 추론하고, 계획하고, 도구를 사용합니다. 그들은 작업 기억과 장기 기억을 저글링하며 방대한 문맥을 관리합니다. 그들은 요구에 따라 전문 서브에이전트(subagents)를 구동합니다. 엔비디아 베라 루빈은 에이전틱 AI를 처리하기 위해 구축된 멀티 랙, 포드 규모(pod-scale) 시스템이며, 이제 본격적인 생산에 들어갔습니다. 공급망 전반에 걸친 제조, 자동화 및 조율은 목격하기에 기적입니다. 우리의 여정은 최초의 AI 슈퍼컴퓨터인 엔비디아 DGX-1을 출시했을 때 시작되었습니다. 다음 십 년 동안 우리는 파스칼(Pascal)과 최초의 암페어부터 최초의 랙 규모 AI 슈퍼컴퓨터인 그레이스 블랙웰에 이르기까지 모든 칩과 시스템을 한계까지 밀어붙였습니다. 그리고 이제, 베라 루빈 — 에이전틱 시대를 위해 구축된 최초의 멀티 랙, 포드 규모 슈퍼컴퓨터입니다. 그것은 TSMC에서 시작됩니다. 베라 루빈을 구성하는 7개의 새로운 칩은 수백 가지 공정 단계를 거쳐 형태를 갖춥니다. 3나노미터 공정. CoWoS 첨단 패키징. 마이크론(Micron), SK하이닉스, 삼성의 HBM4 메모리. 베라 루빈 GPU — 하나의 보드 위에 18,000개 이상의 부품과 6조 개의 트랜지스터가 있습니다. 베라 루빈 NVL72는 생각하는 작업 — 프롬프트 및 문맥 이해, 추론, 계획을 수행합니다. 다음으로, 새로운 PCB 미드플레인으로 간소화된 새로운 모듈형 컴퓨팅 트레이가 있습니다. 커넥트X-9, SuperNIC, 블루필드-4(BlueField-4) DPU — 회복 탄력성과 AI 공장 확장을 위해 케이블 없이 모두 유지보수 접근이 가능합니다. 18개의 컴퓨팅 트레이, 9개의 핫스왑 가능한 NVLink 스위치 트레이. 완전 가속 시 전기차 20대에 해당하는 5,000암페어 이상을 운반하는 새로운 고효율 액체 냉각 버스 바. 도합 130만 개의 부품이 이 3세대 MGX 랙을 형성합니다.

운영 가능한 베라 루빈 NVL72 엔지니어링 랙을 갖춘 마이크로소프트(Microsoft)에 축하를 전합니다. 그들의 베라 루빈 NVL72 엔지니어링 랙을 세운 델(Dell)과 코어위브에도 축하를 전합니다. 그다음, 모델을 조율하고, 메모리를 셔플하고, 도구를 실행하는 단일 액체 냉각 랙에 256개의 CPU가 장착된 베라 CPU 랙입니다. 폭스콘(Foxconn)과 콴타(Quanta)는 초저지연을 위해 16개 트레이에 걸쳐 256개의 그록(Groq) LPU와 초당 40페타바이트의 SRAM 대역폭을 갖춘 베라 LPX 랙을 탄생시켰습니다. NVL72가 가장 높은 처리량으로 토큰을 생성하는 동안, LPX 랙은 가장 낮은 지연 시간으로 토큰을 생성합니다. 베라 블루필드-4 STX — AI가 메모리를 유지하는 곳입니다. 블루필드-4에 의해 가속화된 스토리지 처리로 메모리, 스토리지 및 실리콘 내 보안을 연결합니다. 그리고 엔비디아 스펙트럼-X(Spectrum-X) 이더넷 포토닉스 — 200기가비트 공동 패키징 광학(co-packaged optics)을 갖춘 세계 최초의 이더넷 스위치입니다. TSMC의 CoWoS 공정, 칩 규모 패키징, 인듐 인화물(indium phosphide) 위의 초고전력 레이어 다이. 베라 루빈 — 5개의 연결된 랙 규모 시스템, AI 에이전트를 위한 슈퍼컴퓨터입니다. 대만 전역에 걸친 150개의 공급망 파트너. 수백만 평방 피트의 공장 바닥, 수백 개의 사이트. 크기, 전력, 규모의 한계까지 밀어붙인 칩, 패키지, 시스템 및 데이터 센터. 이것이 우리가 극단적인 공동 설계(extreme co-design)라고 부르는 것입니다. 우리는 대만과 함께 이를 해냈습니다. 함께, 우리는 AI 시대를 위해 컴퓨팅을 재발명했습니다. 대만은 시작할 때 우리와 함께 가졌고, 오늘날 우리가 베라 루빈을 세상에 내놓을 때도 여기 함께 있습니다. 대만 감사합니다.

신사숙녀 여러분, 이것이 베라 루빈(Vera Rubin) 입니다. 베라 루빈은 단순히 AI를 실행하기 위해 만들어진 것이 아닙니다. 베라 루빈은 에이전트를 실행하기 위해 구축되었습니다. 이것은 에이전틱(agentic) 시스템입니다. 그 복잡성을 상상해 보십시오. 이것이 바로 에이전트 아키텍처가 컴퓨터 과학의 마지막 거대한 돌파구인 이유입니다. 에이전트가 그 잠재력을 실현하고 유용해지기까지 이렇게 오랜 세월이 걸렸습니다. 따라서 이를 실행하는 컴퓨터가 세계에서 가장 진보된 컴퓨터라는 것은 당연한 이치입니다. 이것이 베라 루빈입니다. 한 번 살펴보겠습니다. 베라 루빈을 무대로 모셔올 수 있을까요? 재닌, 랙과 시스템이 준비되었나요? 꽤 무거워 보이네요. 이것이 바로 베라 루빈 — 베라 루빈 NVL72입니다. 이것은 LPX 랙입니다. 다음 GTC에서 이에 대해 훨씬 더 많은 이야기를 나누도록 하겠습니다. 오늘 여러분께 드릴 말씀이 정말 많습니다.

이것은 베라 CPU 랙입니다. 256개의 CPU가 탑재되어 있으며, 모두 수랭식으로 냉각됩니다. 조금 뒤에 베라에 대해 더 자세히 말씀드리겠습니다. 이것은 베라 블루필드 스토리지 처리 시스템이자 보안 시스템입니다. 그리고 당연히 이것은 당사의 멜라녹스(Mellanox) 네트워킹으로, 세계 최초의 CPO입니다. 이것이 베라 루빈입니다. 모두 놀라운 기술들입니다...

이제 호퍼(Hopper)를 개발했을 당시를 떠올려 보겠습니다. 여러분도 알다시피, 호퍼는 사전학습(Pre-training) 을 위해 설계되었습니다. 당시 사전학습은 우리가 가장 중요하게 생각했던 애플리케이션이자 가장 중요한 워크로드였습니다. 그 후 그레이스 블랙웰(Grace Blackwell)을 개발할 때 많은 사람들이 저에게 이렇게 말했습니다. "젠슨, NVIDIA는 사전학습은 정말 잘하잖아요. 하지만 추론(Inference)은 너무 쉬운 거 아닌가요?" 기억하시나요? 사람들은 이렇게 말하곤 했습니다. "추론은 정말 쉽다. 우리도 할 수 있다."

하지만 여러분도 알다시피 추론은 곧 돈입니다. 그리고 오늘날의 모델들, 특히 MoE(Mixture of Experts) 모델은 매우 복잡합니다. 게다가 매우 빠른 응답 속도, 실시간에 가까운 상호작용성, 그리고 높은 처리량(Throughput) 을 동시에 달성하는 것은 엄청나게 어려운 일입니다.

바로 이것이 우리가 NVL72를 만든 이유입니다. 오늘날 NVIDIA의 토큰(Token) 생성 비용은 세계에서 가장 낮습니다. 단지 10% 정도 낮은 것이 아니라, 몇 배에서 수십 배 수준으로 차이가 납니다. 그 이유는 우리가 극한의 공동 설계(co-design)를 수행했기 때문입니다. 추론(Inference)의 컴퓨팅 모델과 컴퓨팅 패턴을 정확히 이해했기 때문에 NVL72를 만들 수 있었습니다. 이제 베라 루빈(Vera Rubin) 시대에는 단순한 추론을 넘어섰습니다. 이제는 에이전트 시스템 안에서 이루어지는 추론의 시대입니다. 이것이 바로 베라 루빈입니다. 케이블도 없고, 호스도 없고, 팬도 없습니다.

제가 지난번에 보여드렸을 때만 해도 시스템 곳곳에 케이블이 가득해서 보기에는 멋졌지만 매우 복잡했습니다. 하지만 이제는 중앙에 PCB가 있어서 양쪽을 연결합니다. 예전에는 작업에 두 시간이 걸렸다면 이제는 5분이면 됩니다. 베라 루빈의 신뢰성과 복원력은 상상을 초월할 수준이 될 것입니다. 이것은 베라 CPU 트레이입니다. 지금까지 만들어진 CPU 중 가장 진보된 CPU입니다. 잠시 후 자세히 보여드리겠습니다. 그리고 이것은 스토리지 트레이입니다. 2개의 Vera CPU, 4개의 ConnectX-9, 그리고 엄청난 규모의 저장 장치를 탑재하고 있습니다.

이것은 새로운 LPX 랙입니다. Groq LPX 랙으로, 초저지연 추론을 위해 설계되었습니다. 처리량은 Vera Rubin이 제공하며 NVL72를 통해 더욱 확장됩니다. 만약 더 큰 성능이 필요하다면 Groq LPU를 추가할 수도 있습니다. 여기 보이는 것은 Vera Rubin NVLink 스위치 트레이입니다. 가운데 있는 것이 스위치인데, 이것은 혁신적입니다. 베라 루빈, NVL72, 그리고 우리가 발명한 NVLink 스위치 덕분입니다. 그리고 이것은 대규모 확장을 위한 Ethernet 스위치입니다.

흥미로운 점은 우리가 Grace Blackwell을 위해 이 두 시스템을 처음 도입했는데, 오늘날 NVIDIA는 세계 최대의 네트워킹 기업이 되었다는 것입니다. 저는 네트워킹 팀이 정말 자랑스럽습니다.이 기술은 우리가 하는 모든 일의 핵심 기반이 되고 있습니다.

이제 다음으로 우리가 진출할 중요한 산업에 대해 이야기해 보겠습니다. 재닌, 고마워요. 아마 뒤에서 2,000명 정도가 저 장비들을 끌고 있는 것 같군요. 이제 CPU에 대해 이야기해 봅시다. Vera CPU.

에이전트 AI 시대를 위해 만들어진 CPU입니다. 지금까지의 모든 CPU는 사람을 위해 설계되었습니다. 우리가 사용자였고, 클라우드에서는 CPU를 임대하는 존재였습니다. 우리는 초 단위의 세상에서 살아갑니다. 클라우드에서는 CPU 코어 수가 많을수록 더 많은 자원을 임대할 수 있습니다. 하지만 기존 CPU의 경제성과 사용 방식은 에이전트와는 근본적으로 다릅니다. 에이전트는 참을성이 없습니다. 에이전트는 초(second)의 세계가 아니라 나노초(nanosecond)의 세계에서 살아갑니다. 에이전트가 어떤 도구를 사용할 때는 가능한 한 빠른 응답을 원합니다. 데이터베이스에 접근할 때도 결과가 즉시 돌아오길 원합니다.

에이전트가 기다리는 매 순간은 다음 단계, 다음 단계, 다음 단계로 진행하지 못하게 만드는 지연이 됩니다. 따라서 CPU는 가능한 한 낮은 지연시간과 높은 상호작용성을 가져야 합니다. 그래서 우리는 AI 시대를 위한 Vera CPU를 만들었습니다.

우리 시스템 안에서 Vera CPU는 세 가지 방식으로 사용됩니다. 첫 번째는 Vera Rubin 내부입니다. 추론과 사고(Thinking)를 담당합니다. Vera Rubin 랙 안에는 이미 두 개의 CPU가 들어 있습니다. 우리는 현재 수백만 대의 Vera Rubin을 생산하고 있으며 Grace Blackwell 역시 수백만 개 판매했습니다. 이제 NVIDIA는 세계 최대 CPU 제조사 중 하나가 되었습니다. Vera Rubin 랙 안에는 두 개의 CPU가 있습니다.

첫 번째 CPU는 GPU를 관리하고 조율합니다. KV 캐시를 관리하고 랙 내부 소프트웨어를 처리합니다. 또한 보안과 격리를 담당하는 Grace BlueField도 있습니다. Vera Compute는 AI 모델 오케스트레이션, 도구 사용, 데이터베이스 접근 등을 담당합니다. 그리고 데이터 서버는 Vera BlueField 기반으로 구축되며 세계에서 가장 빠른 스토리지 서버입니다. 에이전트는 메모리에 엄청난 속도로 접근합니다. 스토리지 서버와 CPU는 데이터센터에서 가장 비싼 부분의 핵심 경로(Critical Path)에 위치합니다. 그 비싼 부분이 무엇일까요? 바로 GPU입니다.

AI 팩토리의 경제성은 결국 토큰 생산량에 달려 있습니다. 토큰은 여기서 만들어집니다. 따라서 가능한 많은 토큰을 생산해야 합니다. 여기에 모든 수익 구조가 달려 있기 때문에 CPU나 스토리지가 병목이 되어서는 안 됩니다. 그래서 우리는 완전히 새로운 CPU 아키텍처를 처음부터 설계했습니다. 세상에 존재한 적 없는 CPU. 그 이름이 Vera입니다. 이것은 인간을 위한 CPU가 아닙니다. 에이전트를 위한 CPU입니다.

이것은 오랜만에 등장한, 말 그대로 한계까지 밀어붙여 설계된 CPU입니다. 모든 CPU 코어를 빛의 속도에 가까운 패브릭(fabric)으로 연결하며, 그 대역폭은 초당 3.6테라바이트에 달합니다. 모든 CPU 코어가 매우 높은 대역폭으로 서로 통신하기 때문에 트립 경계(trip boundary) 교차가 없습니다. 코어를 하나씩 임대하는 방식이 아니라, 모든 코어가 함께 동작합니다. Vera의 단면 대역폭(cross-sectional bandwidth)은 압도적입니다. 또한 PCIe Gen 6를 사용하는 최초의 CPU입니다. 그리고 초당 1.2테라바이트의 대역폭을 제공하는 LPDDR5를 사용하는 최초의 CPU이기도 합니다. 이는 시장에서 가장 성능이 높은 CPU보다 2~3배 높은 대역폭입니다. 내부 대역폭이 3배에 달합니다. 코어당 대역폭과 전체 대역폭 모두 세계 최고 수준입니다. 이제 기억해야 할 것이 있습니다. CPU의 수는 상당히 많아질 것입니다. 그 이유는 매우 단순합니다. 과거에 우리는 인간을 위해 CPU를 만들었습니다. 인간은 약 10억 명 정도밖에 없습니다. 하지만 앞으로는 수십억 개의 에이전트가 존재하게 될 것입니다. 그리고 이 에이전트들은 거의 인내심이 없습니다. 왜냐하면 바로 옆에 있는 GPU의 비용이 너무 높고, 너무 가치 있으며, 너무 귀하기 때문입니다.

따라서 이 CPU들은 높은 성능을 가져야 할 뿐만 아니라 극도로 높은 전력 효율성도 가져야 합니다. 그래야 토큰 생성에 필요한 전력을 빼앗지 않으면서 AI 팩토리 안에 최대한 많은 CPU를 집적할 수 있기 때문입니다. 그리고 우리는 토큰 생성이 곧 수익 창출의 원천이라는 사실을 알고 있습니다.

클럭당 명령어 처리량(Instructions per Clock)

단일 스레드 성능

코어당 대역폭

칩 내부와 칩 주변 전체 대역폭

전력 효율성

이것들이 바로 Vera를 정의합니다. Vera는 절대적으로 세계 최고 수준입니다. 최고 성능의 x86 CPU와 비교하면 차원이 다릅니다. 실제 단일 스레드 성능을 비교해 보아도 압도적입니다. CPU에서 성능을 5% 향상시키는 것도 대단한 일입니다. 10% 향상시키는 것도 놀라운 일입니다. 하지만 이런 수준의 성능 향상은 전례가 없습니다. 이것이 NVIDIA Vera입니다. 어떻게 생각하십니까? 한번 살펴보겠습니다.

[영상 내레이션]

에이전트 AI는 CPU의 역할을 바꿔 놓습니다. 이제 CPU는 지휘자(conductor)이고 GPU는 오케스트라입니다. 기존 CPU는 완전히 다른 시대를 위해 만들어졌습니다. 더 많은 코어를 소켓에 집적하고, 이를 잘게 나누고, 가상화하고, 시간 단위로 임대하는 것이 목적이었습니다. 하지만 에이전트 시대에는 CPU가 GPU 활용률의 병목이 됩니다. 이는 토큰 처리량, 지연시간, 사용자 경험에 직접적인 영향을 미칩니다. NVIDIA Vera는 에이전트 루프(agentic loop)를 위해 만들어진 CPU입니다. NVIDIA의 자체 데이터센터 CPU 코어와 확장 가능한 일관성 패브릭(scalable coherency fabric)을 결합하여 AI 팩토리의 효율을 극대화하는 적절한 성능, 코어 수, 대역폭의 균형을 제공합니다. Vera의 중심에는 NVIDIA Olympus 코어가 있습니다. 이 코어는 현대 데이터센터 워크로드를 위해 설계되었습니다. 분기(branch)가 많은 Python 런타임, 도구 호출(tool calls), 샌드박스 코드 실행 등을 처리하기 위해 만들어졌습니다. 각 코어는 처리량에 최적화되어 있습니다. 하나의 신경망 기반 분기 예측기가 매 사이클마다 두 개의 분기 결과를 평가합니다. 10-와이드 디코드 엔진은 매 사이클마다 더 많은 작업을 가져옵니다. 대규모 Out-of-Order 엔진은 명령어 실행을 계속 진행시킵니다. 새로운 그래프 엔진을 활용한 고급 프리패처(prefetcher)는 다음에 필요한 데이터를 미리 예측합니다.

그러나 아무리 빠른 코어라도 데이터가 정확한 시점에 도착해야 의미가 있습니다. Vera는 LPDDR5X 메모리를 사용하는 최초의 CPU이며, 대역폭 저하 없이 여러 개의 오류를 동시에 수정할 수 있습니다. Vera는 x86 대비 최대 메모리 지연시간을 40% 줄였습니다. 이를 통해 검색(Retrieval), 분석(Analytics), 샌드박스 실행 과정에서 코어가 필요한 데이터를 제때 공급받을 수 있습니다. NVIDIA의 2세대 확장형 일관성 패브릭은 88개의 Olympus 코어를 하나의 모놀리식 메시(monolithic mesh) 구조로 통합합니다. 메모리 다이와 코어 다이를 여러 개의 칩렛으로 분리하지 않았기 때문에 기존 CPU보다 코어 간 통신 속도가 50% 더 빠릅니다. 또한 메모리 일관성을 유지하는 NVLink 칩 간 연결(NVLink chip-to-chip)은 GPU를 CPU에 직접 연결합니다.

GPU뿐 아니라 NVLink 칩 간 연결은 여러 CPU 소켓으로 Vera를 확장할 수 있게 해주며 CPU 간 엄청난 대역폭을 제공합니다. Vera는 x86 CPU 대비 에이전트 샌드박스 성능이 1.8배 높습니다. 독립형 Vera 랙은 에이전트 샌드박스, 도구, 코드, 데이터 파이프라인을 실행할 수 있습니다. Rubin GPU와 긴밀하게 결합된 Vera는 가속 워크로드가 계속 진행될 수 있도록 유지합니다. NVIDIA Vera BlueField-4 STX는 컨텍스트, 메모리, AI 스토리지를 담당합니다. 컴퓨팅, 네트워크, 스토리지. Vera는 에이전트 시대를 위한 CPU입니다.

[젠슨 황]

이것은 우리의 새로운 주요 성장 동력이 될 것입니다. 이미 여러 평가와 리뷰가 나오고 있는데 반응이 꽤 좋습니다. 정말 좋은 평가들입니다. 이제 기억해 두십시오. Grace와 Vera는 AI 세계에서 가장 폭넓게 검증된 CPU이기도 합니다. NVIDIA와 함께 AI를 수행하는 모든 데이터센터, 모든 클라우드, 모든 기업은 이미 Grace를 검증했습니다. 전체 소프트웨어 스택 역시 Grace에 맞게 최적화되었습니다. 앞으로 모든 기업은 Vera를 검증하게 될 것입니다. Vera는 세계에서 가장 최적화된 에이전트용 CPU가 될 것입니다. 그 이유는 Vera Rubin과 함께 제공되기 때문이며, 우리가 대규모 아키텍처 전환을 단행했기 때문입니다. 실제로 Grace Blackwell 전환 과정에서 가장 큰 위험 요소는 외부 x86 CPU에서 Grace Blackwell로 전환하는 것이었습니다. 그 전환은 매우 어려운 작업이었습니다. 하지만 우리는 훌륭하게 수행해냈습니다. 이제 Grace는 사실상 Grace Blackwell의 동의어가 되었습니다. 사람들은 Blackwell이라고 말할 때 Grace Blackwell을 함께 이야기합니다. 왜냐하면 이제 그것이 모든 곳에 존재하기 때문입니다. 모든 기업의 소프트웨어 스택이 그것에 맞게 최적화되어 있습니다.

속도를 높이는 것은 하나의 문제입니다. SQL의 속도를 높이는 것은 매우 어려운 일입니다. SQL은 지금까지 만들어진 가장 유명한 도메인 특화 언어입니다. CUDA 이전에도 SQL이 있었고, OpenGL 이전에도 SQL이 있었습니다. IBM이 발명했습니다. 오늘날 SQL은 전 세계의 구조화된 데이터베이스 언어입니다. 모두가 SQL을 사용합니다. 여기서 보여드리는 것은 SQL이 3배 더 빠르게 실행된다는 것입니다. 10% 향상도 아니고, 25% 향상도 아닙니다. 무려 3배입니다. 놀랍습니다.

다음은 실시간 스트림 처리입니다. 여러분의 AI는 단순히 문서를 읽는 데 그치지 않을 것입니다. AI는 텔레메트리 데이터를 관찰하게 될 것입니다. 특히 공장이나 증권거래소 같은 곳에서 말이죠. AI는 지속적으로 텔레메트리를 분석하게 될 것입니다. 쏟아져 들어오는 데이터는 CPU로 들어갑니다. 이것이 바로 뉴욕증권거래소의 실시간 스트림 처리를 수행하는 Vera CPU입니다. 뉴욕증권거래소의 사장인 Lynn Martin은 우리와 협력해 주셨습니다. 이 시스템은 전 세계에서 실시간으로 운영되고 있습니다. 실시간 스트림 처리입니다. Vera CPU는 6배 더 빠릅니다. 이는 모두 대역폭 덕분입니다. 단일 스레드 명령 실행 성능, 코어 간 내부 대역폭, 외부 대역폭 모두의 결과입니다.

Vera는 완전히 혁신적입니다. 보통 x-factor에 대해 이야기하는 것은 GPU 분야에서나 있는 일입니다. CPU의 실제 워크로드에서 x-factor를 이야기하는 경우는 매우 드뭅니다. 그래서 저는 우리 팀이 정말 자랑스럽습니다. 여러분은 정말 훌륭한 일을 해냈습니다. 앞으로 엄청난 로드맵이 기다리고 있습니다. 정말 흥미로운 점은 거의 모든 사람이 Vera를 지지하고 있다는 것입니다. 그들도 우리만큼 기대하고 있습니다.

Vera는 완전히 새로운 시장을 열어가고 있습니다. 에이전트는 새로운 워크로드입니다. 과거에는 사람을 위한 CPU를 만들었습니다. 이제는 에이전트를 위한 CPU가 필요합니다. 에이전트 시스템은 요구 특성이 다릅니다. 왜 CPU가 같아야 하겠습니까?

우리는 수백만, 수천만 개의 Vera를 만들 것입니다. 그리고 대만의 ODM 기업들, 컴퓨터 제조업체들, OEM 기업들과 함께 시장에 진출할 것입니다. 이미 초기 도입 기업들을 볼 수 있습니다. 초기 도입 기업들은 에이전트 기업들입니다. 이것은 완전히 새로운 시장의 시작입니다. 이전에는 존재하지 않았던 시장입니다. 기존 시장을 대체하는 것이 아닙니다. 이것은 새로운 시장, 즉 에이전트를 위한 CPU 시장입니다. 그리고 이 시장은 분명 기존 시장보다 더 커질 것입니다. 왜냐하면 사람보다 훨씬 더 많은 에이전트가 존재하게 될 것이고, 에이전트들은 매우 성급하기 때문입니다. 그래서 NVIDIA Vera CPU입니다. 감사합니다.

[엔비디아 에이전트 툴킷]

이 슬라이드가 사실 가장 중요한 슬라이드입니다. 핵심 메시지는 이것입니다. 향후 10년 동안의 컴퓨팅 패턴은 바로 이것입니다. 에이전트들, 하니스(harness), 그리고 대규모 언어 모델을 오케스트레이션하는 시스템입니다. 모든 기업이 이를 운영하게 될 것입니다. 모든 기업은 에이전트 기업이 될 것입니다. 모든 기업 내부에는 에이전트들이 동작하게 될 것입니다. 모든 기업은 에이전트가 자신만의 운영체제를 필요로 한다는 사실을 깨닫게 될 것입니다. 모든 기업은 이렇게 묻고 있습니다.

"에이전트를 어떻게 안전하게 운영할 것인가?"

"우리 업무를 위한 에이전트를 어떻게 구축할 것인가?"

그래서 우리는 Enterprise AI를 위한 NVIDIA Agent Toolkit을 만들었습니다. 여러분은 제가 이것을 공개적으로 만들어 가는 과정을 보셨습니다. NVIDIA가 하는 거의 모든 일은 그렇습니다. 지난 5년 전, 10년 전 GTC 발표를 다시 보면 오늘 이야기하는 내용들을 볼 수 있습니다. 우리는 이 순간을 위해 수년 동안 준비해 왔습니다. 기업이 에이전트를 서비스로 구축하거나 운영하기 위해 필요한 것은 네 가지입니다.

첫 번째는 모델입니다. 당연히 대규모 언어 모델입니다. 더 똑똑할수록 좋고, 더 저렴할수록 좋고, 더 빠를수록 좋습니다. 두 번째는 전체 시스템을 오케스트레이션할 하니스(harness)가 필요합니다. 세 번째는 도구입니다. 이 모델들은 도구를 사용하고 싶어 합니다. 그리고 도구에는 스킬(skill)이 포함됩니다. 제가 보여드린 CUDA-X 라이브러리들이 바로 그런 도구들입니다. 앞으로 에이전트들에게 엄청난 도구가 될 것입니다. 그리고 마지막으로 런타임(runtime)이 필요합니다. 모든 것을 하나로 묶어주는 운영체제가 필요합니다. 그것이 바로 NVIDIA Agent Toolkit입니다.

여기에는 수정 가능한 다양한 세계 최고 수준의 오픈 모델들이 포함되어 있습니다. 조금 후에 더 보여드리겠습니다. 누구나 에이전트를 실행할 수 있습니다. Claude Code도 실행할 수 있습니다. 정말 놀라운 에이전트입니다. Codex도 실행할 수 있습니다. 역시 훌륭한 에이전트입니다. 이들을 NVIDIA OpenShell이라는 하니스 안에서 실행할 수 있습니다. OpenShell은 기업 환경에서 매우 높은 보안을 제공합니다. 이 셸은 에이전트를 보호하고 보안 정책 안에서 동작하도록 합니다. 개인정보는 보호되고, 권한과 특권은 관리되며, 신원도 보호됩니다. 그래서 OpenShell은 전 세계적으로 채택되고 있으며 오픈소스입니다. Red Hat, Canonical, Microsoft를 비롯한 수많은 기업들이 채택하고 있습니다. 앞으로 어디에서나 사용될 것입니다. 이것이 바로 런타임입니다. 그리고 이 런타임은 NVIDIA AI 플랫폼에 완벽하게 최적화되어 있습니다.

따라서 어떤 클라우드에서든, 온프레미스 환경에서든, 심지어 디바이스 위에서도 OpenShell을 실행할 수 있습니다.

에이전트가 사용할 수 있는 도구와 라이브러리가 있습니다. 수정 가능한 모델도 있고 그대로 사용할 수도 있습니다. 또는 OpenClaw, Hermes 같은 에이전트 하니스도 있습니다. 이러한 에이전트 하니스들은 이제 온프레미스 환경에서도, 원하는 어떤 곳에서도 실행할 수 있습니다. 이 네 가지가 현대 기업의 운영체제를 구성합니다. 이것을 어떻게 활용할 수 있을까요?

[에이전트AI와 반도체 설계]

제가 가장 좋아하는 에이전트 활용 사례 중 하나는 반도체 설계입니다. 반도체 설계는 NVIDIA가 하는 일 중 가장 중요한 업무입니다. 그래서 우리는 Cadence와 협력하여 칩 설계 슈퍼 에이전트를 만들고 있습니다. 이 시스템은 Codex 또는 Claude Code가 오케스트레이션합니다. RTL, 아키텍처 다이어그램, 회로도, 명세서를 입력으로 사용합니다. 그리고 필요한 수정 작업을 수행합니다. 우리는 Nemotron을 활용해 NVIDIA 플랫폼에 최적화된 슈퍼 에이전트를 함께 만들었습니다.

[영상 내레이션]

Cadence와 NVIDIA는 칩 설계 에이전트를 구축하기 위해 협력하고 있습니다. 수십만 개의 NVIDIA 칩이 모여 세계 최첨단 AI 모델을 구동하는 AI 팩토리를 만듭니다. 이 칩들과 그 칩들이 동작하는 시스템을 설계하는 것은 가장 어려운 엔지니어링 과제 중 하나입니다. 수조 개의 트랜지스터. 미세한 규모의 3차원 회로.

모든 게이트와 모든 배선은 피코초 단위로 동기화되어야 하며 오차의 여지가 없습니다. 실물 프로토타입은 너무 느리고 비용이 많이 듭니다. 그래서 엔지니어들은 디지털 환경에서 작업합니다. 각 칩은 아키텍처 명세로 시작하여 RTL로 변환됩니다. RTL은 칩 설계 언어입니다. RTL은 시뮬레이션을 통해 검증되어야 합니다. 단 하나의 버그가 칩 출시를 수개월 지연시킬 수 있습니다.

NVIDIA에서는 수천 명의 엔지니어가 매년 수십억 시간의 컴퓨팅 자원을 사용하며 수백만 개의 테스트를 작성하고 실행하며 디버깅합니다. 이 사이클은 보통 수주가 걸립니다. 이 과정을 단축하기 위해 Cadence와 NVIDIA는 설계 검증 에이전트를 구축했습니다. Codex가 전체 프로세스를 오케스트레이션합니다. Cadence Chip Stack이 RTL 검증 루프를 시작합니다. Nemotron이 이를 구동하고 NVIDIA OpenShell이 이를 보호합니다. RTL 생성, 테스트벤치 작성, 회귀 테스트, 디버깅을 담당하는 전문 서브에이전트들이 동작합니다. 시스템은 스스로 작동합니다. Chip Stack 에이전트들은 Cadence Xcelium을 이용해 수백 건의 시뮬레이션을 수행하고 JasperGold를 이용해 형식 검증을 수행합니다. 설계 결함을 찾아내고 코드 버그를 수정합니다. 예전에는 수주가 걸리던 작업이 이제는 몇 시간 만에 끝납니다. 검증 사이클은 40배 이상 빨라졌습니다. Cadence와 NVIDIA는 AI 에이전트를 통해 칩 설계를 재창조하고 있습니다.

[JENSEN]

몇 주에서 몇 시간으로. 몇 주에서 몇 시간으로. 몇 주에서 몇 시간으로. NVIDIA에는 수천 명의 칩 설계 엔지니어가 있습니다. 우리는 수십만 개의 Cadence 슈퍼 에이전트를 고용할 것입니다. 회사를 더 빠르게 성장시키고 더욱 야심찬 목표를 달성하며 더 놀라운 것들을 만들기 위해서입니다. 앞서 설명한 모델, 하니스, 도구, 스킬, 런타임이 바로 그 이유입니다. Cadence와 함께 모든 도구를 CUDA 위에서 가속하는 이유도 같습니다. 에이전트는 참을성이 없습니다. 즉시 답을 원합니다. 그래서 모델, 하니스, CUDA 가속 라이브러리와 도구, 그리고 런타임이 모두 하나로 결합됩니다. 지금 여러분이 본 것이 바로 그것입니다.

[에이전트AI 생성 모델/데이터-Nemotron 3 Ultra]

이제 이 모든 것의 출발점에 대해 이야기해 보겠습니다. Cadence는 자신들의 워크플로우와 전문성을 완벽하게 이해하는 슈퍼 에이전트를 만들기 위해 모델을 수정하고 튜닝할 수 있습니다. 그들은 자신들의 독자적인 지식과 노하우를 가진 독자적인 슈퍼 에이전트를 만들 수 있어야 합니다. 그 시작점은 뛰어난 모델이어야 합니다. 우리는 그것을 Nemotron이라고 부릅니다. Nemotron은 전 세계를 위한 오픈 모델을 구축하는 데 전념하고 있습니다. 그래서 여러분 모두가, 우리 모두가, 각자의 에이전트를 만들 수 있도록 하는 것입니다. 오늘 우리는 Nemotron 3 Ultra를 발표합니다. 우리의 차세대 오픈 모델입니다. 그리고 정말 뛰어납니다. Nemotron 모델은 단순히 모델만 제공하지 않습니다. 우리는 모델을 학습시키는 데 사용한 데이터도 제공합니다.

그리고 우리는 놀라운 파트너들의 연합체를 가지고 있기 때문에 서로 협력하며 데이터를 공유하고 있습니다. Nemotron은 세계 최대 규모의 장시간 추론(long-running reasoning) 모델 데이터셋 중 하나로 학습되었습니다. 장시간 도구 사용(long-running tool task-solving), 도구 활용(tool-using) 데이터셋으로 학습되었습니다. 이 모든 것은 우리의 훌륭한 파트너십 덕분입니다. 그리고 이 모든 것, 모델부터 학습 스크립트, 데이터까지, 모두 여러분에게 공개됩니다. 이것이 오픈 모델이 지향하는 최고의 모습입니다. 세계 최고의 오픈 모델 시스템입니다.

목표는 단순합니다. 여러분이 그것을 가져가고, 추가 개발하고, 더 뛰어나게 만들고, 여러분만의 것으로 만들 수 있도록 하는 것입니다. Nemotron 3 Ultra는 5배 더 빠릅니다. 이것은 세계 최초의 하이브리드 아키텍처 기반 모델입니다. SSM(State Space Models)과 Mixture of Experts(MoE)를 결합했습니다. 이 아키텍처는 엄청나게 빠릅니다. 우리는 여러분이 빠르게 생각할 수 있도록 빠르게 만들었습니다. 빠르게 생각할 수 있으면 같은 비용으로 더 길게 생각할 수 있습니다. 그래서 5배 더 빠릅니다. 또한 비용도 30% 저렴합니다. 총 FLOPs 비용과 총 추론 시간 기준으로 세계에서 가장 비용 효율적인 모델들보다도 30% 더 저렴합니다.

우리는 세계 최고의 오픈 모델들과 비교하고 있습니다. 최첨단 수준의 지능. 5배 더 빠름. 30% 더 저렴함.

완전한 오픈 모델. 우리는 이것에 전적으로 헌신하고 있습니다. 현재가 Nemotron 3이고, 우리는 이미 Nemotron 4를 개발 중입니다. 그래서 모델, 하니스, 도구와 스킬, 런타임으로 구성된 이 전체 툴킷은

전 세계 모든 기업이 자신만의 에이전트를 구축할 수 있게 하는 이유입니다. Cadence가 자신들만의 슈퍼 에이전트를 만든 것처럼 말입니다.

그리고 우리는 수많은 기업들과 함께하고 있습니다. Cadence, CrowdStrike, ServiceNow, Palantir,

SAP 등과 함께 말입니다. 사람들은 항상 저에게 이렇게 말했습니다. "Jensen, 에이전트가 이 시장들을 파괴할 것입니다." 저는 정반대라고 말했습니다. 그리고 이제 여러분도 볼 수 있습니다. 에이전트는 파트너들과 친구들에게 역사상 가장 큰 기회를 만들어 줄 것입니다. 그리고 그들을 돕기 위해 NVIDIA Agent Toolkit이 있습니다.

그래서 정리해 보겠습니다. 첫 번째, Vera Rubin은 본격 양산 단계에 들어갔습니다. 두 번째, Vera CPU.

에이전트 시대를 위해 만들어진 CPU입니다. 세 번째, NVIDIA Enterprise AI Toolkit. 모든 기업과 모든 엔터프라이즈 소프트웨어 기업이 에이전트를 구축할 수 있도록 하기 위한 것입니다.

[AI PC 시대의 도래-RTX Spark]

저와 여러분의 인연은 바로 여기서 시작되었습니다. 그리고 여기 계신 많은 분들, 저의 친구들과 파트너들,

여러분의 기업들도 이곳에서 시작되었습니다. 여러 면에서 이곳은 현대 컴퓨터 산업의 시작점입니다.

벌써 40년이 되었습니다. NVIDIA는 올해로 33년이 되었습니다. 우리가 등장하기 전에도 PC 산업은 이미 시작되고 있었습니다. Windows 1, Windows 2, Apple 1, Apple 2. 그리고 우리가 등장할 무렵에는 Windows 3.1이 PC의 표준이었습니다. 그리고 여러분도 아시다시피, Windows 95는 PC를 개인화했습니다. PC를 기업과 회사의 도구에서 소비자 전자기기로 변화시켰습니다. 모든 사람이 하나씩 갖게 되었고,

실제로 모두가 갖게 되었습니다. 이것이 시작이었습니다.

이 컴퓨팅 플랫폼은 매우 영리하게 설계되었습니다. Windows는 단순히 분리(disaggregated)된 것이 아니었습니다. 올바르게 추상화(abstraction)되었습니다. 시스템 BIOS, 개방형 칩셋, 런타임에서 연결되고 설치될 수 있는 드라이버를 갖춘 운영체제, 그리고 오늘날의 PC를 가능하게 만든 멀티미디어 API 계층까지. 이 각각의 요소들이 PC를 대중화시키는 데 필수적이었습니다. 40년이 지난 지금, Microsoft와 NVIDIA는 PC를 다시 발명하려고 합니다. 이것이 새로운 PC가 될 것입니다.

내일 밤 저는 Satya와 함께할 예정입니다. 우리는 우리가 함께 하고 있는 일에 대해 더 자세히 이야기할 것입니다. Microsoft와 NVIDIA는 지난 3년 동안 이 순간을 준비하기 위해 협력해 왔습니다. PC가 완전히 새로운 방식으로 동작하도록 재설계하기 위해서입니다. 앞서 말씀드렸듯이, 에이전트라는 새로운 컴퓨팅 패턴은 AI 클라우드에서 실행될 것입니다. 기업 내부에서도 실행될 것입니다. 그리고 여러분의 PC에서도 실행될 것입니다. 그렇다면 자율적인 에이전트가 존재하는 PC는 어떻게 될까요? 여러분을 돕고, 여러분을 이해하는 에이전트 말입니다. 그와 대화할 수 있습니다. 그는 여러분을 볼 수도 있습니다. 서류 정리를 부탁할 수도 있고, 연구를 맡길 수도 있고, 각종 업무를 대신 수행하게 할 수도 있습니다. 제가 조금 후에 보여드릴 것보다도 훨씬 더 많은 일을 할 수 있습니다.

그러나 새로운 운영체제는, 물론 기존 운영체제에 더해 대규모 언어 모델이 포함된 형태입니다. 여러 면에서 대규모 언어 모델은 현대판 DirectX와 같습니다. 입력과 출력을 이해합니다. 프롬프트를 이해합니다. 컴퓨터 비전을 이해합니다. 영상을 생성할 수 있습니다. 소리를 생성할 수 있습니다. 이는 PC의 현대적 확장입니다. 지능 확장(Intelligence Extension)인 것입니다. 그리고 그 위에서, 앞서 말씀드린 것처럼,

애플리케이션은 에이전트 런타임으로 대체될 것입니다. 그것이 현대적 애플리케이션입니다. 즉, 에이전트입니다. 한번 살펴보겠습니다.

[영상 내레이션]

모든 것은 작은 불꽃에서 시작되었습니다. 40년 만에 처음으로 PC를 다시 상상해 보자는 아이디어였습니다. 에이전트의 시대에 개인용 컴퓨터는 어떤 모습이 될까요? 에이전트는 네이티브로 실행됩니다.

모델과 연결됩니다. 로컬에서도, 클라우드에서도 실행됩니다. 개인 AI가 됩니다. 보안을 위해 샌드박스 환경에서 동작합니다. 지속적으로 실행되며, 실질적인 일을 수행합니다. 칩과 운영체제는 진화해야 합니다.

RTX Spark를 소개합니다. 33년 동안 우리가 배운 모든 것이 하나의 칩에 담겼습니다. Blackwell RTX GPU. 6,144개의 Tensor Core. 1페타플롭의 AI 성능. MediaTek과 협력해 개발한 맞춤형 20코어 Grace CPU. NVLink로 연결되었습니다. 128GB 통합 메모리. TSMC 3나노 공정. 700억 개의 트랜지스터. 그리고 Microsoft와 긴밀히 협력하여 만든 에이전트용 Windows 플랫폼.

우리는 개인용 컴퓨터를 다시 발명하고 있습니다. 에이전트 시대를 위한 컴퓨터를 만들고 있습니다. 이것은 새로운 개인용 컴퓨팅 혁명의 시작입니다. 그리고 그 시작은 NVIDIA RTX Spark입니다.

[JENSEN]

여기 있습니다. 물론 제가 가장 아름다운 부분도 보여드려야죠. 바로 비디오 게임입니다. 그것은 우리 마음속에 가장 가까운 존재입니다. 이것은 Forza입니다. 참고로 이것은 새로운 007 게임입니다. 저는 정말 기대하고 있습니다. 제가 약간 그 사람처럼 생긴 것 같기도 하네요. 신사숙녀 여러분, NVIDIA RTX Spark 노트북입니다. 감사합니다.

이제 여러분께 제가 주머니에 너무 많은 것을 넣고 다닌다는 점에 감사드려야겠네요. 좋습니다. 이것은 세상에서 가장 놀라운 칩입니다. 세상이 만들어낸 가장 놀라운 칩이라고 생각합니다. 이 칩은 MediaTek과 협력하여 만든 칩입니다. 아까 Rick을 본 것 같은데요. 정말 아름다운 칩입니다. 솔직히 말하면, 이 칩을 만드는 데는 33년이 걸렸습니다. 왜냐하면 NVIDIA 소프트웨어의 100%가 이 칩 위에서 동작하기 때문입니다. 디지털 생물학을 실행하고 싶습니까? 문제없습니다. 지진 데이터 처리(seismic processing)를 하고 싶습니까? 문제없습니다. 천체물리학을 하고 싶습니까? 문제없습니다. CUDA와 관련된 모든 것, 모든 물리학, 모든 생물학, 모든 유전체학(genomics), 모든 AI, 모든 컴퓨터 그래픽스까지, 전부 가능합니다.

NVIDIA가 지금까지 만든 모든 애플리케이션, 그리고 Windows가 지금까지 실행해 온 모든 애플리케이션이 동작합니다. Microsoft와 NVIDIA는 세상이 만들어낸 거의 모든 소프트웨어를 이 컴퓨터에서 실행할 수 있도록 세심하게 최적화했습니다. 그리고 이제는 에이전트도 실행합니다. 정말 놀라운 컴퓨터입니다.

저는 이 제품이 정말 자랑스럽습니다. 좋습니다. 이제 제가 다음에 보여드릴 영상을 보기 전에 이것을 꼭 기억해 두시기 바랍니다. 여기 있는 모든 것이 여러분의 PC에서 실행될 수 있다고 상상해 보십시오. 그 컴퓨터에는 로컬 Nemotron 3 Ultra 모델이 있을 수도 있고, Nemotron 3 모델이 있을 수도 있고, 클라우드에 있는 Claude Code, Codex, 또는 다른 어떤 모델이 있을 수도 있습니다. 혹은 네트워크 어딘가에 존재하는 모델일 수도 있습니다. 하지만 그것은 실제로 동작할 것이고, 정말 놀라운 일을 해낼 것입니다. 그 영상을 보시죠.

[영상 내레이션]

모든 집은 하나의 아이디어에서 시작됩니다. 아이디어를 실제 설계로 만드는 과정에는 수많은 도구와 전문 지식이 필요합니다. 건축가들은 아이디어를 스케치합니다. 엔지니어들은 구조를 계산합니다. 시공사들은 자재를 선정합니다. 그리고 수없이 많은 세부 사항들이 서로 연결되어야 합니다. 그리고 많은 시간이 필요합니다. 이제 RTX Spark에서 로컬로 실행되는 에이전트가 제 노트북의 도구들을 사용해 집을 설계하는 것을 도와줄 수 있습니다. OpenShell 샌드박스 안에서 Hermes 하니스를 실행하고, 클라우드의 Claude Sonnet과 연결됩니다.

저는 부지를 선택하고, 설계 영감을 위한 콘셉트 스케치와 스타일 무드보드를 공유합니다. 그리고 요구사항과 설계 의도를 설명하는 프롬프트를 입력합니다. 그러면 제 에이전트가 작업을 시작합니다. 노트북에 있는 도구들을 사용해 Rhino를 열고, 부지 모델링을 시작합니다. 지형을 만들고, 건축 한계선(setback)과 건물 외곽 형태를 설정합니다. 그리고 비용, 편의성, 품질을 최적화한 건물 형태를 제안합니다. 형태가 결정되면, 에이전트는 실내 레이아웃을 생성합니다. 벽, 동선, 방들이 형태를 갖추기 시작합니다. 제가 수정하고 싶을 때 언제든 개입할 수 있습니다. 문, 창문, 구조 요소들이 자동으로 배치됩니다. 에이전트는 스스로 실수를 발견하고 수정합니다.

제가 승인하면, 에이전트는 Rhino 모델을 Blender로 내보냅니다. 재질과 객체 속성이 설계 맥락을 유지한 채 전달됩니다. 저는 재질을 미세 조정하여 원하는 느낌을 완성합니다. 그리고 장면 구도를 선택합니다.

Blender가 집을 렌더링합니다. 에이전트는 Flux 2 모델 기반 생성형 AI를 사용하여 이를 사실적인 이미지로 만듭니다. 여러 시점, 다양한 조명 조건까지 반영됩니다. 과거에는 복잡했던 워크플로우가 이제 RTX Spark에서 실행되는 에이전트에 의해 안내되고 단순화됩니다. 상상의 속도로 설계가 진행됩니다.

[JENSEN]

개발자들은 이것에 정말 흥분해 있습니다. 정말 놀라운 컴퓨터입니다. 모든 가속 기술, 모든 소프트웨어 역량이 이 안에 들어 있습니다. 그리고 모든 개발자들과 협력하여 여러분을 위해 놀라운 제품을 만들고 있습니다. 다음은 Adobe입니다. 전 세계 수천만 명이 사용하는 놀라운 도구 모음입니다. Adobe는 Photoshop과 Premiere의 핵심 아키텍처를 재설계했습니다. 그리고 RTX Spark용 버전을 출시할 예정입니다. 속도는 두 배입니다. 이미 빠른 제품이지만 이제는 두 배 더 빨라집니다. 또한 에이전트 친화적으로 설계되었습니다. MCP 서버를 통해 노트북 안의 에이전트와 직접 상호작용할 수 있습니다.

RTX Spark를 시장에 내놓기 위해 협력하는 파트너 수는 정말 놀랍습니다. 이것은 40년 만의 첫 번째 위대한 PC 재창조입니다. 그리고 전 세계 생태계가 우리와 함께하게 되어 정말 기쁩니다. 사실상 모두가 함께하고 있습니다. 모두가 RTX Spark를 지원할 것입니다. 그리고 우리는 여러분과 함께 매우 똑똑하고 강력하며 아름다운 노트북들을 만들어 갈 것입니다. 정말 감사합니다. 하지만 이것이 전부는 아닙니다. RTX Spark는 노트북의 재창조입니다. 사실 Microsoft와 NVIDIA는 PC 전체를 재창조하고 있습니다. 오늘 우리는 완전히 새로운 제품군을 발표합니다. 데스크톱, 노트북, 워크스테이션을 포함하는 세 가지 혁신적인 Windows 머신입니다. 100% Windows 호환. 100% CUDA. 100% NVIDIA AI Tensor Core. 전 세계 어떤 NVIDIA 플랫폼에서 실행되는 소프트웨어든 모두 이곳에서 실행됩니다. 이것은 40년 만에 처음으로 완전히 재설계되고 재창조된 PC 제품군입니다.

정말 놀라운 점은 이것입니다. 이것은 RTX Spark 노트북입니다. 그리고 이것은 데스크톱입니다. MSI 제품입니다. Joseph, 이건 당신 것입니다. 정말 아름답지 않습니까? 이 에이전트는 24시간 365일 쉬지 않고 동작할 수 있습니다. 사용량 제한도 없습니다. 에이전트를 다운로드해 바로 실행할 수 있습니다. 항상 동작합니다. 사용량 걱정도 없습니다. 그리고 집 전체와 연결됩니다. 노트북과 연결되고, 디스플레이와 연결되고,

모든 카메라와 연결됩니다. 건조기, 정수기, 온수기, 원하는 모든 것과 연결됩니다. 보안 시스템도 마찬가지입니다.

모든 것이 연결됩니다. 그리고 이것은 여러분의 개인 AI, 개인 AI 에이전트가 됩니다. 시간이 지날수록 더 똑똑해집니다. 오늘은 Nemotron 3 Ultra가 있고, 내일은 Nemotron 4가 있습니다. 그 다음은 Nemotron 5, Nemotron 6입니다. 계속해서 더 똑똑해질 것입니다. 그리고 이 장치는 집에서 여러분을 돕습니다. 여행 예약을 원하십니까? 문제없습니다. 그리고 만약 놀라운 시스템이 필요하다면, 이것은 DGX Station입니다. Windows와 완벽하게 호환되며, Windows의 모든 소프트웨어를 실행할 수 있습니다. 그리고 768GB 메모리를 탑재하고 있습니다. 즉, 1조 개(Trillion) 파라미터 모델도 실행할 수 있습니다.

정말 믿기 어려운 수준입니다. 20페타플롭 성능. 초당 8TB 메모리 대역폭. 그리고 이것이 여러분 책상 위에 놓입니다. 대규모 언어 모델 개발자, 에이전트 개발자라면, 이 장치는 여러분에게 필요한 모든 연산 능력을 제공합니다. 그리고 배포 시에는 클라우드에 올리면 됩니다.

여기서 흥미로운 일이 일어나고 있습니다. 15년, 20년 전을 떠올려 보십시오. 그때 우리는 전화기(phone)라는 개념을 가지고 있었습니다. 오늘날 여러분이 스마트폰으로 가장 하지 않는 일은 무엇입니까? 전화하는 것입니다. 거의 모든 다른 일을 하고 있습니다. 그래서 지금의 스마트폰은 과거의 전화기와는 완전히 다른 의미를 가집니다. 저는 앞으로 무슨 일이 일어날지 확신합니다. 10년 후의 PC는 오늘날 우리가 생각하는 PC와 완전히 달라질 것입니다.

애플리케이션을 실행하고, 클릭하고, 타이핑하는 도구가 아닐 것입니다. 제 이론은 이렇습니다. 오늘날 모든 집에 히터, 대형 TV, 잔디깎이, 식기세척기가 있는 것처럼, 언젠가 여러분의 집 안에는 AI 슈퍼컴퓨터가 있을 것입니다. 그리고 그것이 여러분의 모든 에이전트를 실행할 것입니다. 모든 비서를 실행할 것입니다.

하루 종일 여러분을 위해 온갖 일을 해줄 것입니다. 여러분은 집 안에서 AI 에이전트 컴퓨터를 운영하게 될 것입니다. 시간이 지나면 이것은 PC라기보다는 R2-D2에 가까워질 것입니다. 또는 C-3PO에 더 가까워질 것입니다. 이 컴퓨터의 재창조는 전화기가 스마트폰으로 재창조된 것만큼이나 큰 사건이 될 것입니다.

그리고 지금이 그 여정의 시작입니다.

이것은 새로운 제품군의 시작입니다. 우리는 이를 위한 로드맵을 가지고 있습니다. 완전히 새로운 제품 패밀리입니다. 앞으로 모든 세대의 아키텍처마다 데스크톱, 노트북, 워크스테이션을 모두 제공할 것입니다. 그리고 제가 가장 기쁘고 영광스럽게 생각하는 것은 전 세계 PC 산업의 100%가 우리와 함께 PC 재창조에 참여하고 있다는 점입니다. 새로운 제품군. 새로운 시작입니다. 감사합니다.

에이전틱 AI와 물리 AI(Physical AI) 아시다시피 에이전틱 AI는 디지털 로봇과 같습니다.에이전틱 AI는 이해하고, 추론하고, 계획을 세우고, 행동하며, 도구를 사용합니다. 에이전틱 AI는 앞으로 이 모든 컴퓨터에서 실행될 것입니다. 우리는 휴머노이드 로봇용 컴퓨터, 모든 종류의 로봇용 컴퓨터를 개발하고 있습니다.

자율주행차용 컴퓨터도 개발하고 있습니다. 위성용 컴퓨터도 개발하고 있습니다. 여러분은 이미 Tensor Core를 탑재한 GeForce를 사용하고 있습니다. 방금 저는 새로운 PC 제품군에 대해 이야기했습니다. 농업 장비, 제조 장비, 중공업 장비까지 모두 에이전트 기반으로 변하게 될 것입니다. 심지어 미래의 무선 기지국(base station)도 에이전트 기반이 될 것입니다. 트래픽을 이해하고, 다른 기지국들과 어떻게 협력해야 가장 적은 에너지로 동작할 수 있는지 판단하며, 주파수 효율을 극대화하게 될 것입니다. 그래서 앞으로는 모든 것이 에이전트를 실행하게 될 것입니다. 오늘날 NVIDIA는 그 중심에 있습니다. 하지만 앞으로 수십억, 수백억 개의 에이전트 시스템과 에이전트 컴퓨터가 전 세계에서 동작하게 될 것이라고 확신합니다.

[피지컬 AI 개발-COSMOS 3]

가장 큰 문제는 데이터입니다. 언어 모델의 경우,우리가 인터넷에서 학습한 모든 영어 데이터와 언어 데이터는 사람의 관점에서 작성된 것입니다. 우리가 썼고, 우리가 읽고 있습니다. 하지만 AI 로봇을 위한 데이터를 만들려면 로봇의 관점에서 데이터를 만들어야 합니다. 문제는 전 세계 영상 데이터 대부분이 3인칭 시점이라는 것입니다. 1인칭 시점 데이터가 아닙니다. 그래서 에이전트 시스템, 로봇 시스템, 물리 AI에서 데이터가 가장 어려운 문제입니다.

여러분은 우리가 이 문제를 해결하기 위해 단계적으로 발전해 온 과정을 보았습니다. 처음에는 텔레오퍼레이션(Teleoperation)으로 시작했습니다. 사람이 시범을 보이는 방식입니다. 이는 인간 피드백 기반 강화학습(RLHF)의 돌파구와 크게 다르지 않습니다. 그 다음에는 시뮬레이션을 사용합니다. 여기서 Omniverse가 등장합니다. 검증 가능한 보상을 사용하는 강화학습과 유사합니다. 우리는 이런 시스템들을 활용해 AI 모델, 즉 물리 AI 모델을 부트스트랩합니다.

결국에는 3인칭 데이터를 1인칭 시점으로 재투영(reproject)하여 학습할 수 있게 됩니다. 그리고 마침내 우리는 부트스트래핑을 통해 어떤 관점에서도 물리 세계를 이해할 수 있는 World Foundation Model을 갖게 되었습니다. 3인칭, 1인칭, 안에서든 밖에서든 모두 이해할 수 있습니다. 이것은 엄청난 돌파구입니다.

오늘 우리는 Cosmos 3를 발표합니다. Cosmos 3는 물리 AI의 최전선(frontier)입니다. 언어 모델 분야에는 많은 기업들이 있습니다. 하지만 물리 AI 분야에서는 우리가 세계 최고입니다. 저는 이것을 이뤄낸 팀이 정말 자랑스럽습니다. 이것은 여러분의 모든 작업을 위한 Foundation Model입니다. 공장용 로봇,

산업용 로봇, 물리 세계와 상호작용하는 어떤 종류의 로봇이라도 이제 Cosmos 3라는 동반자를 갖게 됩니다. Cosmos 3는 이해하고, 추론할 수 있습니다. 생성할 수 있고, 시뮬레이션할 수 있으며, 심지어 정책(policy) 자체가 될 수도 있습니다. 전 세계 리더보드 최상위권에 올라 있습니다. 저는 Cosmos가 정말 자랑스럽습니다. 그리고 오늘 우리는 Cosmos 3를 발표합니다.

[영상 내레이션]

현실 세계는 무한하며 예측 불가능합니다. 물리 AI는 데이터를 필요로 하지만, 현실 세계 데이터를 대규모로 수집하는 것은 불가능합니다. 물리 AI에게 컴퓨팅은 곧 데이터입니다. 이것이 Cosmos입니다. 물리 AI를 위한 개방형 최첨단 옴니모델(Open Frontier Omni-Model)입니다. 새로운 Transformer 아키텍처 위에 구축되었습니다. 픽셀, 행동(action), 소리(sound), 언어(language)가 자기회귀 Transformer로 입력됩니다. 이 Transformer는 추론하고, 계획을 세우며, 확산(Diffusion) Transformer에게 다음에 생성해야 할 내용을 지시합니다.

개발자들은 다양한 구현체와 활용 사례에 맞게 Cosmos를 후학습(Post-training)합니다. VLM으로서 Cosmos는 물리 세계를 관찰하고, 무슨 일이 일어나고 있는지 이해하며, 장면을 설명하고, 중요한 요소를 표시합니다. World Model로서 Cosmos는 이미지, 텍스트, 비디오를 입력받아 물리 법칙을 따르는 합성 영상을 생성합니다. 시뮬레이터로서 Cosmos는 정책 학습과 평가의 루프를 완성합니다. 그리고 NVIDIA OmniDreams의 기반 모델로서, 행동 조건형 월드 모델(Action-conditioned World Model)로서, Cosmos는 미래를 프레임 단위로 예측합니다.

Cosmos를 후학습시키면 인식, 추론, 계획, 행동 생성이 가능한 World Action Model이 됩니다. 모든 종류의 로봇을 위한 모델입니다. 움직이는 모든 것을 위한 모델입니다. 새로운 형태의 데이터. 컴퓨팅에 의해 생성되는 새로운 형태의 교사(Teacher). 물리 AI 시대 개발자들을 위한 기반. 그것이 Cosmos입니다.

[JENSEN]

텍스트 데이터와 컴퓨팅이 AI를 만들었습니다. 이제 AI가 생겼기 때문에 컴퓨팅이 데이터가 되었습니다. Cosmos 3를 사용하여 수많은 모델을 학습시키십시오. Cosmos는 정말 놀라운 오픈 모델 시스템입니다. Nemotron과 정확히 같은 철학입니다. 우리는 모델을 공개합니다. 데이터를 공개합니다. 심지어 어떻게 학습시켰는지도 공개합니다. 그래서 여러분이 이를 개선하고 자신만의 독점 모델로 발전시킬 수 있도록 합니다. 우리는 수많은 산업에서 놀라운 파트너들과 함께 일하고 있습니다. 하지만 모델은 AI 스택에서 가장 이해하기 쉬운 부분일 뿐입니다. AI 스택은 훨씬 복잡합니다. 생성기(generator), 모델, 시뮬레이터, 런타임까지 포함됩니다. 에이전트 시스템과 마찬가지입니다.

[자율주행 AI – Alpamayo 2 Super]

자동차는 사실상 물리 AI입니다. 자율주행 에이전트 로봇입니다. 그리고 자동차 역시 복잡한 AI 스택을 필요로 합니다. 오늘 우리는 Alpamayo 2 Super를 발표합니다. 자율주행차를 위한 오픈 모델입니다. 우리는 전 세계 자동차 제조사들과 협력하고 있습니다. NVIDIA DRIVE Hyperion에 참여한 브랜드들을 보면,

이는 전 세계 자동차 제조사의 약 80%를 차지합니다. 앞으로 수많은 NVIDIA DRIVE Hyperion 시스템이

Alpamayo 2 Super 또는 다른 NVIDIA 스택을 실행하게 될 것입니다. 또한 우리는 모빌리티 서비스와도 연결되어 있습니다. 전 세계 모빌리티 서비스의 약 97%가 우리와 연결되어 있습니다. 그래서 DRIVE Hyperion 런타임과 Halos 운영체제 위에 Alpamayo 2 Super를 배포하면 전 세계 모든 모빌리티 서비스와 연결할 수 있게 됩니다.

[영상 내레이션] Mercedes 자율주행 시연

"안녕 Mercedes, 내가 가장 좋아하는 샌드위치 가게로 가자." 목적지까지 경로를 설정합니다. 차선이 비어 있습니다. 주행을 시작하기 위해 앞으로 이동합니다. 우리 차선을 막고 있는 정차 차량 때문에 왼쪽으로 살짝 이동합니다. 정지 표지판에서 멈추기 위해 감속합니다. 교차로를 통제합니다. 보행자에게 양보하기 위해 정지합니다. 보행자가 우리 차선에 있기 때문에 통과를 기다립니다. 왼쪽에서 끼어드는 차량에 양보합니다. 오른쪽에 정차한 차량을 피하기 위해 왼쪽으로 이동합니다. 차선으로 합류하는 차량과의 거리를 유지합니다. 앞쪽에 차선 합류 구간이 있습니다. 안전거리를 유지하기 위해 정지하고 감속합니다.정지 표지판에서 정차합니다. 교차로는 통제되고 있습니다. 정지합니다. 교차 차량에 양보합니다. 트럭과 안전거리를 유지합니다. 우리 차선 왼쪽을 막고 있는 트럭 때문에 왼쪽으로 이동합니다. 목적지는 오른쪽에 있습니다. Alpamayo 2 Super 세계 최초의 추론(Reasoning) 기반 자율주행 차량입니다.

[JENSEN]

만약 이 시스템이 생각하는 모든 내용을 계속 말하게 하면 여러분은 미쳐버릴 것입니다. 하지만 우리는 차량이 계속 스스로에게 말하고 있다는 사실이 매우 기쁩니다. 그것을 우리는 "생각(thinking)"이라고 부릅니다. 그래서 Alpamayo 2 Super는 추론하는 자동차입니다. 우리가 만든 이 기술은 휴머노이드에도 그대로 적용됩니다. 물론 아직 해결해야 할 돌파구가 많이 남아 있습니다.

[로봇용 레퍼런스 플랫폼-NVIDIA Isaac GR00T]

NVIDIA Isaac GR00T는 우리의 휴머노이드 로봇 스택입니다. 모델, 데이터 생성, 시뮬레이션, 운영체제를 포함한 런타임까지 포함합니다. 이것이 Isaac GR00T 플랫폼입니다. 우리의 모든 시스템은 동일한 아키텍처를 사용합니다. 클라우드용 에이전트 시스템, PC용 에이전트 시스템, 자율주행차용 로봇 시스템, 휴머노이드 로봇용 시스템까지 모두 동일합니다. 그리고 모든 경우에 우리는 전체 스택을 직접 구축합니다. 완전한 수직 통합 구조입니다. 극단적인 수준의 공동 설계(Co-design)를 수행합니다. 그리고 나중에 이를 개방하여 누구나 사용할 수 있도록 합니다. 원하는 부분만 사용할 수도 있고, 원하는 부분만 수정할 수도 있습니다. 필요하다면 우리가 수정 작업도 도와드립니다.

하지만 아직 부족한 것이 하나 있습니다. 바로 로봇 시스템을 위한 레퍼런스 플랫폼입니다. 로봇은 너무 복잡합니다. 모터가 너무 많고, 센서가 너무 많고, 매우 섬세합니다. 하지만 PC, DGX, 클라우드, 자율주행차를 제공했던 것처럼 로봇 분야에서도 레퍼런스 플랫폼을 제공해야 합니다. 그래서 이제 우리는 로봇용 레퍼런스 플랫폼을 발표합니다.

오늘 우리는 NVIDIA Isaac GR00T Reference Humanoid Robot 을 발표합니다. 완전 통합형 휴머노이드 로봇입니다. 각 손에 25 자유도(Degrees of Freedom). Sharpa가 제작했습니다. 로봇 전체에는 31 자유도가 있습니다. 키는 6피트(약 183cm), 무게는 150파운드(약 68kg)입니다. 저와 비슷하죠. 첫 번째 숫자는 조금 작고, 두 번째 숫자는 조금 큽니다. 그 외에는 꽤 비슷합니다. (청중 웃음)

이 플랫폼은 새로운 Jetson Thor와 우리의 전체 소프트웨어 스택 위에서 동작합니다. 데이터 생성 스택,

데이터 시뮬레이션 스택, 런타임까지 모두 하나의 로봇 안에 통합되어 있습니다. 누구나 사용할 수 있도록 설계되었습니다. 우리는 이것을 고등교육 기관과 대학 연구자들을 위해 만들었습니다. 왜냐하면 이 모든 것을 스스로 구축하는 것은 엄청나게 어렵기 때문입니다. 이제 한번 살펴보겠습니다.

[영상 내레이션]

AI의 다음 도약은 범용 로봇입니다. 휴머노이드입니다. 하지만 이를 만드는 것은 어렵습니다. 모든 팀은 처음부터 시작해야 합니다. 시뮬레이터를 연결하고, 원격 조작 시스템을 구축하고, 데이터 파이프라인을 만들고, 학습 인프라를 구성해야 합니다. 연구를 시작하기도 전에 수개월의 준비가 필요합니다.

NVIDIA Isaac GR00T 휴머노이드 로봇을 위한 개방형 개발 플랫폼입니다. 오픈 모델, 시뮬레이션 및 학습 라이브러리, 데이터 생성기까지 포함합니다. 여기에 로봇 컴퓨터까지 포함됩니다. 완전히 사전 구성되어 있으며, 몇 시간 만에 사용할 수 있습니다. 먼저 Isaac Lab에서 시뮬레이션 환경을 구축합니다. 실제 로봇이나 시뮬레이션 로봇을 이용하여 Isaac Teleoperation으로 시범 데이터를 수집합니다. Omniverse와 Cosmos를 사용하여 합성 데이터를 생성합니다. 하나의 시범 데이터를 수천 개로 확장합니다. 정책을 학습시키고, Isaac Lab Arena에서 평가합니다. 그리고 Jetson Thor 위에서 실행되는 Isaac ROS를 통해 배포합니다.

모든 요소는 모듈형이며 개방형입니다. 우리 것을 사용해도 되고, 여러분의 것으로 교체해도 됩니다. GR00T는 연구소부터 공장 현장까지 모든 분야의 로봇 연구를 지원합니다. 하나의 개방형 플랫폼.

그리고 이제 새로운 버전이 등장합니다. Isaac GR00T 레퍼런스 디자인 로봇. NVIDIA의 개방형 플랫폼 위에 구축되었으며, 어떤 연구실에서든 최첨단 연구를 수행할 수 있도록 설계되었습니다. 로보틱스의 시대는 여기서 시작됩니다. NVIDIA Isaac GR00T와 함께 말입니다.

[JENSEN]

정말 많은 로봇이군요. 로봇을 연구하는 전 세계 모든 분들께 제가 말씀드리고 싶은 것이 있습니다. 컴퓨터 산업은 완전히 바뀌었습니다. 지난 6개월 동안 모든 것이 바뀌었습니다. 에이전트가 현실화되었고,

최신 프론티어 모델과 결합되면서 AI가 실제로 유용한 일을 수행할 수 있게 되었습니다. 이 컴퓨팅 패턴은 앞으로 계속 반복될 것입니다. 모델이 있고, 도구를 사용하는 하니스가 있으며, 스킬이 있고, 런타임 위에서 동작하는 에이전트. 이것이 새로운 컴퓨팅 패턴입니다. 런타임은 클라우드일 수도 있고, 온프레미스일 수도 있고, PC일 수도 있고, 로봇일 수도 있습니다.

하지만 컴퓨팅 패턴 자체는 완전히 동일합니다. 여러분은 취향에 따라 다른 하니스를 사용할 것입니다. 필요에 따라 다른 모델을 사용할 것입니다. 그리고 여러분만의 목적에 맞게 이를 개선할 것입니다. 다른 사람들의 일을 돕는 슈퍼 에이전트를 만들게 될 것입니다. 이 에이전트 플랫폼, 이 에이전트 패턴을 위해

NVIDIA는 Enterprise AI Toolkit을 제공합니다. 이것은 여러분이 AI를 활용하는 훌륭한 방법이며, 우리에게도 엄청난 성장 기회입니다.

[마무리(안봐도됨)]

Vera Rubin은 현재 본격 양산(full production)에 들어갔습니다. Grace Blackwell이 AI 처리, 특히 추론(Inference)을 위해 만들어졌다면, Vera Rubin은 에이전트를 실행하기 위해 만들어졌습니다. 현재 이미 양산 중입니다. 이것은 단순히 GPU 이상의 존재입니다. 완전히 분산(disaggregated)된, 분리형(distributed) 에이전트 처리 시스템 전체입니다. NVIDIA는 이제 단순한 GPU 회사가 아닙니다. 단순한 시스템 회사도 아닙니다. 여러분이 최대의 매출과 최대의 이익을 창출하고, 가능한 한 빨리 목표에 도달할 수 있도록 돕는 인프라 기업이 되었습니다.

에이전트 세계, 즉 새로운 컴퓨팅 시대에서는 사람을 위한 CPU가 아니라 에이전트를 위한 CPU를 만들게 됩니다. 에이전트용 CPU는 고유한 요구사항을 가지고 있습니다. 그리고 NVIDIA Vera는 혁신적입니다.

저는 Vera의 시장 확대 속도가 정말 기대됩니다. 이미 주문이 들어오고 있습니다. 이는 NVIDIA 역사상 가장 빠르고 가장 성공적인 제품 출시가 될 것입니다.

Microsoft와 NVIDIA는 완전히 새로운 PC 제품군을 만들었습니다. 이것은 새로운 시작입니다. 그리고 제가 방금 설명한 동일한 에이전트 컴퓨팅 패턴은 모든 종류의 디바이스에서 실행될 것입니다. 제가 PC에 대해 이야기했지만, 미래에는 로봇, 위성, 기지국, 공장, 라우드, 온프레미스, 엣지 컴퓨팅 환경 등 모든 곳에서 실행될 것입니다. 에이전트 컴퓨팅 패턴은 전 세계 컴퓨터 시스템 전체에 복제될 것입니다.

개인용 컴퓨터에 대한 우리의 생각도 크게 바뀔 것입니다. 여러분 모두의 파트너십과 우정에 감사드립니다. 우리가 함께 해온 모든 일이 없었다면 오늘 이 자리에 설 수 없었을 것입니다. 저는 여러분이 지난 1년 동안 이뤄낸 성과가 정말 자랑스럽습니다. 그리고 내년은 더욱 놀라울 것입니다.

마지막으로 하나 더 보여드릴 것이 있습니다.

함께 보시죠.

[영상 내레이션 - 엔딩 영상]

유용한 AI가 도착했습니다. 여러분 곁에서 함께 일하는 에이전트들입니다. 오늘 우리가 이야기한 내용을 놓치지 마십시오. 모든 것을 여러분을 위해 쉽게 설명해 드리겠습니다. 타이베이. 에이전트. 오랫동안 오해받아 왔습니다. 예전에는 할리우드 영화 속 주인공들에게만 존재하는 것처럼 보였습니다. 하지만 이제는 여러분의 동료입니다. 꿈을 현실로 만들고, 작은 방에서 회사를 만드는 것을 가능하게 합니다.

혼란이 많다는 것을 압니다. 우리는 여러분의 목소리를 들었습니다. 그래서 Vera를 만들었습니다.그것이 진짜라는 것을 보여드리기 위해서입니다.

가장 저렴한 토큰 비용. 10배의 처리량. 특수 에이전트를 위한 더 높은 성능. Vera는 에이전트의 메모리를 유지합니다. 이제 CPU에 대해 이야기해 봅시다. 50% 더 빠릅니다. x86을 위한 것이 아닙니다. 에이전트를 위해 만들어졌습니다. 모든 사람을 NVIDIA 파티에 초대합니다. Vera Rubin은 이미 양산 중입니다.

5배 더 빠르게 작업이 완료됩니다. OpenShell은 샌드박스를 안전하게 유지합니다. 5단 케이크처럼 층층이 보호됩니다. 실수의 여지가 없습니다.

MaxQ는 전력 효율을 극대화합니다. 여러분을 위해 최적화되었습니다. 케이크를 가지면서도 먹을 수 있도록 말이죠. 40년 만의 PC 재창조. Windows가 실행되는 모든 곳에서 동작합니다. 컴퓨팅을 합성 데이터로 바꿉니다. 추론하고, 사람처럼 세상을 이해합니다. 그것이 로봇이 움직이는 방법을 배우는 방식입니다.

미래는 이미 도착했습니다. 다음에 무엇이 올지 직접 확인해 보십시오.

감사합니다.

해당 콘텐츠는 프리미엄 구독자 공개(유료) 콘텐츠로 무단 캡쳐 및 불법 공유시 법적 제재를 받을 수 있습니다.

해기사투자자

글로벌을 주도하는 산업들을 넓게 보고, 인사이트를 얻고자 하는 해기사투자자입니다.

#엔비디아

#AI

like
24
공유하기

원문 보기 ↗