NVIDIA GTC 2026: Vera Rubin & Grok3 LPU 상세 분석

개요

2026년 3월 16일(현지시간) GTC 기조연설에서 발표된 엔비디아의 새로운 전략은 **“훈련(Training)에서 추론(Inference)으로의 중심 이동”**과 **“에이전트형 AI(Agentic AI) 시대의 개막”**으로 요약됩니다.

1. 새로운 추론 아키텍처: 2단계 분리 구조

엔비디아는 추론 성능 극대화를 위해 작업을 두 단계로 나누는 혁신적인 구조를 제시했습니다.

단계	역할	담당 하드웨어	특징
프리필 (Prefill)	요청 이해 및 토큰 변환	Vera Rubin GPU	대규모 병렬 처리 필요
디코드 (Decode)	실제 답변(텍스트) 생성	Grok3 LPU	저지연(Low Latency) 특화

2. 주요 하드웨어 상세

Grok3 LPU (Language Processing Unit)

기술 기반: 2025년 라이선스 계약을 체결한 스타트업 **그로크(Groq)**의 기술력 기반.
제조: 삼성전자 생산 (TSMC 아님).
특징: HBM(고대역폭 메모리)이 필요 없는 설계. 온칩 SRAM 등을 활용해 전력 소모와 비용을 획기적으로 낮춤.
성능: LLM 응답 속도 최적화, 블랙웰 대비 토큰당 비용 1/10로 절감.

베라(Vera) CPU

설계: 88개의 올림푸스(Olympus) 코어 기반.
범위: 데이터센터부터 PC, 노트북용까지 통합 설계.
전략: GPU 보조 역할을 넘어 인텔, AMD와 직접 경쟁하는 독립 사업으로 육성.

베라 루빈(Vera Rubin) 플랫폼 (NVL72)

구성: 72개 루빈 GPU + 36개 베라 CPU.
효율: 기존 블랙웰 시스템 대비 추론 처리량 최대 10배 향상.
훈련 성능: 전문가 혼합(MoE) 모델 훈련 시 기존 대비 1/4의 GPU만으로 수행 가능.

3. 에이전트형 AI(Agentic AI) 소프트웨어 스택

단순 챗봇을 넘어 자율적으로 도구를 호출하고 학습하는 ‘에이전트’ 구축을 위한 도구 공개.

에이전트 툴킷(Agent Toolkit)
오픈쉘(OpenShell)
네모클로(NemoClaw)
다이나모(Dynamo) 1.0

4. 향후 로드맵

엔비디아는 매년 새로운 아키텍처를 출시하는 공격적인 로드맵을 확정했습니다.

2027년: 루빈 울트라(Rubin Ultra) - 대형 랙 시스템.
2028년: 파인만(Feynman) 아키텍처 출시 예정.

시장 전망

매출 기회: 2027년까지 최소 1조 달러 (약 1,300조 원) 규모의 매출 기회 전망.
파트너: OpenAI, Anthropic, Meta, Mistral 및 주요 클라우드 4사(AWS, Google, MS, Oracle).

관련 항목