NVIDIA GTC 2026: Vera Rubin & Grok3 LPU 상세 분석

개요

2026년 3월 16일(현지시간) GTC 기조연설에서 발표된 엔비디아의 새로운 전략은 **“훈련(Training)에서 추론(Inference)으로의 중심 이동”**과 **“에이전트형 AI(Agentic AI) 시대의 개막”**으로 요약됩니다.

1. 새로운 추론 아키텍처: 2단계 분리 구조

엔비디아는 추론 성능 극대화를 위해 작업을 두 단계로 나누는 혁신적인 구조를 제시했습니다.

단계역할담당 하드웨어특징
프리필 (Prefill)요청 이해 및 토큰 변환Vera Rubin GPU대규모 병렬 처리 필요
디코드 (Decode)실제 답변(텍스트) 생성Grok3 LPU저지연(Low Latency) 특화

2. 주요 하드웨어 상세

Grok3 LPU (Language Processing Unit)

  • 기술 기반: 2025년 라이선스 계약을 체결한 스타트업 **그로크(Groq)**의 기술력 기반.
  • 제조: 삼성전자 생산 (TSMC 아님).
  • 특징: HBM(고대역폭 메모리)이 필요 없는 설계. 온칩 SRAM 등을 활용해 전력 소모와 비용을 획기적으로 낮춤.
  • 성능: LLM 응답 속도 최적화, 블랙웰 대비 토큰당 비용 1/10로 절감.

베라(Vera) CPU

  • 설계: 88개의 올림푸스(Olympus) 코어 기반.
  • 범위: 데이터센터부터 PC, 노트북용까지 통합 설계.
  • 전략: GPU 보조 역할을 넘어 인텔, AMD와 직접 경쟁하는 독립 사업으로 육성.

베라 루빈(Vera Rubin) 플랫폼 (NVL72)

  • 구성: 72개 루빈 GPU + 36개 베라 CPU.
  • 효율: 기존 블랙웰 시스템 대비 추론 처리량 최대 10배 향상.
  • 훈련 성능: 전문가 혼합(MoE) 모델 훈련 시 기존 대비 1/4의 GPU만으로 수행 가능.

3. 에이전트형 AI(Agentic AI) 소프트웨어 스택

단순 챗봇을 넘어 자율적으로 도구를 호출하고 학습하는 ‘에이전트’ 구축을 위한 도구 공개.

  • 에이전트 툴킷(Agent Toolkit)
  • 오픈쉘(OpenShell)
  • 네모클로(NemoClaw)
  • 다이나모(Dynamo) 1.0

4. 향후 로드맵

엔비디아는 매년 새로운 아키텍처를 출시하는 공격적인 로드맵을 확정했습니다.

  • 2027년: 루빈 울트라(Rubin Ultra) - 대형 랙 시스템.
  • 2028년: 파인만(Feynman) 아키텍처 출시 예정.

시장 전망

  • 매출 기회: 2027년까지 최소 1조 달러 (약 1,300조 원) 규모의 매출 기회 전망.
  • 파트너: OpenAI, Anthropic, Meta, Mistral 및 주요 클라우드 4사(AWS, Google, MS, Oracle).

관련 항목