gWorld-32B: 웹 코드 기반 모바일 월드 모델
개요
트릴리온랩스(Trillion Labs)가 개발한 **‘gWorld-32B’**는 세계 최초의 웹 코드(HTML/CSS) 기반 모바일 월드 모델입니다. 픽셀(Pixel) 단위 생성 방식의 한계(글자 뭉개짐, 환각, 속도 저하)를 극복하기 위해 GUI를 웹 코드로 생성하여 모바일 환경에서 높은 정확도와 효율성을 확보했습니다.
- 출처: 2026년 2월 언론 보도
- 핵심 패러다임: GUI 생성 방식을 ‘이미지(픽셀)‘에서 ‘웹 코드’로 전환하여 행동 예측의 정확도와 렌더링 성능을 극대화.
1. 기술적 특징
픽셀 vs 웹 코드 (GUI 생성 방식)
| 방식 | 픽셀(Pixel) 방식 | 웹 코드(HTML/CSS) 방식 (gWorld) |
|---|---|---|
| 구현 | 이미지를 직접 그림 | 웹 코드를 생성하여 렌더링 |
| 정확도 | 글자 뭉개짐/왜곡 빈번 | 텍스트 왜곡 없음, 정밀도 높음 |
| 환각 | 높음 | 낮음 (코드 기반 로직) |
| 연산 효율 | 낮음 (대용량 이미지) | 높음 (가벼운 코드) |
월드 모델(World Model)로서의 특성
- 단순히 텍스트를 생성하는 LLM과 달리, 논리적 학습 구조를 갖추어 시뮬레이션을 통해 최적의 행동을 예측하고 실행함.
- 인과관계 학습: 사용자의 클릭과 그에 따른 화면 변화라는 인과관계를 학습하여 모바일 앱 자동화에 최적화.
2. 벤치마크 성과
- MWMBench (모바일 월드 모델 벤치마크):
- 명령어 정확도(IAcc): 79.6점 (비교 모델 중 1위).
- 대규모 모델(Llama-4-402B, 55.7점) 대비 훨씬 적은 파라미터로 압도적 효율성 증명.
- 렌더링 신뢰성: 실패율 0.6% 미만으로 실제 앱 UI와 정밀하게 일치.
- KApps: 국내 모바일 앱 환경에 특화된 벤치마크에서 추가 학습 없이 제로샷(Zero-shot) 성능 입증.
3. 활용 분야 및 산업적 기대
- 앱 AI 에이전트: 사람처럼 앱을 사용하고 목적을 달성하는 에이전트 기반 자동화.
- 앱 자동 테스트: QA 과정의 자동화 및 GUI 변경에 따른 테스트 스크립트 유지보수 비용 절감.
- 고객응대 자동화: 앱 내부 기능을 AI가 직접 실행하여 고객 문제를 해결하는 차세대 CS.
- 로보틱스 및 공공 서비스: 디지털 환경을 넘어 실제 물리적/디지털 서비스 영역의 자동화 혁신.
4. 관련 항목
- AI 에이전트 프레임워크
- Large Language Models (LLMs)
- 한국 AI 기업
- Claude 스크린샷 루프 (3D 작업) (비교: 스크린샷 방식의 한계 극복)