gWorld-32B: 웹 코드 기반 모바일 월드 모델

개요

트릴리온랩스(Trillion Labs)가 개발한 **‘gWorld-32B’**는 세계 최초의 웹 코드(HTML/CSS) 기반 모바일 월드 모델입니다. 픽셀(Pixel) 단위 생성 방식의 한계(글자 뭉개짐, 환각, 속도 저하)를 극복하기 위해 GUI를 웹 코드로 생성하여 모바일 환경에서 높은 정확도와 효율성을 확보했습니다.

출처: 2026년 2월 언론 보도
핵심 패러다임: GUI 생성 방식을 ‘이미지(픽셀)‘에서 ‘웹 코드’로 전환하여 행동 예측의 정확도와 렌더링 성능을 극대화.

1. 기술적 특징

픽셀 vs 웹 코드 (GUI 생성 방식)

방식	픽셀(Pixel) 방식	웹 코드(HTML/CSS) 방식 (gWorld)
구현	이미지를 직접 그림	웹 코드를 생성하여 렌더링
정확도	글자 뭉개짐/왜곡 빈번	텍스트 왜곡 없음, 정밀도 높음
환각	높음	낮음 (코드 기반 로직)
연산 효율	낮음 (대용량 이미지)	높음 (가벼운 코드)

월드 모델(World Model)로서의 특성

단순히 텍스트를 생성하는 LLM과 달리, 논리적 학습 구조를 갖추어 시뮬레이션을 통해 최적의 행동을 예측하고 실행함.
인과관계 학습: 사용자의 클릭과 그에 따른 화면 변화라는 인과관계를 학습하여 모바일 앱 자동화에 최적화.

2. 벤치마크 성과

MWMBench (모바일 월드 모델 벤치마크):
- 명령어 정확도(IAcc): 79.6점 (비교 모델 중 1위).
- 대규모 모델(Llama-4-402B, 55.7점) 대비 훨씬 적은 파라미터로 압도적 효율성 증명.
렌더링 신뢰성: 실패율 0.6% 미만으로 실제 앱 UI와 정밀하게 일치.
KApps: 국내 모바일 앱 환경에 특화된 벤치마크에서 추가 학습 없이 제로샷(Zero-shot) 성능 입증.

3. 활용 분야 및 산업적 기대

앱 AI 에이전트: 사람처럼 앱을 사용하고 목적을 달성하는 에이전트 기반 자동화.
앱 자동 테스트: QA 과정의 자동화 및 GUI 변경에 따른 테스트 스크립트 유지보수 비용 절감.
고객응대 자동화: 앱 내부 기능을 AI가 직접 실행하여 고객 문제를 해결하는 차세대 CS.
로보틱스 및 공공 서비스: 디지털 환경을 넘어 실제 물리적/디지털 서비스 영역의 자동화 혁신.

4. 관련 항목

AI 에이전트 프레임워크
Large Language Models (LLMs)
한국 AI 기업
Claude 스크린샷 루프 (3D 작업) (비교: 스크린샷 방식의 한계 극복)