gWorld-32B: 웹 코드 기반 모바일 월드 모델

개요

트릴리온랩스(Trillion Labs)가 개발한 **‘gWorld-32B’**는 세계 최초의 웹 코드(HTML/CSS) 기반 모바일 월드 모델입니다. 픽셀(Pixel) 단위 생성 방식의 한계(글자 뭉개짐, 환각, 속도 저하)를 극복하기 위해 GUI를 웹 코드로 생성하여 모바일 환경에서 높은 정확도와 효율성을 확보했습니다.

  • 출처: 2026년 2월 언론 보도
  • 핵심 패러다임: GUI 생성 방식을 ‘이미지(픽셀)‘에서 ‘웹 코드’로 전환하여 행동 예측의 정확도와 렌더링 성능을 극대화.

1. 기술적 특징

픽셀 vs 웹 코드 (GUI 생성 방식)

방식픽셀(Pixel) 방식웹 코드(HTML/CSS) 방식 (gWorld)
구현이미지를 직접 그림웹 코드를 생성하여 렌더링
정확도글자 뭉개짐/왜곡 빈번텍스트 왜곡 없음, 정밀도 높음
환각높음낮음 (코드 기반 로직)
연산 효율낮음 (대용량 이미지)높음 (가벼운 코드)

월드 모델(World Model)로서의 특성

  • 단순히 텍스트를 생성하는 LLM과 달리, 논리적 학습 구조를 갖추어 시뮬레이션을 통해 최적의 행동을 예측하고 실행함.
  • 인과관계 학습: 사용자의 클릭과 그에 따른 화면 변화라는 인과관계를 학습하여 모바일 앱 자동화에 최적화.

2. 벤치마크 성과

  • MWMBench (모바일 월드 모델 벤치마크):
    • 명령어 정확도(IAcc): 79.6점 (비교 모델 중 1위).
    • 대규모 모델(Llama-4-402B, 55.7점) 대비 훨씬 적은 파라미터로 압도적 효율성 증명.
  • 렌더링 신뢰성: 실패율 0.6% 미만으로 실제 앱 UI와 정밀하게 일치.
  • KApps: 국내 모바일 앱 환경에 특화된 벤치마크에서 추가 학습 없이 제로샷(Zero-shot) 성능 입증.

3. 활용 분야 및 산업적 기대

  • 앱 AI 에이전트: 사람처럼 앱을 사용하고 목적을 달성하는 에이전트 기반 자동화.
  • 앱 자동 테스트: QA 과정의 자동화 및 GUI 변경에 따른 테스트 스크립트 유지보수 비용 절감.
  • 고객응대 자동화: 앱 내부 기능을 AI가 직접 실행하여 고객 문제를 해결하는 차세대 CS.
  • 로보틱스 및 공공 서비스: 디지털 환경을 넘어 실제 물리적/디지털 서비스 영역의 자동화 혁신.

4. 관련 항목