**크래프톤(KRAFTON)**이 AI 모델 브랜드 **‘라온(Raon)‘**을 론칭하고, 음성 LLM·실시간 음성 대화·TTS·비전 인코더를 Hugging Face에 오픈소스로 공개 (2026-04-02). ‘라온’은 “즐거움” 뜻의 순우리말. 데이터 수집부터 모델 학습·성능 평가까지 파운데이션 모델 전 과정을 자체 수행하는 기술 역량을 입증. 특히 Raon-Speech 9B가 10B 이하 공개 음성 LLM 중 영어+한국어 모두 글로벌 1위.
개발: 크래프톤 AI (대표 김창한, CAIO 이강욱)
공개 플랫폼: Hugging Face
라이선스: 오픈소스
출처: AI타임스 (2026-04-02)
이름 유래: ‘라온(즐거움)’ + KRAFTON 일부 철자
공개 모델 4종
1. Raon-Speech ⭐ (음성 언어 모델)
항목
값
파라미터
9B
기능
음성 이해 + 생성 (STT, TTS, 음성 QA)
성능
10B 이하 공개 음성 LLM 중 영어+한국어 글로벌 1위
평가
7개 핵심 태스크 + 40개 벤치마크 종합
텍스트 중심 LLM을 확장:
→ 음성 이해 (STT)
→ 음성 생성 (TTS)
→ 음성 기반 Q&A
→ 7개 태스크 × 40개 벤치마크
2. Raon-SpeechChat (실시간 양방향 음성 대화)
항목
값
기능
Full-duplex 실시간 양방향 통신
특징
대화 중 자유롭게 끼어들기 가능
평가
벤치마크 3종, 13개 태스크 평균 글로벌 최상위
위상
국내 최초 발표 실시간 양방향 음성 모델
Full-duplex:
사용자와 모델이 동시에 말 가능
끼어들기 가능
맞장구 처리
→ 진짜 대화 같은 경험
3. Raon-OpenTTS (텍스트→음성 변환)
항목
값
학습 데이터
공개 음성 데이터만 사용
특이점
전체 학습 데이터도 공개 (재현 가능)
성능
블라인드 평가에서 비공개 데이터 TTS와 비교 최상위
차별점:
- 기존 TTS: 비공개 데이터 활용 → 재현 불가
- Raon TTS: 공개 데이터 Only + 데이터도 공개 → 완전 재현 가능
→ 오픈소스 정신의 정수
4. Raon-VisionEncoder (비전 인코더)
항목
값
기능
이미지 → AI 이해 가능 정보 변환
학습
사전 학습 모델 미사용, 공개 데이터로 처음부터 자체 학습
성능
일부 태스크에서 Google SigLIP2 능가
활용
언어 모델과 결합 → 시각 정보 처리
Google SigLIP2 대비:
- 일부 태스크: 능가 ⭐
- 기타 태스크: 90% 이상 성능
→ 자체 학습 비전 인코더로 경쟁력
한 표로 보는 모델 요약
모델
분야
핵심
위상
Raon-Speech
음성 LLM
9B, STT+TTS+QA
10B 이하 글로벌 1위
Raon-SpeechChat
실시간 음성
Full-duplex
국내 최초
Raon-OpenTTS
TTS
공개 데이터 Only
재현 가능
Raon-VisionEncoder
비전
자체 학습
SigLIP2 일부 능가
크래프톤의 AI 전략
1. 게임 → AI 확장
- "AI로 게임의 본질적 즐거움 창출"
- PUBG·배틀그라운드 NPC 지능화
- 음성·비전·멀티모달 통합
2. 오픈소스 기여
- 모델 공개
- 학습 데이터 공개 (Raon-OpenTTS)
- 국내 AI 생태계 성장 기여
3. 독자 AI 파운데이션 모델
- SK텔레콤 컨소시엄 참여
- 비전 인코더 활용 예정
4. 글로벌 경쟁력
- Hugging Face 글로벌 공개
- 글로벌 1위 벤치마크 확보
- "Raon" 브랜드로 통합
왜 의미 있는가?
1. 게임사가 AI 파운데이션 모델을 만든다
기존:
게임사 = 게임 엔진·콘텐츠 제작
크래프톤:
게임사 → AI 파운데이션 모델 자체 개발
데이터 수집 → 학습 → 평가 → 공개 → 전 과정 자체 수행
2. Full-duplex 음성 = 게임 NPC의 미래
상상:
PUBG에서 NPC 동료와 실시간 대화
↓ Raon-SpeechChat
맞장구, 끼어들기, 자연스러운 반응
↓
게임 세계의 살아있는 캐릭터
3. 한국어 음성 AI의 부족
글로벌 음성 LLM:
- 대부분 영어 중심
- 한국어 성능 약함
Raon-Speech:
- 영어 + 한국어 모두 1위
- 한국어 음성 AI 사실상 표준 가능성