개요

**크래프톤(KRAFTON)**이 AI 모델 브랜드 **‘라온(Raon)‘**을 론칭하고, 음성 LLM·실시간 음성 대화·TTS·비전 인코더를 Hugging Face에 오픈소스로 공개 (2026-04-02). ‘라온’은 “즐거움” 뜻의 순우리말. 데이터 수집부터 모델 학습·성능 평가까지 파운데이션 모델 전 과정을 자체 수행하는 기술 역량을 입증. 특히 Raon-Speech 9B가 10B 이하 공개 음성 LLM 중 영어+한국어 모두 글로벌 1위.

  • 개발: 크래프톤 AI (대표 김창한, CAIO 이강욱)
  • 공개 플랫폼: Hugging Face
  • 라이선스: 오픈소스
  • 출처: AI타임스 (2026-04-02)
  • 이름 유래: ‘라온(즐거움)’ + KRAFTON 일부 철자

공개 모델 4종

1. Raon-Speech ⭐ (음성 언어 모델)

항목
파라미터9B
기능음성 이해 + 생성 (STT, TTS, 음성 QA)
성능10B 이하 공개 음성 LLM 중 영어+한국어 글로벌 1위
평가7개 핵심 태스크 + 40개 벤치마크 종합
텍스트 중심 LLM을 확장:
  → 음성 이해 (STT)
  → 음성 생성 (TTS)
  → 음성 기반 Q&A
  → 7개 태스크 × 40개 벤치마크

2. Raon-SpeechChat (실시간 양방향 음성 대화)

항목
기능Full-duplex 실시간 양방향 통신
특징대화 중 자유롭게 끼어들기 가능
평가벤치마크 3종, 13개 태스크 평균 글로벌 최상위
위상국내 최초 발표 실시간 양방향 음성 모델
Full-duplex:
  사용자와 모델이 동시에 말 가능
  끼어들기 가능
  맞장구 처리
  → 진짜 대화 같은 경험

3. Raon-OpenTTS (텍스트→음성 변환)

항목
학습 데이터공개 음성 데이터만 사용
특이점전체 학습 데이터도 공개 (재현 가능)
성능블라인드 평가에서 비공개 데이터 TTS와 비교 최상위
차별점:
  - 기존 TTS: 비공개 데이터 활용 → 재현 불가
  - Raon TTS: 공개 데이터 Only + 데이터도 공개 → 완전 재현 가능

  → 오픈소스 정신의 정수

4. Raon-VisionEncoder (비전 인코더)

항목
기능이미지 → AI 이해 가능 정보 변환
학습사전 학습 모델 미사용, 공개 데이터로 처음부터 자체 학습
성능일부 태스크에서 Google SigLIP2 능가
활용언어 모델과 결합 → 시각 정보 처리
Google SigLIP2 대비:
  - 일부 태스크: 능가 ⭐
  - 기타 태스크: 90% 이상 성능
  → 자체 학습 비전 인코더로 경쟁력

한 표로 보는 모델 요약

모델분야핵심위상
Raon-Speech음성 LLM9B, STT+TTS+QA10B 이하 글로벌 1위
Raon-SpeechChat실시간 음성Full-duplex국내 최초
Raon-OpenTTSTTS공개 데이터 Only재현 가능
Raon-VisionEncoder비전자체 학습SigLIP2 일부 능가

크래프톤의 AI 전략

1. 게임 → AI 확장
   - "AI로 게임의 본질적 즐거움 창출"
   - PUBG·배틀그라운드 NPC 지능화
   - 음성·비전·멀티모달 통합

2. 오픈소스 기여
   - 모델 공개
   - 학습 데이터 공개 (Raon-OpenTTS)
   - 국내 AI 생태계 성장 기여

3. 독자 AI 파운데이션 모델
   - SK텔레콤 컨소시엄 참여
   - 비전 인코더 활용 예정

4. 글로벌 경쟁력
   - Hugging Face 글로벌 공개
   - 글로벌 1위 벤치마크 확보
   - "Raon" 브랜드로 통합

왜 의미 있는가?

1. 게임사가 AI 파운데이션 모델을 만든다

기존:
  게임사 = 게임 엔진·콘텐츠 제작

크래프톤:
  게임사 → AI 파운데이션 모델 자체 개발
  데이터 수집 → 학습 → 평가 → 공개 → 전 과정 자체 수행

2. Full-duplex 음성 = 게임 NPC의 미래

상상:
  PUBG에서 NPC 동료와 실시간 대화
  ↓ Raon-SpeechChat
  맞장구, 끼어들기, 자연스러운 반응
  ↓
  게임 세계의 살아있는 캐릭터

3. 한국어 음성 AI의 부족

글로벌 음성 LLM:
  - 대부분 영어 중심
  - 한국어 성능 약함

Raon-Speech:
  - 영어 + 한국어 모두 1위
  - 한국어 음성 AI 사실상 표준 가능성

유사 프로젝트 비교

프로젝트개발사분야한국어
Raon-Speech크래프톤음성 LLM 9B✅ 1위
WhisperOpenAI음성 인식 (STT)O
GPT-4o AudioOpenAI멀티모달 음성O (영어 우선)
Gemini AudioGoogle멀티모달O
DeepgramDeepgramSTT·TTSO
SileroSileroTTS (오픈소스)
F5-TTS-TTS (오픈소스)O

10B 이하 오픈소스 + 한국어+영어 모두 1위 = Raon의 유니크 포지션


활용 시나리오 (게임 외)

시나리오모델
게임 NPC 대화SpeechChat (Full-duplex)
콜센터 AISpeechChat + Speech
오디오북 생성OpenTTS
실시간 통역Speech (9B, 영+한)
교육 튜터SpeechChat
문서 AIVisionEncoder + LLM
접근성 (시각장애)VisionEncoder + Speech

다른 노트와의 연결

노트연결
한국 AI 기업크래프톤 AI 전략
음성 AI (Speech AI)음성 LLM 비교
Deepgram경쟁 STT/TTS
Silero경쟁 TTS
VLM Model Comparison비전 인코더 비교
Large Language Models (LLMs)파운데이션 모델
OmniCoder-9B같은 9B급 도메인 특화
Open Source LLM오픈소스 전략
게임게임+AI 융합

관련 항목