개요
Gemini 는 Google DeepMind가 개발한 멀티모달 AI 모델 시리즈입니다. 텍스트, 이미지, 오디오, 비디오, 코드를 네이티브로 이해하고 생성할 수 있으며, 최대 200만 토큰의 컨텍스트 윈도우를 제공합니다. Google 검색, Workspace, Android 등 Google 생태계에 깊이 통합되어 있습니다.
모델 라인업
모델 특징 컨텍스트 Gemini 2.5 Pro 최고 성능, 코딩·추론·멀티모달 1M 토큰 Gemini 2.5 Flash 빠른 속도, 비용 효율, 사고(Thinking) 모드 1M 토큰 Gemini 2.0 Flash 실시간 멀티모달, 에이전트 기능 1M 토큰 Gemini 1.5 Pro 2M 컨텍스트 최초 달성 2M 토큰 Gemini Nano 온디바이스 (Pixel, Galaxy 등) 제한적
핵심 특징
멀티모달 네이티브
텍스트, 이미지, 오디오, 비디오를 단일 모델 에서 처리
최대 1시간 분량의 비디오 이해
이미지 생성 (Imagen 통합)
초대형 컨텍스트
최대 2M 토큰 (Gemini 1.5 Pro)
“Needle in a Haystack” 테스트에서 99.7% 검색 정확도
전체 코드베이스, 긴 문서 분석에 강점
Google 생태계 통합
Google 검색 : Grounding으로 실시간 정보 접근
Workspace : Gmail, Docs, Sheets에서 AI 지원
Android : Gemini Nano로 온디바이스 AI
경쟁 모델 비교
항목 Gemini 2.5 Pro Claude Opus 4OpenAI o3강점 멀티모달, 검색 연동 코딩, 안전성 추론, 생태계 컨텍스트 1M 200K 200K 멀티모달 네이티브 이미지 입력 이미지 입력 온디바이스 Nano X X
관련 항목