개요

GeminiGoogle DeepMind가 개발한 멀티모달 AI 모델 시리즈입니다. 텍스트, 이미지, 오디오, 비디오, 코드를 네이티브로 이해하고 생성할 수 있으며, 최대 200만 토큰의 컨텍스트 윈도우를 제공합니다. Google 검색, Workspace, Android 등 Google 생태계에 깊이 통합되어 있습니다.


모델 라인업

모델특징컨텍스트
Gemini 2.5 Pro최고 성능, 코딩·추론·멀티모달1M 토큰
Gemini 2.5 Flash빠른 속도, 비용 효율, 사고(Thinking) 모드1M 토큰
Gemini 2.0 Flash실시간 멀티모달, 에이전트 기능1M 토큰
Gemini 1.5 Pro2M 컨텍스트 최초 달성2M 토큰
Gemini Nano온디바이스 (Pixel, Galaxy 등)제한적

핵심 특징

멀티모달 네이티브

  • 텍스트, 이미지, 오디오, 비디오를 단일 모델에서 처리
  • 최대 1시간 분량의 비디오 이해
  • 이미지 생성 (Imagen 통합)

초대형 컨텍스트

  • 최대 2M 토큰 (Gemini 1.5 Pro)
  • “Needle in a Haystack” 테스트에서 99.7% 검색 정확도
  • 전체 코드베이스, 긴 문서 분석에 강점

Google 생태계 통합

  • Google 검색: Grounding으로 실시간 정보 접근
  • Workspace: Gmail, Docs, Sheets에서 AI 지원
  • Android: Gemini Nano로 온디바이스 AI

경쟁 모델 비교

항목Gemini 2.5 ProClaude Opus 4OpenAI o3
강점멀티모달, 검색 연동코딩, 안전성추론, 생태계
컨텍스트1M200K200K
멀티모달네이티브이미지 입력이미지 입력
온디바이스NanoXX

관련 항목