Gemini

개요

Gemini는 Google DeepMind가 개발한 멀티모달 AI 모델 시리즈입니다. 텍스트, 이미지, 오디오, 비디오, 코드를 네이티브로 이해하고 생성할 수 있으며, 최대 200만 토큰의 컨텍스트 윈도우를 제공합니다. Google 검색, Workspace, Android 등 Google 생태계에 깊이 통합되어 있습니다.

개발: Google DeepMind
공식 사이트: https://gemini.google.com
API: https://ai.google.dev (Google AI Studio)

모델 라인업

모델	특징	컨텍스트
Gemini 2.5 Pro	최고 성능, 코딩·추론·멀티모달	1M 토큰
Gemini 2.5 Flash	빠른 속도, 비용 효율, 사고(Thinking) 모드	1M 토큰
Gemini 2.0 Flash	실시간 멀티모달, 에이전트 기능	1M 토큰
Gemini 1.5 Pro	2M 컨텍스트 최초 달성	2M 토큰
Gemini Nano	온디바이스 (Pixel, Galaxy 등)	제한적

핵심 특징

멀티모달 네이티브

텍스트, 이미지, 오디오, 비디오를 단일 모델에서 처리
최대 1시간 분량의 비디오 이해
이미지 생성 (Imagen 통합)

초대형 컨텍스트

최대 2M 토큰 (Gemini 1.5 Pro)
“Needle in a Haystack” 테스트에서 99.7% 검색 정확도
전체 코드베이스, 긴 문서 분석에 강점

Google 생태계 통합

Google 검색: Grounding으로 실시간 정보 접근
Workspace: Gmail, Docs, Sheets에서 AI 지원
Android: Gemini Nano로 온디바이스 AI

경쟁 모델 비교

항목	Gemini 2.5 Pro	Claude Opus 4	OpenAI o3
강점	멀티모달, 검색 연동	코딩, 안전성	추론, 생태계
컨텍스트	1M	200K	200K
멀티모달	네이티브	이미지 입력	이미지 입력
온디바이스	Nano	X	X

관련 항목