개요
AI Coding Agent는 코드 이해, 편집, 실행, 테스트를 자율적으로 수행하는 AI 도구입니다. 단순 코드 완성을 넘어 다단계 추론, 멀티파일 변경, Git 작업까지 처리합니다.
분류
터미널(CLI) 에이전트
→ AI CLI 참조
IDE 에이전트 (확장/내장)
| 에이전트 | 인터페이스 | 모델 | 오픈소스 | 특징 |
|---|
| GitHub Copilot | VS Code, JetBrains | GPT-4o, Claude, Gemini | X | Agent Mode, 이슈 자동 PR |
| Cursor | 전용 IDE (VS Code 포크) | 멀티 모델 | X | 네이티브 AI 통합 |
| Windsurf | 전용 IDE | 멀티 모델 | X | Cascade 에이전트 |
| Cline | VS Code 확장 | 멀티 모델 (API 직접) | O | 단계별 승인, 감사 추적 |
| Roo Code | VS Code 확장 (Cline 포크) | 멀티 모델 | O | 역할 기반 모드, 안정성 |
| Kilo Code | VS Code 확장 (Cline 포크) | 멀티 모델 | O | $8M 시드 투자 |
| Augment Code | VS Code, JetBrains | 자체 모델 | X | 대규모 코드베이스 특화 |
| Amazon Q Developer | VS Code, JetBrains, CLI | Amazon 모델 | X | AWS 생태계 통합 |
터미널 전용 도구
| 도구 | 특징 | 오픈소스 |
|---|
| Aider | Git 네이티브, 빠른 편집 | O |
| Warp AI | AI 내장 터미널 앱 | X |
CLI 에이전트 상세 비교
핵심 기능
| 기능 | Claude Code | Codex CLI | Gemini CLI | OpenCode | Copilot CLI |
|---|
| 파일 읽기/편집 | O | O | O | O | O |
| 쉘 실행 | O | O | O | O | O |
| 웹 검색/페치 | O | O | O (Google 그라운딩) | O | O |
| Git 작업 | O | O | O | O | O |
| 이미지 입력 | O | O | O | X | O |
| MCP 지원 | O | O | O | O | O |
| 멀티 에이전트 | O (Agent Teams) | O (병렬 worktree) | O (Agent Skills) | X | O (Explore/Task) |
| 세션 재개 | O | O | O | O | O |
| 자동 컴팩션 | O | O | X | O (95%) | O (95%) |
| 코드 리뷰 | O | O | X | X | O |
프로젝트 설정 파일
| 에이전트 | 설정 파일 | 용도 |
|---|
| Claude Code | CLAUDE.md | 프로젝트 지침, 빌드 명령 |
| Codex CLI | AGENTS.md | 에이전트 지침 |
| Gemini CLI | GEMINI.md | 커스텀 시스템 프롬프트 |
| OpenCode | .opencode.json | 모델, MCP, LSP 설정 |
| Copilot CLI | AGENTS.md, .github/copilot-instructions.md | 에이전트 지침 |
컨텍스트 윈도우
| 에이전트 | 컨텍스트 |
|---|
| Claude Code | 200K (기본), 1M (베타) |
| Codex CLI | 모델 의존 |
| Gemini CLI | 1M |
| OpenCode | 모델 의존 |
| Copilot CLI | 모델 의존 |
승인/안전 모드
| 에이전트 | 모드 |
|---|
| Claude Code | 권한 기반 (도구별 승인) |
| Codex CLI | autopilot / plan / interactive |
| Gemini CLI | trust 레벨 (기본 untrusted) |
| OpenCode | 사용자 승인 |
| Copilot CLI | 사용자 승인 |
용도별 추천
Cline 포크 관계
Cline (원본, 5M+ 설치)
├── Roo Code (안정성 우선 포크)
└── Kilo Code ($8M 시드, 기능 경쟁)
2026년 Q2까지 세 도구가 기능적으로 수렴할 전망.
코딩 특화 AI 모델
AI 코딩 에이전트의 핵심 엔진이 되는 코드 생성 특화 모델:
상용 모델
| 모델 | 개발사 | 특징 |
|---|
| Claude Sonnet/Opus | Anthropic | 코딩 벤치마크 최상위권, Claude Code 기반 |
| GPT-4o / o3 | OpenAI | Copilot/Codex 기반, 범용+코딩 |
| Gemini 2.5 Pro | Google | 1M 컨텍스트, 코드 추론 강점 |
오픈소스/오픈웨이트 모델
| 모델 | 개발사 | 파라미터 | 벤치마크 | 특징 |
|---|
| Codestral | Mistral | 22B | HumanEval 81.1% | Fill-in-the-Middle(FIM) 특화, 80+ 언어 |
| Codestral Mamba | Mistral | 7B | - | Mamba 아키텍처, 무한 컨텍스트 이론상 |
| Qwen2.5-Coder | Alibaba | 7B/32B | HumanEval 91% | GPT-4o(90.2%) 능가, 오픈소스 최강 |
| DeepSeek-Coder-V2 | DeepSeek | 236B (16B활성) | - | MoE, 효율적 대규모 코딩 |
| StarCoder2 | BigCode | 3B/7B/15B | - | 600+ 언어, The Stack v2 학습 |
| CodeLlama | Meta | 7B/13B/34B/70B | HumanEval 67.1% | Llama 2 기반 코드 특화 |
| Phi-4 | Microsoft | 14B | - | 소형 고성능, 추론 강점 |
| Granite Code | IBM | 3B~34B | - | 엔터프라이즈 코딩, Apache 2.0 |
| Stable Code | Stability AI | 3B | - | 자동완성 특화, 경량 |
Codestral 상세
| 항목 | 내용 |
|---|
| 개발 | Mistral AI |
| 파라미터 | 22B |
| 학습 데이터 | 80+ 프로그래밍 언어 |
| 라이선스 | Mistral AI Non-Production License (연구/테스트용) |
| API | codestral.mistral.ai, La Plateforme |
벤치마크 (vs CodeLlama 70B):
| 벤치마크 | Codestral 22B | CodeLlama 70B |
|---|
| Python HumanEval | 81.1% | 67.1% |
| SQL Spider | 63.5% | 37.0% |
| 평균 HumanEval (다국어) | 61.5% | 51.9% |
핵심 기능:
- Fill-in-the-Middle (FIM): 코드 중간 삽입, 자동완성에 최적
- 80+ 언어: Python, Java, C++, JS, Swift, Fortran 등
- IDE 통합: VS Code (Continue.dev), JetBrains, Tabnine
- LangChain, LlamaIndex 연동
코딩 모델 선택 가이드
| 상황 | 추천 |
|---|
| 최고 품질 (비용 무관) | Claude Opus / GPT-4o |
| 오픈소스 최강 | Qwen2.5-Coder 32B |
| 코드 자동완성/FIM | Codestral |
| 경량/엣지 | Phi-4, StarCoder2 3B |
| 엔터프라이즈 | Granite Code (Apache 2.0) |
| 무제한 컨텍스트 | Codestral Mamba |
2025~2026 트렌드
- 멀티 에이전트: 병렬 에이전트가 작업을 분할 처리 (Agent Teams, worktree 병렬화)
- MCP 표준화: 모든 주요 에이전트가 MCP 지원
- AGENTS.md / CLAUDE.md: 프로젝트별 에이전트 지침 파일 표준화
- 모델 선택의 자유: OpenCode, Cline 등 모델 비종속 도구 증가
- 승인 모드 세분화: autopilot ↔ 완전 수동 간 유연한 제어
- IDE ↔ CLI 통합: 동일 백엔드를 IDE와 터미널에서 공유 (Gemini Code Assist ↔ Gemini CLI)
관련 항목