개요

Claude Code는 대화 컨텍스트가 쌓일수록 토큰 소비가 급증합니다. 2026년 3월 Anthropic이 공식으로 “사용자들이 예상보다 훨씬 빠르게 사용 한도에 도달하고 있다”고 인정할 만큼 토큰 소비 문제가 이슈입니다. 다양한 절약 전략과 도구를 정리합니다.


claude-token-efficient

가장 단순한 접근법: CLAUDE.md 파일 하나로 Claude의 응답 장황함을 억제하는 오픈소스 프로젝트.

# 프로젝트 루트에 복사
curl -o CLAUDE.md https://raw.githubusercontent.com/drona23/claude-token-efficient/main/CLAUDE.md

벤치마크 결과

작업 유형토큰 절감률
코드 리뷰75%
async/await 설명64%
REST API 설명50%
평균63%

5개 프롬프트 기준 465단어 → 170단어로 축소

프로필별 CLAUDE.md

파일용도
CLAUDE.md범용
CLAUDE.coding.md개발 프로젝트
CLAUDE.agents.md자동화 파이프라인, 에이전트 루프
CLAUDE.analysis.md데이터 분석

동작 원리

Claude가 기본적으로 하는 장황한 패턴을 제거:

  • “Sure!”, “Absolutely!” 같은 도입부 인사
  • “도움이 되길 바랍니다” 같은 마무리 문구
  • 요청하지 않은 추가 제안
  • 과도한 엔지니어링 설명

주의: CLAUDE.md 자체가 입력 토큰을 소비하므로, 짧은 단발성 작업에는 오히려 손해. 반복적인 대형 작업에 효과적.


.claudeignore

.gitignore와 동일한 문법으로 Claude가 읽지 말아야 할 파일/폴더 지정:

# .claudeignore 예시
node_modules/
.git/
dist/
build/
*.lock
*.log
__pycache__/
.venv/
*.pyc
coverage/
.next/

→ Claude가 불필요한 파일을 읽느라 소비하는 토큰 차단


CLAUDE.md 최적화

프로젝트 구조를 CLAUDE.md에 미리 정리해두면, 매 세션마다 Claude가 파일을 탐색하며 낭비하는 토큰 절감:

# 프로젝트 구조
- src/api/ : Express 라우터
- src/services/ : 비즈니스 로직
- src/models/ : DB 스키마 (Prisma)
- tests/ : Jest 테스트
 
# 주요 명령어
- 개발 서버: bun dev
- 테스트: bun test
- 빌드: bun build

컨텍스트 관리 전략

/clear 활용

  • 작업 단위가 바뀔 때 /clear로 컨텍스트 리셋
  • 이전 대화가 새 작업과 무관하면 토큰 낭비

compact 모드

  • 긴 대화에서 /compact로 컨텍스트 압축
  • Claude가 대화를 요약해 토큰 줄임

구체적인 명령

# 나쁜 예 - 전체 파일 읽힘
"프로젝트 전체 분석해줘"
 
# 좋은 예 - 필요한 것만
"src/auth/login.ts 의 validateToken 함수만 보고 버그 찾아줘"

모델 선택

  • 간단한 작업 → claude-haiku (저렴, 빠름)
  • 복잡한 작업 → claude-sonnet or claude-opus
  • Claude Code 설정에서 모델 지정 가능

토큰 소비 주요 원인

원인해결
node_modules 읽기.claudeignore에 추가
불필요한 긴 답변CLAUDE.md로 간결함 지시
반복적인 프로젝트 탐색CLAUDE.md에 구조 명시
오래된 컨텍스트 누적/clear 주기적 사용
lock 파일 읽기.claudeignore*.lock 추가
대형 자동 생성 파일.claudeignore에 추가
프롬프트 캐시 버그Claude Code 최신 버전 유지

관련 항목