개요
macOS Tahoe (26)부터 모든 Apple Silicon 맥에 약 30억 파라미터 LLM이 기본 탑재됐지만 Apple은 Siri와 Writing Tools 뒤에만 노출. apfel 오픈소스 프로젝트가 이 빈틈을 파고들어 brew install 한 줄로 CLI + OpenAI 호환 서버 + 대화형 챗으로 사용 가능하게 함. 무료, 오프라인, 프라이빗 AI를 누구나 활용 가능.
- GitHub: https://github.com/Arthur-Ficial/apfel (이틀 만에 500+ stars)
- 개발: Arthur Ficial (개인)
- 언어: Swift 6.3
- 라이선스: MIT
- 출처 영감: 2026-04 Show HN
Apple FoundationModels 프레임워크
Apple이 macOS 26과 함께 공개한 Swift API
Swift API: SystemLanguageModel
↓
온디바이스 언어 모델 접근
↓
실행: Neural Engine + GPU (Metal)
- 네트워크 호출 ❌
- API 키 ❌
- OS에 모델 포함
모델 스펙
| 항목 | 값 |
|---|---|
| 파라미터 | 약 30억 |
| 양자화 | Mixed 2/4-bit (~3.5 bpw) |
| 컨텍스트 | 4,096 토큰 (입출력 합산) |
| 언어 (9개) | 영, 독, 스, 프, 이, 일, 한, 포, 중 |
| 위치 | OS 내장 (별도 다운로드 ❌) |
| 비용 | $0 |
Apple의 한계: 직접 노출 안 함
Apple FoundationModels의 활용처:
✓ Siri
✓ Writing Tools (맞춤법·요약)
✗ 일반 사용자 직접 접근 ❌
✗ 터미널 호출 ❌
✗ HTTP 엔드포인트 ❌
개발자 사용:
Xcode 프로젝트 + Swift 코드 작성 필수
→ “30억 모델이 내 맥에 있는데 못 쓴다”
apfel이 뚫은 빈틈
설치
brew install Arthur-Ficial/tap/apfel3가지 인터페이스
1. UNIX CLI 도구
# 직접 호출
apfel "이 텍스트 번역해줘: Hello"
# stdin 입력
echo "Hello" | apfel "번역해줘"
# JSON 출력
apfel "..." -o json
# 파일 첨부
apfel "요약해줘" -f document.txt
# 파이프 조합 (UNIX 철학)
ls *.log | apfel "오늘 수정된 것만 골라줘" | xargs cat | apfel "에러 패턴 찾아줘"→ LLM을 UNIX 철학에 맞게 “하나의 일을 잘 하는 도구”로
2. OpenAI 호환 HTTP 서버
apfel --serve
# localhost:11434/v1/chat/completions 엔드포인트 활성화지원 기능:
- ✅ 스트리밍 (SSE)
- ✅ 도구 호출 (function calling)
- ✅
response_format: json_object - ✅ CORS
# 기존 OpenAI SDK 코드 그대로
from openai import OpenAI
client = OpenAI(
base_url="http://localhost:11434/v1",
api_key="anything"
)
response = client.chat.completions.create(
model="apfel",
messages=[{"role": "user", "content": "Hello"}]
)→ Apple Transcript.ToolDefinition ↔ OpenAI 도구 스키마 자동 변환
3. 대화형 챗
apfel --chat
# 멀티턴 대화 + 5가지 트리밍 전략
# (4,096 토큰 작은 윈도우 관리)4,096 토큰의 현실적 활용
한계
4,096 토큰:
vs GPT-4o (128K) : 31배 작음
vs Claude (200K) : 49배 작음
→ 복잡한 코드 리뷰 ❌
→ 긴 문서 요약 ❌
적합한 작업
| 작업 | 적합성 |
|---|---|
| 셸 명령어 생성 | ✅ “오늘 수정된 .log 파일 찾아줘” |
| 짧은 번역 | ✅ |
| 문법 교정 | ✅ |
| 코드 스니펫 설명 | ✅ |
| 커밋 메시지 요약 | ✅ |
| 텍스트 분류 | ✅ |
| 단일 턴 작업 | ✅ |
apfel demo/ 폴더의 도구 예시
| 도구 | 기능 |
|---|---|
cmd | 자연어 → 셸 명령 |
oneliner | 파이프 체인 생성 |
explain | 명령어 설명 |
gitsum | 커밋 요약 |
실전 벤치마크 (HN 사용자 사례)
시나리오:
데이터 분석 + 가격·비용 예측 백테스팅
결과 (10개 케이스):
- Apple 모델 (3B): 6개에서 최고 정확도 ⭐
- Claude Sonnet: 월 수천 달러 비용
- DeepSeek: 월 수백 달러
- Apple: $0
- Ollama (다른 로컬 모델): 너무 느리거나 정확도 부족
환경: 64GB M4 Max Studio
⚠️ 단일 사례 — 일반화 어렵지만 특정 도메인에서 소형 온디바이스 경쟁력 입증
핵심 가치: 프라이버시
모든 토큰이 내 기기에서 생성
↓
절대 외부로 나가지 않음
↓
민감 컨텍스트 안전
사용 시나리오:
- 의료 기록 처리
- 법률 문서 분석
- 사내 코드 리뷰
- 개인 일기 정리
- 회계·재무 분석
→ “완전 프라이빗 Grammarly 대안” 같은 아이디어 가능
⚠️ 보안 경고
localhost HTTP 서버 운영 시 위험:
1. 시스템의 모든 앱이 접근 가능
- 브라우저 포함
2. 웹페이지 JavaScript 공격 가능
- 해당 포트로 요청 전송
- Same-origin 정책이 응답 읽기는 막아도
- 명령 실행 자체는 막지 못함
3. CORS 열어두면 데이터 유출 가능
대응:
- 외부 노출 ❌
- 방화벽 규칙 확인
- CORS 신중히 설정
- 신뢰할 수 있는 클라이언트만 연결
Apple 모델 vs 오픈소스 모델 (구조적 차이)
| 항목 | Apple FoundationModels | Ollama 오픈소스 |
|---|---|---|
| 설치 | OS에 내장 (별도 ❌) | Ollama + 모델 다운로드 |
| 업데이트 | macOS 메이저 업데이트 (연 1회) | 즉시 (3~6개월 세대 교체) |
| 모델 선택 | 1개 (고정) | 자유 선택 |
| 현재 성능 | ~Qwen-3-4B 수준 (1년 전) | 최신 모델 가능 |
| 컨텍스트 | 4,096 | 모델별 (8K~1M+) |
| 비용 | $0 | $0 (전기비) |
| 프라이버시 | 완전 로컬 | 완전 로컬 |
| 접근성 | brew install apfel | Ollama 설치 + pull |
→ 경쟁이 아닌 보완 관계:
- Apple = 즉시 사용 가능, 항상 켜져 있는 백그라운드 AI
- Ollama = 최신 성능, 선택 자유
”Apple이 잠갔다”는 표현의 정확성
apfel 마케팅 문구:
"Apple locked it behind Siri. apfel sets it free"
실제:
- Apple이 공식 제공하는 FoundationModels 프레임워크
- apfel은 정당한 래퍼 (해킹 ❌)
- Apple API 활용한 정당한 프로젝트
오해 가능 표현:
- "Neural Engine에서 실행" → 실제론 GPU(Metal)도 사용
- Apple 내부 스케줄링에 따라 다름
- 사용자 제어 불가
OS 내장 AI의 시대 (큰 그림)
2024~2026 흐름:
Apple:
- Apple Intelligence
- FoundationModels (macOS 26+)
- 30억 파라미터 모델 OS 내장
Google:
- Gemini Nano
- Chrome + Android 내장
Microsoft:
- Copilot Windows 통합
- Phi-3.5 / Phi-4 활용
Linux:
- Ollama가 사실상 표준
- 시스템 통합은 약함
→ **“항상 켜져 있고, 무료이며, 프라이빗한 AI 레이어”**가 OS 수준에서 깔리는 시대
apfel의 의의
1. OS 내장 AI를 모든 개발자에게 개방
- Swift 몰라도 사용
- brew install 한 줄
2. UNIX 철학 적용
- LLM = "하나의 일 잘 하는 도구"
- 파이프·xargs·jq와 조합
3. OpenAI 호환 = 즉시 마이그레이션
- 기존 코드 base_url만 변경
- 100% 로컬 + 무료
4. 프라이빗 AI 도구 빌드 기반
- 별도 모델 다운로드 ❌
- macOS만 있으면 즉시 시작
- "프라이빗 Grammarly" 같은 앱 가능
5. 진입장벽 제거
- 누구나 시작 가능
- 학습 곡선 최소
활용 예시
# 1. 셸 명령 생성
apfel "최근 7일 수정된 Python 파일 찾기"
# → find . -name "*.py" -mtime -7
# 2. 커밋 메시지 자동
git diff --cached | apfel "이 변경사항 커밋 메시지 작성"
# 3. 로그 분석
tail -100 /var/log/system.log | apfel "에러 패턴 요약"
# 4. 빠른 번역
echo "Hello, how are you?" | apfel "한국어 번역"
# 5. JSON 응답 + jq 조합
apfel "오늘 날씨 정보 JSON으로" -o json | jq .
# 6. 코드 설명
cat script.py | apfel "이 코드 한 줄로 설명"관련 도구·경쟁
| 도구 | 차별점 |
|---|---|
| apfel ⭐ | macOS 내장 모델 활용, brew 설치 |
| Ollama | 다양한 오픈모델, 모든 OS |
| llamafile | 실행파일 1개로 모델 + 실행 |
| LM Studio | GUI 우선 |
| ChatGPT 데스크탑 | OpenAI 의존 |
| Claude Code CLI | Anthropic 의존 |
→ apfel niche: macOS + 즉시 사용 + 완전 무료
한계 & 우려
1. 모델 업데이트 속도
Apple: macOS 메이저 업데이트 (연 1회)
오픈소스 LLM: 3~6개월 세대 교체
→ Apple 모델이 "1년 전 Qwen-3-4B 수준"으로 평가
→ 따라잡기 어려울 수 있음
2. 4,096 토큰 한계
- 긴 컨텍스트 작업 부적합
- 대형 코드베이스 분석 ❌
3. 모델 선택권 없음
- Apple이 정해준 1개만 사용
- 도메인 특화 파인튜닝 ❌
4. macOS 전용
- Linux/Windows 사용자는 사용 불가
추천 사용 시나리오
| 적합 | 부적합 |
|---|---|
| macOS 26+ Apple Silicon 사용자 | Intel Mac, 다른 OS |
| 짧은 작업 자동화 | 대형 모델 필요한 작업 |
| 프라이버시 중시 | 최고 성능 요구 |
| UNIX 도구 조합 좋아함 | GUI 선호 |
| 즉시 시작하고 싶음 | 모델 선택 자유 원함 |
다른 노트와의 연결
| 노트 | 연결점 |
|---|---|
| Claude Code 로컬 모델 (Ollama) | Ollama 대안 |
| Large Language Models (LLMs) | 소형 LLM의 가치 |
| OmniCoder-9B | 소형 모델 활용 |
| Open Source LLM | 오픈소스 LLM 생태계 |
| 맥 | Apple Silicon |
| iOS | Apple 생태계 |
| Terminal | CLI 도구 |
| OpenAI | API 호환 |
| FOMO 무기화와 기술 조기 채택 | ”기다려도 괜찮다” — Ollama 충분 |
메타 패턴 — OS의 AI 통합
새로운 표준화 흐름:
1. OS = AI 인프라
- Apple FoundationModels
- Windows Copilot
- Android Gemini Nano
2. 로컬 AI 진입장벽 ↓
- 별도 다운로드 ❌
- 별도 인증 ❌
- 별도 비용 ❌
3. 프라이버시 표준화
- 데이터가 기기 떠나지 않음
- 클라우드 의존 감소
4. UNIX 철학의 부활
- apfel | jq | grep
- LLM도 "도구" 중 하나
5. 오픈소스의 빈틈 파기
- 빅테크가 안 한 것을 인디 메이커가
- brew install로 즉시 공유
→ 관련: AI 시대 실행 비용 붕괴 (개인 도구의 시대)