OpenClaw (로컬 퍼스트 자율 AI 에이전트)
개요
OpenClaw(구 Clawdbot/Moltbot)는 Peter Steinberger가 개발한 오픈소스 로컬 퍼스트(Local-first) 자율 AI 에이전트 플랫폼입니다. 단순한 대화형 클라우드 챗봇을 넘어, 사용자의 로컬 환경(파일, 브라우저, 쉘)을 이해하고 제어하는 “행동하는(Acting)” 주체로서의 AI를 지향합니다.
- GitHub: https://github.com/openclaw/openclaw (361,386 ⭐, GitHub 역대급)
- 공식: https://openclaw.ai
- 스킬: https://clawhub.com (5,400+ 스킬)
- 라이선스: MIT
- 스폰서: OpenAI, GitHub, NVIDIA, Vercel
- GTC 2026: 젠슨 황 — “OpenClaw는 개인 AI를 위한 운영체제, 소프트웨어 르네상스의 시작”
- 출처 영감: yozm.wishket.com (2026-03)
- 핵심 명제: 클라우드 기반의 “대답하는” AI에서 벗어나, 내 컴퓨터에서 “행동하는” 로컬 AI 에이전트로의 전환.
1. 아키텍처 및 기술적 결정
Hub-and-Spoke 게이트웨이
중앙 게이트웨이가 제어 평면(Control Plane) 역할을 하여 메시지 라우팅, 세션, 상태 관리를 담당합니다.
WebSocket 통신
HTTP 대신 WebSocket을 사용하여 지속적인 세션을 유지하고, 이벤트 기반의 양방향 통신 및 실시간 도구 호출(Tool-call) 스트리밍을 지원합니다.
영구적 기억 (Persistent Memory)
상태가 없는(Stateless) 기존 챗봇과 달리, 사용자의 히스토리와 선호도를 로컬 마크다운 파일(예: MEMORY.md)에 저장하고 RAG(Retrieval-Augmented Generation)를 통해 맥락을 검색해옵니다.
도구(Tools)와 스킬(Skills)의 분리
- 도구 (Tools): 파일 I/O, 브라우저 자동화, 쉘 명령어 실행 등 시스템과 상호작용하기 위한 저수준(Low-level) 인터페이스입니다.
- 스킬 (Skills): 여러 도구를 조합하여 복잡한 작업을 수행하는 고수준의 “워크플로우 추상화”입니다. (예: “뉴스를 요약해서 PDF로 저장해줘”)
Agent와 Runner의 분리
AI의 성격 및 정책(Agent)을 실제 LLM 실행 및 도구 호출(Runner)과 분리하여 보안성과 확장성을 높였습니다.
2. 주요 시사점 및 기술 트렌드
로컬 퍼스트 패러다임 (Local-First)
로컬 환경에서 구동됨으로써 에이전트가 OS에 직접 접근할 수 있으며, 클라우드 기반 AI가 쉽게 수행할 수 없는 수준의 자동화가 가능해집니다. 프라이버시가 보호되며 실시간 상호작용이 강화됩니다.
UI로서의 메시징 (Messaging as UI)
Telegram, Slack, Discord 등과 통합되어, 사용자에게 친숙한 채팅 앱을 로컬 컴퓨터를 조작하는 리모컨처럼 활용할 수 있습니다.
”행동하는” AI (The “Acting” AI)
단순히 정보를 제공하는 것을 넘어, 여러 소프트웨어 계층에 걸쳐 다단계 워크플로우를 실행하는 함수 합성(Function Composition) 형태로 진화하고 있습니다.
3. 메모리 아키텍처: Markdown 기반 하이브리드 메모리
Clawdbot/OpenClaw의 중요한 차별점 중 하나는 장기 기억을 폐쇄형 DB가 아니라 로컬 Markdown 파일로 관리한다는 점입니다. 설계 철학은 명확합니다:
기억의 소유권은 사용자에게 있어야 하며, 기억은 읽고 수정하고 Git으로 관리할 수 있어야 한다.
소스 오브 트루스
- 진짜 저장소는 Markdown 파일
- SQLite는 검색 인덱스
- 사용자는 메모리를 직접 열어보고 수정 가능
- Git으로 버전 관리 가능
즉, 벡터 DB가 진실의 원본이 아니라, 사람이 읽을 수 있는 문서가 원본입니다.
2계층 메모리 구조
Layer 1: Daily Logs
경로 예시:
memory/YYYY-MM-DD.md역할:
- 그날의 대화 요약
- 결정 사항
- 임시 작업 맥락
- 짧은 기간 유효한 사용자 선호
즉, 세션과 날짜 중심의 운영 로그에 가깝습니다.
Layer 2: Long-term Knowledge
경로 예시:
MEMORY.md역할:
- 장기적으로 유지할 사용자 프로필
- 프로젝트의 핵심 사실
- 반복적으로 참조되는 결정
- 여러 세션을 넘어 유지돼야 하는 지식
즉, 에이전트의 장기 기억입니다.
왜 Markdown인가
- 사람에게 투명함
- 직접 편집 가능
- Git diff 가능
- 에이전트가 구조화된 텍스트로 읽기 쉬움
- 특정 벤더/DB에 종속되지 않음
이 선택은 기술보다 철학에 가깝습니다. Clawdbot은 메모리를 숨기지 않고 노출합니다.
4. 하이브리드 검색: Vector + BM25
Clawdbot은 메모리를 무조건 프롬프트에 밀어 넣지 않고, 필요할 때만 memory_search 같은 도구로 조회하는 방식을 택합니다.
검색 방식
1. 시맨틱 검색
- 임베딩 기반 유사도 검색
- 의미적으로 비슷한 기억 탐색
- 구현: SQLite-vec
2. 키워드 검색
- 정확한 고유명사
- 날짜
- 에러 코드
- ID
같은 항목 탐색용
구현: SQLite FTS5 / BM25
결합 방식
글에서 설명하는 최종 점수:
0.7 * 벡터 점수
+ 0.3 * 텍스트 점수즉, 의미 유사도와 정확한 문자열 일치를 함께 사용합니다.
이 구조가 중요한 이유:
- 벡터 검색만 쓰면 날짜/이름/ID에 약하고
- 키워드 검색만 쓰면 문맥 유사도에 약함
그래서 하이브리드가 실제 업무에서 더 안정적입니다.
5. 컨텍스트 관리: Compaction과 Pruning
Clawdbot은 단순히 “메모리를 잘 저장한다”에서 끝나지 않고, 컨텍스트 윈도우 한계를 넘는 운영 전략까지 갖습니다.
Compaction
컨텍스트가 길어질 때:
- 예전 대화를 통째로 유지하지 않고
- 요약된 compacted history로 대체
핵심은 그 전에 Memory Flush를 수행한다는 점입니다.
긴 대화
→ 중요한 정보 MEMORY.md / daily log로 먼저 저장
→ 그 뒤 대화 자체는 요약/압축즉, 요약 때문에 장기 기억이 사라지지 않도록 영구 저장 후 요약하는 구조입니다.
Pruning
길고 불필요한 도구 출력 예:
- 대용량 로그
- 장문 CLI 출력
- 반복적인 상태 메시지
이런 항목은 적절히 잘라내어 토큰을 절약합니다.
특히 이 글은 Anthropic prompt caching TTL까지 고려한 pruning 로직을 언급합니다. 즉, 단순 삭제가 아니라 캐시 효율과 토큰 비용을 함께 고려하는 운영 최적화입니다.
6. 데이터 파이프라인
메모리 시스템의 흐름은 대략 다음과 같습니다.
Markdown 파일 변경
↓
파일 감지 (Chokidar)
↓
청킹 (약 400 토큰, 80 토큰 overlap)
↓
임베딩 생성
↓
SQLite 인덱스 저장
↓
memory_search에서 hybrid retrieval즉:
- Markdown = 원본
- SQLite = 검색용 가속 레이어
라는 구조입니다.
7. 왜 이 메모리 설계가 중요한가
1. 데이터 소유권
- 클라우드 서비스에 종속되지 않음
- 사용자가 직접 백업, 편집, 이관 가능
2. 투명성
- “에이전트가 나에 대해 무엇을 기억하나?”를 바로 확인 가능
3. 장기 사용성
- 세션이 끊겨도 기억이 남음
- 대규모 컨텍스트에서도 효율적으로 회수 가능
4. 비용 최적화
- 모든 메모리를 매번 프롬프트에 넣지 않고
- 검색 + compaction + pruning으로 토큰 비용 절감
즉, 이 구조는 단순한 메모장 기능이 아니라 장기 실행 가능한 로컬 AI 에이전트 운영체계의 일부입니다.
8. Peter Steinberger의 AI 네이티브 개발 방식
OpenClaw/MoltBot의 창시자 Peter Steinberger는 2026년 초 인터뷰에서 매우 공격적인 AI 에이전트 중심 개발 방식을 설명했습니다. 핵심 메시지는:
“코드를 한 줄씩 읽는 대신, 시스템과 결과를 검증하는 루프를 설계하라.”
배경
- PSPDFKit을 글로벌 개발자 도구 비즈니스로 성장시킨 창업자
- 70명+ 규모 팀을 운영한 경험이 있음
- 3년 휴식 후 복귀하면서 LLM과 AI 에이전트 중심 개발로 전환
- 2026년 1월 한 달에 6,600+ 커밋 기록
- 작업 대부분은 회사 업무가 아닌 개인 프로젝트 실험
그의 작업 방식
1. 아키텍처/계획에 긴 시간 투자
2. 5~10개 에이전트를 동시에 실행
3. 각 에이전트가 기능별로 병렬 작업
4. 에이전트가 스스로 컴파일/린트/테스트
5. 사람은 코드 리뷰보다 결과와 구조를 점검”읽지 않은 코드를 배포한다”는 뜻
이는 무책임하게 배포한다는 뜻이 아니라:
- 모든 코드를 사람이 줄 단위로 읽는 방식에서 벗어나고
- 테스트, 실행, 검증 루프를 먼저 신뢰하며
- 사람은 아키텍처, 방향, 스타일 일관성을 관리한다는 뜻에 가깝습니다.
즉, 신뢰의 기준이:
코드 리뷰 중심
→ 실행 결과 + 자동 검증 중심으로 이동합니다.
핵심 교훈
1. 완벽주의를 버려야 함
- 에이전트가 만든 코드가 항상 내 취향일 수는 없음
- 완벽주의가 강할수록 에이전트 활용 효율이 떨어짐
2. 루프를 닫아야 함
- 에이전트가 직접:
- 컴파일
- 린트
- 테스트
- 실행 결과 확인
- 할 수 있어야 진짜 생산성이 나옴
3. Pull Request보다 Prompt Request
- 앞으로는 코드 diff보다
- 어떤 프롬프트/계획/의도로 코드가 생성됐는지
- 가 더 중요해질 수 있다는 주장
4. 코드 리뷰보다 아키텍처 논의
- 팀 내 논의도 세부 구현보다
- 모듈 경계, 확장성, 부채, 시스템 구조 중심
5. 병렬 에이전트 운영
- 5~10개 에이전트를 동시에 돌리며
- 한 명이 여러 작업 스트림을 관리
- 인간은 각 에이전트의 blocker를 풀어주는 orchestrator 역할
6. 계획 단계에 더 많은 시간 투자
- Steinberger는 Codex를 계획 수립용으로 선호한다고 설명
- 계획을 세우고, 반박하고, 수정한 뒤 실행
7. 로컬 CI 선호
- 원격 CI의 10분 대기보다
- 에이전트가 로컬에서 즉시 테스트하는 편이 훨씬 빠름
8. 대부분의 코드는 사실 지루한 데이터 변환
- 모든 구현 디테일에 집착할 필요가 없음
- 에너지는 시스템 설계와 제품 결과물에 써야 함
9. 왜 이런 사람이 AI에 잘 적응하나
Steinberger의 사례가 시사하는 바:
- 구현 디테일보다 결과를 중시하는 엔지니어
- 제품을 출시하는 것을 좋아하는 사람
- 큰 구조를 머릿속에 유지하는 아키텍트형 개발자
가 AI 에이전트와 더 잘 맞는 경향이 있습니다.
반대로:
- 알고리즘 퍼즐 풀이 자체를 즐기거나
- 한 줄 한 줄의 스타일 통제를 중시하는 사람
은 AI 네이티브 전환에서 더 큰 마찰을 느낄 수 있습니다.
10. 중요한 단서: 누구에게나 그대로 적용되진 않음
이 방식은 다음 조건에서 특히 잘 맞습니다.
- 빠른 반복이 가능한 프로젝트
- 실험적 제품
- 강한 개인 오너십
- 선량한 독재자(benevolent dictator)식 의사결정
즉, OpenClaw/MoltBot은:
대규모 엔터프라이즈 정석 프로세스
≠
AI 에이전트 실험에 최적화된 개인 프로젝트입니다.
그래서 모든 팀이 그대로 복제할 수는 없지만, AI 네이티브 개발의 극단적 선행 사례로는 매우 중요합니다.
11. 시사점
OpenClaw/MoltBot 사례의 핵심은 단지 “커밋 수가 많다”가 아닙니다.
개발자의 역할 변화:
코드 직접 작성자
→ 에이전트 감독자
→ 시스템 설계자
→ 결과 검증자
→ 아키텍처 책임자즉, AI 시대에 엔지니어가 사라지는 것이 아니라, 더 높은 수준의 추상화와 의사결정으로 이동한다는 사례로 볼 수 있습니다.
12. 실행 환경 및 고려사항
- 환경: Node.js 22 이상이 필요합니다. 로컬 PC나 24시간 가동되는 전용 리눅스 서버(예: Ollama 연동)에서 실행하기 적합합니다.
- 비용 vs 품질: 로컬 LLM(프라이버시 보장, 무료이나 품질이 낮음)과 클라우드 API(품질이 높으나 토큰 비용 발생) 사이의 선택이 필요합니다.
- 보안 리스크 (최소 권한의 원칙): AI에게 쉘(Shell)이나 브라우저 접근 권한을 부여하는 것은 매우 큰 보안 위험을 수반합니다. 웹 상의 악의적인 프롬프트(Poisoned content)로 인해 AI가 파일을 삭제하거나 악성 코드를 실행할 수 있으므로, 터미널 중심의 강력한 보안 모델과 최소 권한의 원칙(Principle of Least Privilege) 적용이 필수적입니다.
- 주요 유즈케이스: 일일 뉴스 요약, 영수증 정리, 로컬 파일 관리 등 개인화된 자동화 작업에 이상적입니다.
NVIDIA NemoClaw / DGX Station 연동
DGX Station과의 관계
DGX Station (하드웨어 — GB300 Grace Blackwell Ultra)
└── NemoClaw (소프트웨어 스택)
├── OpenClaw (에이전트 플랫폼) ⭐
├── Nemotron 모델 (NVIDIA AI 모델)
└── OpenShell (보안 런타임, Rust, Apache 2.0)
젠슨 황 GTC 2026:
"OpenClaw는 개인 AI를 위한 운영체제"
→ 관련: NVIDIA DGX Station (2026)
NemoClaw
GitHub: https://github.com/NVIDIA/NemoClaw
Stars: 19,564 | 라이선스: Apache 2.0 | 상태: Alpha
기능:
✓ OpenClaw + OpenShell 통합 보안 실행
✓ Nemotron 모델 자동 구성 (라우팅 추론)
✓ 가이드 온보딩 위저드
✓ 하드닝 블루프린트
설치:
curl -fsSL https://www.nvidia.com/nemoclaw.sh | bash
OpenShell (보안 런타임)
GitHub: https://github.com/NVIDIA/OpenShell
Stars: 5,155 | 언어: Rust | 라이선스: Apache 2.0
보안 레이어:
- Landlock (파일시스템 격리)
- seccomp (시스템 콜 필터)
- netns (네트워크 격리)
- 정책 기반 egress 제어
⚠️ claw-code와 혼동 주의
| 항목 | OpenClaw | claw-code |
|---|---|---|
| 정체 | 개인 AI 플랫폼 | Claude Code의 Rust 포팅 |
| 창시자 | Peter Steinberger | Yeachan-Heo (Bellman) |
| 언어 | TypeScript | Rust |
| Stars | 361K | 187K |
| NVIDIA | 공식 스폰서 | 관계 없음 |
→ 이름에 “claw” 공통이지만 완전히 별개 프로젝트 → claw-code 관련: Oh My Codex & 에이전트 스웜, oh-my-claudecode & Claude 멀티에이전트
관련 항목
- NVIDIA DGX Station (2026)
- AI 에이전트 프레임워크
- AI Coding Agent
- Hermes Agent
- OpenClaw vs Hermes Agent
- Codex 내부 실험 (수동 코드 없는 5개월)
- Kimi K2.6
- NanoClaw Docker 샌드박스
- AI 시대 실행 비용 붕괴
- MCP (Model Context Protocol)
- RAG
- Open SWE (사내 코딩 에이전트)
- Oh My Codex & 에이전트 스웜
- oh-my-claudecode & Claude 멀티에이전트
- understudy (데스크톱 에이전트)
- Claude Code CLI
- 코드 이해