개요
RAGFlow는 문서 파싱·청킹·임베딩·검색·생성을 통합한 오픈소스 RAG 엔진. 기업 문서 기반 AI 챗봇 구축에 특화.
주요 기능
| 기능 | 설명 |
|---|
| 딥 문서 파싱 | PDF·Word·PPT·Excel·HTML 레이아웃 인식, 표·이미지·수식 처리 |
| 청킹 전략 | 문서 유형별 자동 청킹 (Q&A, 매뉴얼, 논문 등) |
| 임베딩 | 다양한 임베딩 모델 지원 (BGE, OpenAI 등) |
| 하이브리드 검색 | 벡터 검색 + 키워드 검색 결합 |
| 멀티 LLM | OpenAI, Claude, Ollama, 로컬 모델 등 |
| 인용 추적 | 답변에 출처 문서·페이지 명시 |
| API | RESTful API로 외부 통합 |
아키텍처
문서 업로드
→ 파싱 (레이아웃 인식, OCR)
→ 청킹 (문서 유형별 전략)
→ 임베딩 → 벡터 DB 저장
↓
사용자 질문
→ 하이브리드 검색 (벡터 + 키워드)
→ 컨텍스트 조합
→ LLM 생성 + 인용 추가
→ 답변 반환
설치 (Docker)
git clone https://github.com/infiniflow/ragflow.git
cd ragflow/docker
docker compose up -d
# 접속: http://localhost:80
# 기본 계정: admin@ragflow.io / ragflow
vs 경쟁 도구
| 항목 | RAGFlow | LangChain | LlamaIndex |
|---|
| 문서 파싱 | 딥 파싱 (레이아웃 인식) | 기본 | 중간 |
| UI | 웹 UI 내장 | 없음 | 없음 |
| 설치 | Docker 원클릭 | 코드 직접 구현 | 코드 직접 구현 |
| 대상 | 비개발자 포함 팀 | 개발자 | 개발자 |
관련 항목