개요

RAGFlow는 문서 파싱·청킹·임베딩·검색·생성을 통합한 오픈소스 RAG 엔진. 기업 문서 기반 AI 챗봇 구축에 특화.


주요 기능

기능설명
딥 문서 파싱PDF·Word·PPT·Excel·HTML 레이아웃 인식, 표·이미지·수식 처리
청킹 전략문서 유형별 자동 청킹 (Q&A, 매뉴얼, 논문 등)
임베딩다양한 임베딩 모델 지원 (BGE, OpenAI 등)
하이브리드 검색벡터 검색 + 키워드 검색 결합
멀티 LLMOpenAI, Claude, Ollama, 로컬 모델 등
인용 추적답변에 출처 문서·페이지 명시
APIRESTful API로 외부 통합

아키텍처

문서 업로드
  → 파싱 (레이아웃 인식, OCR)
  → 청킹 (문서 유형별 전략)
  → 임베딩 → 벡터 DB 저장
  ↓
사용자 질문
  → 하이브리드 검색 (벡터 + 키워드)
  → 컨텍스트 조합
  → LLM 생성 + 인용 추가
  → 답변 반환

설치 (Docker)

git clone https://github.com/infiniflow/ragflow.git
cd ragflow/docker
docker compose up -d
 
# 접속: http://localhost:80
# 기본 계정: admin@ragflow.io / ragflow

vs 경쟁 도구

항목RAGFlowLangChainLlamaIndex
문서 파싱딥 파싱 (레이아웃 인식)기본중간
UI웹 UI 내장없음없음
설치Docker 원클릭코드 직접 구현코드 직접 구현
대상비개발자 포함 팀개발자개발자

관련 항목