개요
Morphik은 멀티모달 문서를 위한 오픈소스 AI 네이티브 지식 베이스입니다.
- PDF, 이미지, 영상 등 다양한 문서를 단일 API로 검색
- ColPali 기반 멀티모달 임베딩으로 페이지 전체의 시각적 맥락까지 검색
- 도메인 특화 지식 그래프 생성 지원
- MCP 지원
- 기본 기능은 MIT, 일부 고급 기능은 유료
ee네임스페이스
한 줄 요약
“Morphik은 텍스트 청크 중심 RAG보다, 시각 구조를 포함한 기술 문서 검색과 지식 그래프 구축에 더 초점을 둔 멀티모달 지식 베이스다.”
핵심 기능
멀티모달 검색
- PDF 페이지를 이미지처럼 처리
- 레이아웃, 표, 타이포그래피, 도식 같은 시각 구조를 반영
- 이미지, PDF, 영상까지 단일 엔드포인트에서 질의
이 점이 전통적인 텍스트 청킹형 RAG와 가장 큰 차이입니다.
ColPali 기반 임베딩
- 페이지 단위 멀티벡터 표현 생성
- 단순 문장 매칭보다 문서의 시각적 구조까지 고려
기술 문서, 도면, 리포트, 폼 문서처럼 형태 자체가 의미를 갖는 자료에 특히 유리합니다.
지식 그래프
- 한 줄의 코드로 도메인 특화 지식 그래프 생성 가능
- 사전 정의된 시스템 프롬프트 또는 커스텀 프롬프트 사용 가능
- 문서 간 개체 연결을 통해 더 구조적인 질의 가능
메타데이터 추출
- bounding box
- 분류
- 라벨링
같은 구조화 메타데이터를 빠르게 추출 가능
Cache-Augmented-Generation
- 문서별 KV 캐시 생성
- 반복 질의가 많은 환경에서 생성 속도 향상
통합
- Google Workspace
- Slack
- Confluence
- MCP
즉, 단순 검색 엔진이 아니라 조직 문서 워크플로우 안으로 들어가는 지식 계층에 가깝습니다.
의미
Morphik이 흥미로운 이유는 RAG = 텍스트 청크 + 벡터 검색이라는 단순 모델에서 벗어나, 문서의 시각적 구조, 문서 간 관계, 생성 캐시까지 함께 다루는 지식 베이스를 지향한다는 점입니다.
- 멀티모달 검색
- 지식 그래프
- 메타데이터 추출
- 생성 캐시
- MCP 연동
즉, 검색 파이프라인보다 지식 운영 플랫폼에 더 가깝습니다.