개요

Morphik은 멀티모달 문서를 위한 오픈소스 AI 네이티브 지식 베이스입니다.

  • PDF, 이미지, 영상 등 다양한 문서를 단일 API로 검색
  • ColPali 기반 멀티모달 임베딩으로 페이지 전체의 시각적 맥락까지 검색
  • 도메인 특화 지식 그래프 생성 지원
  • MCP 지원
  • 기본 기능은 MIT, 일부 고급 기능은 유료 ee 네임스페이스

한 줄 요약

“Morphik은 텍스트 청크 중심 RAG보다, 시각 구조를 포함한 기술 문서 검색과 지식 그래프 구축에 더 초점을 둔 멀티모달 지식 베이스다.”


핵심 기능

멀티모달 검색

  • PDF 페이지를 이미지처럼 처리
  • 레이아웃, 표, 타이포그래피, 도식 같은 시각 구조를 반영
  • 이미지, PDF, 영상까지 단일 엔드포인트에서 질의

이 점이 전통적인 텍스트 청킹형 RAG와 가장 큰 차이입니다.

ColPali 기반 임베딩

  • 페이지 단위 멀티벡터 표현 생성
  • 단순 문장 매칭보다 문서의 시각적 구조까지 고려

기술 문서, 도면, 리포트, 폼 문서처럼 형태 자체가 의미를 갖는 자료에 특히 유리합니다.

지식 그래프

  • 한 줄의 코드로 도메인 특화 지식 그래프 생성 가능
  • 사전 정의된 시스템 프롬프트 또는 커스텀 프롬프트 사용 가능
  • 문서 간 개체 연결을 통해 더 구조적인 질의 가능

메타데이터 추출

  • bounding box
  • 분류
  • 라벨링

같은 구조화 메타데이터를 빠르게 추출 가능

Cache-Augmented-Generation

  • 문서별 KV 캐시 생성
  • 반복 질의가 많은 환경에서 생성 속도 향상

통합

  • Google Workspace
  • Slack
  • Confluence
  • MCP

즉, 단순 검색 엔진이 아니라 조직 문서 워크플로우 안으로 들어가는 지식 계층에 가깝습니다.


의미

Morphik이 흥미로운 이유는 RAG = 텍스트 청크 + 벡터 검색이라는 단순 모델에서 벗어나, 문서의 시각적 구조, 문서 간 관계, 생성 캐시까지 함께 다루는 지식 베이스를 지향한다는 점입니다.

  • 멀티모달 검색
  • 지식 그래프
  • 메타데이터 추출
  • 생성 캐시
  • MCP 연동

즉, 검색 파이프라인보다 지식 운영 플랫폼에 더 가깝습니다.


관련 항목