Hailo는 이스라엘의 AI 칩 스타트업으로, **엣지 AI 추론 전용 NPU (Neural Processing Unit)**를 개발합니다. NVIDIA Jetson이 GPU 기반 범용 AI 컴퓨팅 플랫폼인 반면, Hailo는 추론만 극도로 효율적으로 수행하는 초저전력 ASIC에 집중합니다. 라즈베리파이 AI Kit에 탑재되면서 메이커/임베디드 커뮤니티에서 급속히 인지도가 올랐습니다.
Hailo-10H: Transformer, LLM 추론 지원 (기존 Hailo-8은 CNN 중심)
GenAI 시대에 맞춘 아키텍처 전환
Hailo-15 (비전 프로세서)
칩
특징
Hailo-15H
AI 비전 프로세서 + ISP (이미지 시그널 프로세서) 통합, 4K 카메라 SoC
Hailo-15M
중급형
Hailo-15L
저가형
AI NVR (네트워크 비디오 레코더), 스마트 카메라에 최적화
NPU + ISP + 비디오 인코더 원칩 통합
핵심 아키텍처
데이터플로우 아키텍처
GPU처럼 명령어를 순차 실행하지 않음
뉴럴 네트워크 그래프 전체를 하드웨어에 매핑
데이터가 연산 유닛 사이를 흐르며 처리 (파이프라인)
메모리 병목 최소화 → 와트당 성능 극대화
왜 초저전력인가
설계
효과
추론 전용 (학습 불가)
불필요한 회로 제거
정적 스케줄링
런타임 오버헤드 제거
온칩 메모리 최적화
외부 DRAM 접근 최소화
INT8/INT4 네이티브
저정밀도 연산에 최적화
Hailo vs NVIDIA Jetson
항목
Hailo-8
Hailo-8L
Jetson Orin Nano
Jetson AGX Orin
유형
NPU (추론 ASIC)
NPU (추론 ASIC)
GPU (범용)
GPU (범용)
AI 성능
26 TOPS
13 TOPS
67 TOPS
275 TOPS
전력
2.5W
1.5W
7~25W
15~75W
TOPS/W
~10
~8.7
~2.7
~3.7
학습
X
X
O (제한적)
O
LLM 추론
X (Hailo-10부터)
X
O (소형 모델)
O (7B~13B)
가격
~$70 (모듈)
~$30 (RPi Kit)
~$249 (키트)
~$1,999 (키트)
개발 환경
Hailo Dataflow Compiler
동일
CUDA, TensorRT, JetPack
동일
소프트웨어 생태계
성장 중
성장 중
CUDA 생태계 (최강)
동일
CPU
없음 (호스트 필요)
없음 (RPi가 호스트)
6코어 Arm A78AE
12코어 Arm A78AE
핵심 차이 요약
Hailo: "추론만 하되 와트당 성능을 극대화"
→ 배터리 기기, 카메라, 대량 배포 센서에 적합
→ CPU/GPU 없음 — 호스트 프로세서(RPi, x86 등)에 가속기로 부착
Jetson: "엣지에서 학습도 추론도 다 하는 미니 AI 컴퓨터"
→ 로봇, 자율주행, 복잡한 AI 파이프라인에 적합
→ CPU + GPU + 메모리 통합 SoM (독립 실행)