개요

**HITL(Human In The Loop)**은 AI·자동화 시스템의 의사결정 과정에 인간이 개입해 검토·승인·수정하는 방식. AI 오류를 줄이고 신뢰성을 높이는 핵심 전략.


유형

유형설명예시
Human-in-the-loop매 단계 인간 승인 필요의료 AI 진단, 법적 문서
Human-on-the-loopAI 자동 실행, 인간이 모니터링·개입자율주행 감시, 콘텐츠 모더레이션
Human-in-command전략적 결정만 인간, 실행은 AI금융 거래, 군사 AI

주요 활용 분야

분야역할
데이터 라벨링AI 초안 라벨 → 사람이 검수·수정
RLHFAI 출력 품질 평가·순위 부여 → 모델 개선
콘텐츠 검수AI 생성 콘텐츠 유해성·정확성 판단
의료 AIAI 진단 보조, 최종 판단은 의사
AI 에이전트중요 액션 전 인간 승인 요청
법률·컴플라이언스AI 초안 작성, 전문가 최종 검토

RLHF와의 관계

**RLHF(Reinforcement Learning from Human Feedback)**는 HITL의 대표적 적용:

모델 출력 생성
  → 인간 평가자가 순위/점수 부여  ← HITL
  → 보상 모델 학습
  → PPO로 정책 최적화
  → 반복

→ ChatGPT, Claude 등 현대 LLM이 사람 선호도에 맞게 정렬된 방법


장단점

장점단점
AI 오류 방지·신뢰성 향상처리 속도 저하
책임 소재 명확화인건비 발생
규제 대응 용이확장성 제한·병목

관련 항목