RAG(검색증강생성) 구축 가이드: 설계 체크리스트 v1

작성자
최고관리자
등록일
2025-12-24
첨부파일

본문

RAG 품질은 “검색”에서 대부분 결정됩니다. 아래 체크리스트로 초기 설계를 점검하세요.

  • 데이터 수집: 문서 유형(PDF/HTML/한글/이미지) 별 추출 품질 확인

  • 청킹: 300~800 tokens 기준 + 문단/제목 기반 분할 권장

  • 임베딩: 도메인 특화 용어 많은 경우 모델 비교 실험 필수

  • 검색: BM25 + 벡터 하이브리드 추천, Top-k/재랭킹 단계 고려

  • 프롬프트: 출처 인용(문서명/페이지/URL), “모르면 모른다” 정책 포함

  • 평가: 정답/근거 포함 평가셋(최소 50~200문항)부터 시작