RAG(검색증강생성) 구축 가이드: 설계 체크리스트 v1
- 작성자
- 최고관리자
- 등록일
- 2025-12-24
- 첨부파일
본문
RAG 품질은 “검색”에서 대부분 결정됩니다. 아래 체크리스트로 초기 설계를 점검하세요.
-
데이터 수집: 문서 유형(PDF/HTML/한글/이미지) 별 추출 품질 확인
-
청킹: 300~800 tokens 기준 + 문단/제목 기반 분할 권장
-
임베딩: 도메인 특화 용어 많은 경우 모델 비교 실험 필수
-
검색: BM25 + 벡터 하이브리드 추천, Top-k/재랭킹 단계 고려
-
프롬프트: 출처 인용(문서명/페이지/URL), “모르면 모른다” 정책 포함
-
평가: 정답/근거 포함 평가셋(최소 50~200문항)부터 시작