fos-blog
/study
01 / 홈
02 / 카테고리
03 / 시리즈
검색
⌘K
01 / 홈
02 / 카테고리
03 / 시리즈
/
fos-blog
/
categories
/
ai
/
RAG
AI · RAG
RAG
category/ai/RAG
README
RAG 시리즈에 대하여
README.md
README
.md
RAG 파이프라인 구성 요소 학습 기록. 임베딩·벡터 검색·알고리즘·실제 사례.
개념
Embedding
— 임베딩의 의미, 학습 방식(contrastive), Matryoshka, 모델 선택
벡터 검색 알고리즘 — kNN에서 HNSW까지
— 거리 계산, brute force 한계, ANN, HNSW 구조·파라미터·약점
HNSW 심화 — 파라미터 튜닝과 구현체별 성능 차이
— M·ef_construction·ef_search 상호작용, 코사인=정규화 내적, 구현체별 차이, 필터 충돌·한계
실무 사례
엔터프라이즈 RAG 구축 사례 (Kubeflow + Milvus + LLaMA3)
STORM Parse
— 구조화 추출/파싱 방법
토스: 100번 실패하고 살려낸 문서 시스템
— 외부 사례 정리
신뢰·운영
RAG 환각 제어
— grounding 재주입, sourceQuote 검증, 배치 정합성, bulk 색인
관련
OpenSearch RAG 검색 품질 높이기
— Hybrid Search, Reranking, Sentence Window
OpenSearch를 벡터 DB로 굴리며 알게 된 것
— native 메모리, circuit breaker, 샤드 운영
Confluence 벡터 색인 배치
— RAG 파이프라인 실제 구현