01 / 홈 02 / 카테고리 03 / 시리즈

01 / 홈 02 / 카테고리 03 / 시리즈

카테고리

AI 페이지로 이동
ai 페이지로 이동
algorithm 페이지로 이동
- live-coding 페이지로 이동
- 분산 계산을 위한 알고리즘
apartment 페이지로 이동
- 구리 럭키아파트 24평 인테리어 레퍼런스 모음
architecture 페이지로 이동
database 페이지로 이동
devops 페이지로 이동
http 페이지로 이동
- HTTP Connection Pool
- HTTPS는 어떻게 안전한가 — TLS, 인증서, 그리고 termination
interview 페이지로 이동
java 페이지로 이동
javascript 페이지로 이동
kafka 페이지로 이동
linux 페이지로 이동
- fsync — 리눅스 파일 동기화 시스템 콜
- tmux — Terminal Multiplexer
mlops 페이지로 이동
network 페이지로 이동
python 페이지로 이동
rabbitmq 페이지로 이동
- [초안] RabbitMQ Basics — 실전 백엔드 관점에서 정리하는 메시지 브로커 기본기
- [초안] RabbitMQ vs Kafka — 백엔드 메시징 선택 기준과 실전 운영 관점
security 페이지로 이동
- [초안] 시니어 백엔드를 위한 보안 / 인증 스터디 팩 — Spring Security, JWT, OAuth2, OWASP Top 10
- [초안] Spring Security 6.x OAuth2 + JWT 상용 인증 설계 — Grant 선택, Resource Server, Refresh Rotation, 로그아웃
task 페이지로 이동
testing 페이지로 이동
- [초안] 시니어 Java 백엔드를 위한 테스트 전략 완전 정리 — 피라미드부터 TestContainers, 마이크로벤치, Contract까지
travel 페이지로 이동
- 오사카 3박 4일 일정표: 우메다 쇼핑, USJ, 난바·도톤보리, 오사카성
web 페이지로 이동
- [초안] HTTP / Cookie / Session / Token 인증 기본기 — 레거시 JSP와 모바일 API가 공존하는 백엔드 관점

FOS-BLOG · FOOTERall systems normal·v0.1 · 2026.04.27·seoul, kr

Ffos-blog/study

개발 학습 기록을 정리하는 블로그입니다. 공부하면서 기록하고, 기록하면서 다시 배웁니다.

visitors

01site

Home↗
Posts↗
Categories↗
About↗

02policy

소개/about
개인정보처리방침/privacy
연락처/contact

03categories

AI↗
Algorithm↗
DB↗
DevOps↗
Java/Spring↗
JS/TS↗
React↗
Next.js↗
System↗

04connect

GitHub@jon890↗
Source repositoryjon890/fos-study↗
RSS feed/rss.xml↗
Newsletter매주 1 회 · 한 편의 글→

© 2026 FOS Study. All posts MIT-licensed.

built with·Next.js·Tailwind v4·Geist·Pretendard·oklch

/fos-blog/categories/AI/RAG

AI · RAG

RAG

7글·category/AI/RAG

READMERAG 시리즈에 대하여

README.md

README.md

RAG 파이프라인 구성 요소 학습 기록. 임베딩·벡터 검색·알고리즘·실제 사례.

개념

Embedding — 임베딩의 의미, 학습 방식(contrastive), Matryoshka, 모델 선택
벡터 검색 알고리즘 — kNN에서 HNSW까지 — 거리 계산, brute force 한계, ANN, HNSW 구조·파라미터·약점

벡터 스토어

OpenSearch를 VectorStore로 활용하기 — 벡터 필드, kNN 쿼리

실무 사례

엔터프라이즈 RAG 구축 사례 (Kubeflow + Milvus + LLaMA3)
STORM Parse — 구조화 추출/파싱 방법
토스: 100번 실패하고 살려낸 문서 시스템 — 외부 사례 정리

신뢰·운영

RAG 환각 제어 — grounding 재주입, sourceQuote 검증, 배치 정합성, bulk 색인

관련

OpenSearch RAG 검색 품질 높이기 — Hybrid Search, Reranking, Sentence Window
Confluence 벡터 색인 배치 — RAG 파이프라인 실제 구현

02이 폴더의 글

7 posts

[초안] RAG 환각 제어 — grounding 재주입, sourceQuote 검증, 배치 정합성, bulk 색인

RAG(Retrieval-Augmented Generation)를 데모에서 제품으로 올릴 때 가장 자주 무너지는 지점이 환각(hallucination)이다. 검색은 잘 되는데 LLM이 검색되지 않은 사실을 지어내거나, 검색된 문서에 없는 인용을 만들어 붙이거나, 색인이 원본과 어긋나서 "맞는 답변인데 근거가 옛 문서"인 상황이 생긴다. 이 문서는 검색 품질...

Embedding(임베딩)

- 텍스트(문장, 단락, 문서 등)를 고차원 실수 벡터(예: 768차원, 1536차원)로 변환하는 기술 - 이 벡터는 의미적 유사도를 반영하도록 학습되어 있어서, 서로 의미가 비슷한 문장은 벡터 공간에서 가깝다 이렇게 만든 벡터로 "가까운 문서"를 찾는 게 kNN·HNSW 같은 벡터 검색 알고리즘이고, 그 위에 RAG가 올라간다. - 고정 길이 : 모든 문...

OpenSearch를 VectorStore로 활용하기 위한 가이드

- OpenSearch는 원래 Elasticsearch에서 파생된 검색 엔진 기반 분산 데이터베이스 - 최근에는 벡터 검색(Vector Search) 기능이 강화되어 RAG 시스템에서 많이 쓰임 - 또 다른 활용으로는 추천 시스템, 이상 감지, 자연어 처리 등에도 사용 됨 - 자세한 내용은 - https://opensearch.org/platform/vec...

RAG 기반 '사내 지식 챗봇' 이렇게 구축했습니다

- https://yozm.wishket.com/magazine/detail/3302/ - 많은 기업이 "문서는 많지만 원하는 답을 찾기 어렵다"는 문제를 겪는다 - 이를 해결하기 위해 한 팀은 RAG(Retrieval-Augmented Generation) 시스템을 쿠버네티스 기반으로 구축했다. - Kubeflow 파이프라인으로 문서를 자동 임베딩하고,...

STORM Parse

- Sionic AI의 Intelligent Document Parser - https://www.sionic.ai/ko/parse - 단순히 문서에서 텍스트를 추출하는 것을 넘어서, 문서의 구조와 의미를 이해하고 이를 AI가 효과적으로 활용할 수 있는 형태로 변환하는 것이 핵심목표이다. - 다양한 포맷과 대용량 문서 학습 지원 - PDF, DOCX, XL...

벡터 검색 알고리즘 — kNN에서 HNSW까지

임베딩으로 텍스트를 벡터로 바꾸고 나면, "질문 벡터와 가장 가까운 문서 벡터"를 찾아야 한다. 이 글은 그 검색을 담당하는 알고리즘을 kNN(개념) → 왜 느린가 → ANN → HNSW(실전 표준) 순서로 정리한다. - kNN(k-Nearest Neighbors) = 어떤 벡터(쿼리)와 가장 가까운 k개의 이웃 벡터를 찾는 알고리즘 - 예를 들어 - 문서...

토스 : 100번 실패하고 살려낸 문서 시스템

- 100번 실패하고 살려낸 문서 시스템 - 토스 프론트엔드 개발자들이 더 이상 문서를 찾지 않는 이유 <br /> - 신규 입사자의 경험 - 모르는 지식 : "이건 누구에게 물어봐야 하지" - 복잡한 코드 : "이 기능은 어떻게 동작하는 거지?" - 어려운 맥락 : "이 코드는 왜 이렇게 작성된 거지?" <br /> - 정보가 사람들의 머릿속에...