01 / 홈 02 / 카테고리 03 / 시리즈

01 / 홈 02 / 카테고리 03 / 시리즈

카테고리

AI 페이지로 이동
ai 페이지로 이동
algorithm 페이지로 이동
- live-coding 페이지로 이동
- 분산 계산을 위한 알고리즘
apartment 페이지로 이동
- 구리 럭키아파트 24평 인테리어 레퍼런스 모음
architecture 페이지로 이동
database 페이지로 이동
devops 페이지로 이동
http 페이지로 이동
- HTTP Connection Pool
- HTTPS는 어떻게 안전한가 — TLS, 인증서, 그리고 termination
interview 페이지로 이동
java 페이지로 이동
javascript 페이지로 이동
kafka 페이지로 이동
linux 페이지로 이동
- fsync — 리눅스 파일 동기화 시스템 콜
- tmux — Terminal Multiplexer
mlops 페이지로 이동
network 페이지로 이동
python 페이지로 이동
rabbitmq 페이지로 이동
- [초안] RabbitMQ Basics — 실전 백엔드 관점에서 정리하는 메시지 브로커 기본기
- [초안] RabbitMQ vs Kafka — 백엔드 메시징 선택 기준과 실전 운영 관점
security 페이지로 이동
- [초안] 시니어 백엔드를 위한 보안 / 인증 스터디 팩 — Spring Security, JWT, OAuth2, OWASP Top 10
- [초안] Spring Security 6.x OAuth2 + JWT 상용 인증 설계 — Grant 선택, Resource Server, Refresh Rotation, 로그아웃
task 페이지로 이동
testing 페이지로 이동
- [초안] 시니어 Java 백엔드를 위한 테스트 전략 완전 정리 — 피라미드부터 TestContainers, 마이크로벤치, Contract까지
travel 페이지로 이동
- 오사카 3박 4일 일정표: 우메다 쇼핑, USJ, 난바·도톤보리, 오사카성
web 페이지로 이동
- [초안] HTTP / Cookie / Session / Token 인증 기본기 — 레거시 JSP와 모바일 API가 공존하는 백엔드 관점

FOS-BLOG · FOOTERall systems normal·v0.1 · 2026.04.27·seoul, kr

Ffos-blog/study

개발 학습 기록을 정리하는 블로그입니다. 공부하면서 기록하고, 기록하면서 다시 배웁니다.

visitors

01site

Home↗
Posts↗
Categories↗
About↗

02policy

소개/about
개인정보처리방침/privacy
연락처/contact

03categories

AI↗
Algorithm↗
DB↗
DevOps↗
Java/Spring↗
JS/TS↗
React↗
Next.js↗
System↗

04connect

GitHub@jon890↗
Source repositoryjon890/fos-study↗
RSS feed/rss.xml↗
Newsletter매주 1 회 · 한 편의 글→

© 2026 FOS Study. All posts MIT-licensed.

built with·Next.js·Tailwind v4·Geist·Pretendard·oklch

/fos-blog/categories/database/opensearch

DATABASE · OPENSEARCH

opensearch

8글·category/database/opensearch

READMEopensearch 시리즈에 대하여

README.md

README.md

OpenSearch(ElasticSearch 포크) 학습 기록. 매핑·샤딩·쿼리·RAG 검색 적용 주제.

입문

OpenSearch 기초 — 검색 엔진을 백엔드 관점에서 다루는 입문 가이드

색인 / 매핑

Mapping — 필드 타입, 분석기
Sharding — 프라이머리/레플리카 샤드 전략
Refresh Interval — 실시간성 vs 처리량 트레이드오프

분석기 / 플러그인

Analyzer 구조 (nori, ngram, tokenizer, token filter) — 한국어 형태소·자동완성·오타 보정의 빌딩 블록

쿼리와 성능

DFS Query Then Fetch — 검색 단계와 스코어링
OpenSearch를 벡터 DB로 굴리며 알게 된 것 — k-NN graph memory와 circuit breaker 운영 포인트
RAG 검색 품질 높이기 — Hybrid Search, Reranking, Sentence Window

관련 문서

Confluence 벡터 색인 배치 — OpenSearch를 RAG용 벡터 스토어로 쓴 실제 사례

02이 폴더의 글

8 posts

[초안] OpenSearch 검색 품질을 좌우하는 analyzer 구조: nori, ngram, tokenizer, token filter 제대로 이해하기

검색 기능은 백엔드 엔지니어가 피할 수 없는 과제 중 하나다. 상품 검색, 로그 검색, 자동완성, 오타 보정, 다국어 처리 같은 요구사항이 쌓이다 보면 결국 Elasticsearch 혹은 OpenSearch 같은 검색 엔진을 도입하게 되고, 그 순간부터 "왜 이 키워드로는 안 나오지?", "왜 부분 일치가 이상하게 동작하지?", "왜 한글은 조사까지 걸리지...

[초안] OpenSearch 기초: 검색 엔진을 백엔드 관점에서 다루기

관계형 DB만으로 운영하다가 검색 기능이 본격적으로 필요해지는 순간이 꼭 온다. 다음 같은 요구가 쌓이면 LIKE '%...%' + 인덱스는 금세 깨진다. - 상품명 부분 일치 - 오타 허용 - 형태소 분석 - 한/영 혼용 - 가중치 기반 정렬 - 집계 (aggregation) - 파사드 필터 FULLTEXT 인덱스를 동원해도 한국어 형태소와 다국어 처리,...

DFS Query Then Fetch

검색 정확도(Relevance)를 높이기 위해 사용하는 검색 수행 모드(Search Type) 중 하나이다. 성능을 조금 희생(Round-trip 추가)하는 대신, 분산된 샤드들의 통계를 합산하여 정확한 전역 스코어를 계산하는 방식이다. OpenSearch의 기본 랭킹 알고리즘인 BM25는 TF-IDF 개념을 기반으로 동작한다 여기서 중요한 변수가 IDF(...

Mapping

- OpenSearch의 데이터 타입은 인덱스의 Mapping을 통해 결정 됨 - 데이터가 어떻게 저장되고 검색될지 결정하는 핵심 요소 - String Types: - text : 전문 검색(Full-text search)용. Analyzed - keyword : 정확한 값(Exact value)용. Not Analyzed - Numeric Types: -...

OpenSearch로 RAG 검색 품질 높이기 — Hybrid Search, Reranking, Sentence Window

RAG 파이프라인에서 OpenSearch를 검색 엔진으로 쓸 때, 순수 벡터 검색만으로는 한계가 있다. 실제로 구현된 코드를 분석하면서 검색 품질을 높이는 세 가지 기법을 정리해봤다. --- 벡터 검색(kNN)은 의미적으로 유사한 문서를 찾는 데 강하다. 그런데 사용자가 고유명사, 코드명, 오타가 섞인 키워드로 검색하면 벡터 유사도가 낮게 나오는 경우가 있...

OpenSearch를 벡터 DB로 굴리며 알게 된 것 — 벡터는 heap이 아니라 native에 산다

벡터 검색용 OpenSearch 클러스터의 모니터링 대시보드를 만들다가 이상한 걸 봤다. JVM heap 사용량이 12%밖에 안 됐다. "벡터 DB인데 메모리를 이것밖에 안 쓴다고?" 싶어 파봤더니, 정작 벡터는 heap이 아니라 off-heap native memory에 살고 있었다. 이 글의 결론을 먼저 적으면 이렇다. - OpenSearch의 벡터(H...

OpenSearch에서의 Sharding

간단하게 얘기하면 "HashMap의 동작 원리"를 떠올리면 이해가 가장 빠르다 OpenSearch의 샤딩은 단순히 데이터를 쪼개는 것이 아니라, 결정론적 알고리즘을 통해 데이터를 분산하고 다시 찾아낸다. 데이터가 어떤 샤드에 저장될지 결정하는 메커니즘인 라우팅 과정을 중심으로 설명해보자. OpenSearch가 "이 문서를 0번 샤드에 넣을지, 1번 샤드에...

Refresh Interval

OpenSearch의 근간인 Apache Lucene은 불변의 Segment 단위로 데이터를 저장한다. - 1. In-memory Buffer(메모리 버퍼): - 데이터가 들어오면 가장 먼저 메모리 버퍼에 쌓인다. - 동시에 데이터 유실 방지를 위해 Translog에도 기록된다. - 이 상태에서는 아직 검색(Search)이 불가능하다 - 2. Refresh...