fos-blog/study
01 / 홈02 / 카테고리
01 / 홈02 / 카테고리

카테고리

  • AI 페이지로 이동
    • RAG 페이지로 이동
    • langgraph 페이지로 이동
    • agents.md
    • BMAD Method — AI 에이전트로 애자일 개발하는 방법론
    • Claude Code의 Skill 시스템 - 개발자를 위한 AI 자동화의 새로운 차원
    • Claude Code를 5주 더 쓴 결과 — 스킬·CLAUDE.md를 키워가는 방식
    • Claude Code를 11일 동안 쓴 결과 — 데이터로 본 나의 사용 패턴
    • Claude Code 멀티 에이전트 — Teams
    • AI 에이전트와 디자인의 새 컨벤션 — DESIGN.md, Google Stitch, Claude Design
    • 하네스 엔지니어링 실전 — 4인 에이전트 팀으로 코딩 파이프라인 구축하기
    • 하네스 엔지니어링 — 오래 실행되는 AI 에이전트를 위한 설계
    • 멀티모달 LLM (Multimodal Large Language Model)
    • AI 에이전트와 함께 MVP 만들기 — dooray-cli 사례
  • ai 페이지로 이동
    • agent 페이지로 이동
  • algorithm 페이지로 이동
    • live-coding 페이지로 이동
    • 분산 계산을 위한 알고리즘
  • architecture 페이지로 이동
    • [초안] 시니어 백엔드를 위한 API 설계 실전 스터디 팩 — REST · 멱등성 · 페이지네이션 · 버전 전략
    • [초안] API Versioning과 Backward Compatibility: 시니어 백엔드 관점 정리
    • 캐시 설계 전략 총정리
    • [초안] CJ푸드빌 커머스/F&B 도메인 설계 면접 대비 — 슬롯 경험을 주문·결제·쿠폰·매장 상태 설계로 번역하기
    • [초안] 커머스 Spring 서비스에 Clean/Hexagonal Architecture를 실용적으로 적용하기
    • [초안] 커머스 주문 상태와 데이터 정합성 기본기 — CJ푸드빌 면접 대비
    • [초안] 쿠폰/프로모션 동시성과 정합성 기본기 — 선착순·중복 사용 방지·발급/사용/복구
    • [초안] DDD와 도메인 모델링: 시니어 백엔드 관점의 전술/전략 패턴 실전 가이드
    • [초안] Decorator & Chain of Responsibility — 행동을 체인으로 조립하는 두 가지 방식
    • 디자인 패턴
    • [초안] 분산 아키텍처 완전 정복: Java 백엔드 시니어 인터뷰 대비 실전 가이드
    • [초안] 분산 트랜잭션과 Outbox 패턴 — 왜 2PC를 피하고 어떻게 대신할 것인가
    • 분산 트랜잭션
    • [초안] e-Commerce 주문·결제 도메인 모델링: 상태머신, 멱등성, Outbox/Saga 실전 정리
    • [초안] F&B 쿠폰·프로모션·멤버십·포인트 설계
    • [초안] F&B · e-Commerce 디지털 채널 도메인 한 장 정리 — CJ푸드빌 디지털 채널 백엔드 면접 대비
    • [초안] F&B 주문/매장/픽업 상태머신 설계 — CJ푸드빌 디지털 채널 백엔드 관점
    • [초안] F&B 이커머스 결제·환불·정산 운영 가이드
    • [초안] Hexagonal / Clean Architecture를 Spring 백엔드에 적용하기
    • [초안] 대규모 커머스 트래픽 처리 패턴 — 1,600만 고객과 올영세일을 버티는 설계
    • [초안] 레거시 JSP/jQuery 화면과 신규 API가 공존하는 백엔드 운영 전략
    • [초안] MSA 서비스 간 통신: Redis [Cache-Aside](../database/redis/cache-aside.md) × Kafka 이벤트 하이브리드 설계
    • [초안] Observability 입문: 시니어 백엔드가 장애를 탐지하고 대응하는 방식
    • [초안] Outbox / Inbox Pattern 심화 — 분산 메시징의 정합성 문제를 DB 트랜잭션으로 풀어내기
    • [초안] 결제 도메인 멱등성과 트랜잭션 재시도 기본기
    • [초안] 시니어 백엔드를 위한 Resilience 패턴 실전 가이드 — Timeout, Retry, Circuit Breaker, Bulkhead, Backpressure
    • [초안] REST API 버저닝과 모바일 앱 하위 호환성 — CJ푸드빌 디지털 채널 백엔드 관점
    • [초안] Strategy Pattern — 분기문을 없애는 설계, 시니어 백엔드 인터뷰 핵심 패턴
    • [초안] 시니어 백엔드를 위한 시스템 설계 입문 스터디 팩
    • [초안] 템플릿 메서드 패턴 - 백엔드 처리 골격을 강제하는 가장 오래되고 가장 위험한 패턴
    • [초안] 대규모 트래픽 중 무중단 마이그레이션 — Feature Flag + Shadow Mode 실전
  • database 페이지로 이동
    • mysql 페이지로 이동
    • opensearch 페이지로 이동
    • redis 페이지로 이동
    • 김영한의-실전-데이터베이스-설계 페이지로 이동
    • 커넥션 풀 크기는 얼마나 조정해야 할까?
    • 인덱스 - DB 성능 최적화의 핵심
    • [초안] JPA N+1과 커머스 조회 모델: 주문/메뉴/쿠폰 도메인에서 살아남기
    • [초안] MyBatis 기본기 — XML Mapper, resultMap, 동적 SQL, 운영 패턴 정리
    • [초안] MyBatis와 JPA/Hibernate 트레이드오프 — 레거시 백엔드를 다루는 시니어 관점
    • 역정규화 (Denormalization)
    • 데이터 베이스 정규화
  • devops 페이지로 이동
    • docker 페이지로 이동
    • k8s 페이지로 이동
    • k8s-in-action 페이지로 이동
    • observability 페이지로 이동
    • [초안] 커머스/F&B 채널 장애 첫 5분과 관측성 기본기
    • Envoy Proxy
    • [초안] F&B / e-Commerce 운영 장애 대응과 모니터링 — 백엔드 관점 정리
    • Graceful Shutdown
  • finance 페이지로 이동
    • industry-cycle 페이지로 이동
    • investing 페이지로 이동
    • stock-notes 페이지로 이동
  • http 페이지로 이동
    • HTTP Connection Pool
  • interview 페이지로 이동
    • [초안] AI 서비스 팀 경험 기반 시니어 백엔드 면접 질문 뱅크 — Spring Batch RAG / gRPC graceful shutdown / 전략 패턴 / 12일 AI 웹툰 MVP
    • [초안] CJ푸드빌 디지털 채널 Back-end 개발자 직무 분석
    • [초안] CJ푸드빌 디지털 채널 Back-end 면접 답변집 — 슬롯 도메인 경험을 커머스/F&B 설계로 번역하기
    • [초안] F&B / e-Commerce 운영 모니터링과 장애 대응 인터뷰 정리
    • Observability — 면접 답변 프레임
    • [초안] 시니어 Java 백엔드 면접 마스터 플레이북 — 김병태
    • [초안] NSC 슬롯팀 경험 기반 질문 은행 — 도메인 모델링·동시성·성능·AI 협업
  • java 페이지로 이동
    • concurrency 페이지로 이동
    • jdbc 페이지로 이동
    • opentelemetry 페이지로 이동
    • spring 페이지로 이동
    • spring-batch 페이지로 이동
    • 더_자바_코드를_조작하는_다양한_방법 페이지로 이동
    • [초안] Java 동시성 락 정리 — 커머스 메뉴/프로모션 정책 캐시 갱신 관점
    • [초안] JVM 튜닝 실전: 메모리 구조부터 Virtual Threads, GC 튜닝, 프로파일링까지
    • Java의 로깅 환경
    • MDC (Mapped Diagnostic Context)
    • Java StampedLock — 읽기 폭주에도 쓰기가 밀리지 않는 락
    • Virtual Thread와 Project Loom
  • javascript 페이지로 이동
    • typescript 페이지로 이동
    • AbortController
    • Async Iterator와 제너레이터
    • CommonJS와 ECMAScript Modules
    • 제너레이터(Generator)
    • Http Client
    • Node 백엔드 운영 패턴 — Streams 백프레셔, pipe/pipeline, 멱등성 vs 분산 락
    • Node.js
    • npm vs pnpm — 어떤 기준으로 선택했나
    • `setImmediate()`
  • kafka 페이지로 이동
    • [초안] Kafka 기본 개념 — 토픽, 파티션, 오프셋, 복제
    • Kafka를 사용하여 **데이터 정합성**은 어떻게 유지해야 할까?
    • [초안] Kafka 실전 설계: 파티션 전략, 컨슈머 그룹, 전달 보장, 재시도, 순서 보장 트레이드오프
    • 메시지 전송 신뢰성
  • linux 페이지로 이동
    • fsync — 리눅스 파일 동기화 시스템 콜
    • tmux — Terminal Multiplexer
  • network 페이지로 이동
    • L2(스위치)와 L3(라우터)의 역할 차이
    • L4와 VIP(Virtual IP Address)
    • IP Subnet
  • rabbitmq 페이지로 이동
    • [초안] RabbitMQ Basics — 실전 백엔드 관점에서 정리하는 메시지 브로커 기본기
    • [초안] RabbitMQ vs Kafka — 백엔드 메시징 선택 기준과 실전 운영 관점
  • security 페이지로 이동
    • [초안] 시니어 백엔드를 위한 보안 / 인증 스터디 팩 — Spring Security, JWT, OAuth2, OWASP Top 10
  • task 페이지로 이동
    • ai-service-team 페이지로 이동
    • nsc-slot 페이지로 이동
    • sb-dev-team 페이지로 이동
    • the-future-company 페이지로 이동
  • testing 페이지로 이동
    • [초안] 시니어 Java 백엔드를 위한 테스트 전략 완전 정리 — 피라미드부터 TestContainers, 마이크로벤치, Contract까지
  • travel 페이지로 이동
    • 오사카 3박 4일 일정표: 우메다 쇼핑, USJ, 난바·도톤보리, 오사카성
  • web 페이지로 이동
    • [초안] HTTP / Cookie / Session / Token 인증 기본기 — 레거시 JSP와 모바일 API가 공존하는 백엔드 관점
FOS-BLOG · FOOTERall systems normal·v0.1 · 2026.04.27·seoul, kr
Ffos-blog/study

개발 학습 기록을 정리하는 블로그입니다. 공부하면서 기록하고, 기록하면서 다시 배웁니다.

visitors
01site
  • Home↗
  • Posts↗
  • Categories↗
  • About↗
02policy
  • 소개/about
  • 개인정보처리방침/privacy
  • 연락처/contact
03categories
  • AI↗
  • Algorithm↗
  • DB↗
  • DevOps↗
  • Java/Spring↗
  • JS/TS↗
  • React↗
  • Next.js↗
  • System↗
04connect
  • GitHub@jon890↗
  • Source repositoryjon890/fos-study↗
  • RSS feed/rss.xml↗
  • Newsletter매주 1 회 · 한 편의 글→
© 2026 FOS Study. All posts MIT-licensed.
built with·Next.js·Tailwind v4·Geist·Pretendard·oklch
fos-blog/AI/OpenSearch를 VectorStore로…
ai

OpenSearch를 VectorStore로 활용하기 위한 가이드

- OpenSearch는 원래 Elasticsearch에서 파생된 검색 엔진 기반 분산 데이터베이스 - 최근에는 벡터 검색(Vector Search) 기능이 강화되어 RAG 시스템에서 많이 쓰임 - 또 다른 활용으로는 추천 시스템, 이상 감지, 자연어 처리 등에도 사용 됨 - 자세한 내용은 - https://opensearch.org/platform/vec...

2026.01.30·5 min read·72 views
  • OpenSearch는 원래 Elasticsearch에서 파생된 검색 엔진 기반 분산 데이터베이스
  • 최근에는 벡터 검색(Vector Search) 기능이 강화되어 RAG 시스템에서 많이 쓰임
    • 또 다른 활용으로는 추천 시스템, 이상 감지, 자연어 처리 등에도 사용 됨
    • 자세한 내용은
      • https://opensearch.org/platform/vector-search/
  • 대규모, 정형화되어있지 않은 데이터셋, AI 애플리케이션을 위한 고성능 퍼포먼스를 제공함

1. OpenSearch 구조 간단 정리 (로그/매트릭이랑 같은 개념)

  • Cluster : OpenSearch 전체 집합 (보통 하나의 서비스 단위)
  • Node : 클러스터를 구성하는 서버 (인스턴스)
  • Index : 논리적인 데이터 묶음 (RDB로 치면 테이블 느낌)
  • Shard : 인덱스를 쪼갠 물리 단위 (실제 Lucene index), 샤드가 노드에 분산 저장됨
    • Primary shard
    • Replica shard (복제본, 장애 대비 + read 스케일 아웃)
  • 로그/매트릭 수집용으로 이미 이런 구조는 경험했음
    • logs-*, metrics-* 같은 인덱스들
    • 샤드 수, replicas 수 결정
    • Kibana / OpenSearch Dashboards로 검색/집계

벡터 검색도 똑같이 "인덱스"에 문서가 들어가고, 단지 필드 중 하나가 벡터(knn_vector)인 것뿐이다

2. 벡터용 OpenSearch: k-NN 플러그인 + knn_vector

벡터 검색을 하려면 OpenSearch의 k-NN 플러그인을 써야하고, 이 플러그인이 제공하는 knn_vector 필드 타입을 사용하게 됨

    1. knn_vector가 해주는 일
    • 문서에 고차원 벡터를 저장할 수 있게 해줌
    • 이 벡터들을 이용해 k-Nearest Neighbor 검색(가장 가까운 벡터들 찾기)을 수행
    • 내부적으로 HNSW 같은 Approximate k-NN 알고리즘으로 빠르게 탐색

즉, 일반 text 필드가 "키워드/문자열 검색"을 담당한다면, knn_vector 필드는 "의미적 유사도 기반 검색을 담당한다고 보면 됨

3. 벡터 인덱스를 만들 때 신경 쓸 것들

인덱스 생성시 필수 설정

json
{
    {
        "settings": {
            "index": {
                "knn": true // k-NN 기능 활성화
            }
        }
    },
    "mappings" :{
        "properties": {
            "embedding": {
                "type": "knn_vector"
                "dimension": 1536, // 임베딩 차원 수 (모델에 맞춰야 함)
                "method": {
                    "name" : "hnsw",
                    "space_type": "cosinesimil",
                    "engine": "nmslib",
                    "parameters": {
                        "ef_construction": 128,
                        "m": 16
                    }
                }
            }
            // .. other properties
        }
    }
}

중요한 포인트

  • index.knn: true
    • 이 인덱스에서 k-NN 검색을 하겠다고 선언하는 것
  • knn_vector.dimension
    • 사용 중인 임베딩 모델의 차원 수와 무조건 일치해야 함
    • 예: OpenAI text-embedding-3-small = 1536차원 -> dimension 1536

3. OpenSearch가 벡터 검색을 어떻게 수행하는가?

  • 벡터 검색 알고리즘은 주로 HNSW(Hierarchical Navigable Small World graph) 기반
    • HNSW 핵심 요약
      • 벡터 간 유사도를 차직 위한 그래프 구조
      • 수백만 벡터까지 빠름
      • 근사 최근접 탐색(ANN, Approximate Nearest Neighbor)
      • 정확도는 조금 떨어지지만 속도가 매우 빠름

4. OpenSearch를 벡터 스토어로 운영할 떄 중요한 점

  • 1. 데이터를 많이 넣을 떄 고려해야 하는 요소
    • OpenSearch는 "검색엔진"이라 대구모 데이터를 처리하려면 아래를 반드시 고려해야 함
    • 샤드 수 설정
      • 일반적으로 데이터량에 맞춰서 샤드를 결정해야 함
      • ~1M 문서 : 1 ~ 3 샤드
      • 10M 문서 : 3 ~ 6 샤드
      • 100M 문서 : 6 ~ 12 샤드
      • 1B 문서 : 20+
      • 샤드 수는 인덱스를 만들 떄만 결정 가능하니 신중해야 함
    • 복제본(Replicas) 설정
      • 추천 구조:
        • Primary Shard: 3 ~ 6
        • Replica : 1 (운영 필수)
      • Replica를 두면:
        • 노드 장애 시 검색이 유지 됨
        • 분산 검색 성능이 올라감
    • 노드 수 & 스펙 규모 확장
      • 대규모 embedding 저장 시 CPU 보다 메모리, 디스크 I/O가 훨씬 중요함
      • 권장 스펙:
        • RAM: 최소 32GB (아니면 evict 발생)
        • SDD NVMe
        • JVM Heap: RAM의 50% 이하
  • 2. 인덱스 성능 최적화 팁
    • Bulk API 사용
      • 1000 ~ 5000개 정도의 문서를 Batch로 넣기
      • -> 성능 10 ~ 20배 증가
    • Refresh Interval 늘리기
      • 기본값 1초 -> 30초로 늘리기 (쓰기 성능 급상승)
    • replicas=0 로 먼저 넣고 나중에 늘리기
      • 레플리카 복제 비용이 줄어 성능이 대폭 증가

5. 검색 품질을 위한 알고리즘 선택

벡터 검색 품질은 아래 두 요소로 결정됨

  1. Similarity Metric (코사인 vs L2 vs dot)
  2. Indexing method (HNSW)
  • 1. Similarity Metric 선택법
    • 문서 검색 : cosine_similarity
    • 이미지/멀티모달 : dot_product
    • 유사도 기반 RAG : cosine
  • 2. HNSW 파라미터 튜닝
    • ef_construction : 인덱싱 정확도
      • 높을수록 정확하지만 느림
    • ef_search : 검색 정확도
      • 높을수록 recall 증가
    • m : 그래프 branching factor
      • 메모리 사용량 영향
    • 추천값
      • ef_construction: 128 ~ 256
      • ef_search: 40 ~ 200
      • m: 16 ~ 32
    • RAG 서비스라면 ef_search를 높일수록 "정확한 문서"를 찾게 됨

5. 검색 품질을 더 올리기 위한 실전 팁

사실 embedding + vector search만으로는 검색 품질이 100% 나오지 않음 그래서 대규모 서비스는 다음을 조합함

  • 1. Hybrid Search(BM25 + Vector)
    • BM25(키워드 검색)와 벡터 검색을 합친 방식
    • 예
      • score = 0.7 * vector_score + 0.3 * bm25_score
    • 결과
      • 오타/키워드 검색 강해짐
      • 문맥 검색도 가능함
      • RAG 품질 대폭 상승
    • OpenSearch 2.x에서 공식 지원
  • 2. Reranking(re-ranking 모델 적용)
    • 검색 결과 Top N개를 가져온 다음, LLM 또는 corss-encoder 모델로 다시 랭킹
    • Vector Search -> Top 200 전달 -> Reranker -> Top 5 추출
    • 검색 품질이 극적으로 개선됨
  • 3. Chunking 전략 조정
    • RAG의 핵심은 "적절한 청크 크기"
    • 추천
      • 청크 크기 : 200 ~ 500 tokens
      • overlap : 20 ~ 30%
    • 문서가 가벼우면 더 작게 나눠도 좋음
on this page
  • 011. OpenSearch 구조 간단 정리 (로그/매트릭이랑 같은 개념)
  • 022. 벡터용 OpenSearch: k-NN 플러그인 + `knn_vector`
  • 3. 벡터 인덱스를 만들 때 신경 쓸 것들
  • 033. OpenSearch가 벡터 검색을 어떻게 수행하는가?
  • 044. OpenSearch를 벡터 스토어로 운영할 떄 중요한 점
  • 055. 검색 품질을 위한 알고리즘 선택
  • 065. 검색 품질을 더 올리기 위한 실전 팁

댓글 (0)