fos-blog/study
01 / 홈02 / 카테고리03 / 시리즈
01 / 홈02 / 카테고리03 / 시리즈

카테고리

  • AI 페이지로 이동
    • RAG 페이지로 이동
    • langgraph 페이지로 이동
    • 사람용 CLI와 AI 에이전트용 CLI는 설계가 다르다
    • agents.md
    • BMAD Method — AI 에이전트로 애자일 개발하는 방법론
    • Claude Code 메모리: CLAUDE.md와 .claude/rules를 규칙으로 쓰는 법
    • Claude Code의 Skill 시스템 - 개발자를 위한 AI 자동화의 새로운 차원
    • Claude Code를 5주 더 쓴 결과 — 스킬·CLAUDE.md를 키워가는 방식
    • Claude Code를 11일 동안 쓴 결과 — 데이터로 본 나의 사용 패턴
    • Claude Code 멀티 에이전트 — Teams
    • AI 에이전트와 디자인의 새 컨벤션 — DESIGN.md, Google Stitch, Claude Design
    • Docling — IBM Research 의 문서 파싱 toolkit 상세 정리
    • 하네스 엔지니어링 실전 — 4인 에이전트 팀으로 코딩 파이프라인 구축하기
    • 하네스 엔지니어링 — 오래 실행되는 AI 에이전트를 위한 설계
    • 멀티모달 LLM (Multimodal Large Language Model)
    • AI 에이전트와 함께 MVP 만들기 — dooray-cli 사례
    • OpenClaw는 context와 memory를 어떻게 관리하나 — 나만의 에이전트를 구성하는 법
    • OpenClaw vs Hermes Agent — 갈아탈까 고민하며 정리한 비교
    • 스킬 문서를 신경망처럼 학습시킨다 — Microsoft SkillOpt 분석
  • ai 페이지로 이동
    • agent 페이지로 이동
    • [초안] AI 제품 백엔드 안정성 — 지연·비용·권한·관측·도구 실패·폴백/재시도/사람 에스컬레이션
    • [초안] LLM 평가 프레임워크: 골든셋, 회귀 테스트, LLM-as-a-judge, 사람 피드백 루프
  • algorithm 페이지로 이동
    • live-coding 페이지로 이동
    • 분산 계산을 위한 알고리즘
  • apartment 페이지로 이동
    • 구리 럭키아파트 24평 인테리어 레퍼런스 모음
  • architecture 페이지로 이동
    • [초안] 시니어 백엔드를 위한 API 설계 실전 스터디 팩 — REST · 멱등성 · 페이지네이션 · 버전 전략
    • [초안] API Versioning과 Backward Compatibility: 시니어 백엔드 관점 정리
    • 캐시 설계 전략 총정리
    • [초안] 커머스 Spring 서비스에 Clean/Hexagonal Architecture를 실용적으로 적용하기
    • [초안] 커머스 도메인 모델링: 주문·재고·노출의 세 축을 분리해서 설계하기
    • 커머스 주문 상태와 데이터 정합성 기본기
    • [초안] 쿠폰/프로모션 동시성과 정합성 기본기 — 선착순·중복 사용 방지·발급/사용/복구
    • [초안] DDD와 도메인 모델링: 시니어 백엔드 관점의 전술/전략 패턴 실전 가이드
    • [초안] Decorator & Chain of Responsibility — 행동을 체인으로 조립하는 두 가지 방식
    • 디자인 패턴
    • [초안] 분산 아키텍처 완전 정복: Java 백엔드 시니어 인터뷰 대비 실전 가이드
    • [초안] 분산 트랜잭션과 Outbox 패턴 — 왜 2PC를 피하고 어떻게 대신할 것인가
    • 분산 트랜잭션
    • [초안] e-Commerce 주문·결제 도메인 모델링: 상태머신, 멱등성, Outbox/Saga 실전 정리
    • [초안] Event Sourcing과 CQRS — 상태가 아니라 변화를 저장한다는 발상
    • [초안] F&B 쿠폰·프로모션·멤버십·포인트 설계
    • [초안] F&B · e-Commerce 디지털 채널 도메인 한 장 정리
    • [초안] F&B 주문/매장/픽업 상태머신 설계
    • [초안] F&B 이커머스 결제·환불·정산 운영 가이드
    • [초안] Hexagonal / Clean Architecture를 Spring 백엔드에 적용하기
    • [초안] 대규모 커머스 트래픽 처리 패턴 — 대규모 회원과 메가 프로모션을 버티는 설계
    • [초안] 레거시 JSP/jQuery 화면과 신규 API가 공존하는 백엔드 운영 전략
    • [초안] MSA 서비스 간 통신: Redis [Cache-Aside](../database/redis/cache-aside.md) × Kafka 이벤트 하이브리드 설계
    • [초안] Observability 입문: 시니어 백엔드가 장애를 탐지하고 대응하는 방식
    • [초안] Outbox / Inbox Pattern 심화 — 분산 메시징의 정합성 문제를 DB 트랜잭션으로 풀어내기
    • [초안] 결제 도메인 멱등성과 트랜잭션 재시도 기본기
    • [초안] 시니어 백엔드를 위한 Resilience 패턴 실전 가이드 — Timeout, Retry, Circuit Breaker, Bulkhead, Backpressure
    • [초안] REST API 버저닝과 모바일 앱 하위 호환성 — 디지털 채널 백엔드 관점
    • [초안] Spring Batch vs Event-Driven — 같은 비동기처럼 보이지만 전혀 다른 두 패러다임
    • [초안] Strategy Pattern — 분기문을 없애는 설계, 시니어 백엔드 인터뷰 핵심 패턴
    • [초안] 시니어 백엔드를 위한 시스템 설계 입문 스터디 팩
    • [초안] 템플릿 메서드 패턴 - 백엔드 처리 골격을 강제하는 가장 오래되고 가장 위험한 패턴
    • [초안] 대규모 트래픽 중 무중단 마이그레이션 — Feature Flag + Shadow Mode 실전
  • database 페이지로 이동
    • milvus 페이지로 이동
    • mysql 페이지로 이동
    • opensearch 페이지로 이동
    • redis 페이지로 이동
    • 김영한의-실전-데이터베이스-설계 페이지로 이동
    • [초안] DB Connection Pool Saturation과 Thread Pool 격리
    • 커넥션 풀 크기는 얼마나 조정해야 할까?
    • 인덱스 - DB 성능 최적화의 핵심
    • [초안] JPA N+1과 커머스 조회 모델: 주문/메뉴/쿠폰 도메인에서 살아남기
    • [초안] MyBatis 기본기 — XML Mapper, resultMap, 동적 SQL, 운영 패턴 정리
    • [초안] MyBatis와 JPA/Hibernate 트레이드오프 — 레거시 백엔드를 다루는 시니어 관점
    • 벡터 DB 어떻게 고를까 — OpenSearch · Milvus · Qdrant · Vespa 비교
    • 벡터 DB를 실제로 도입한 사례 — 빅테크 프로덕션
    • 역정규화 (Denormalization)
    • 데이터 베이스 정규화
  • devops 페이지로 이동
    • docker 페이지로 이동
    • k8s 페이지로 이동
    • k8s-in-action 페이지로 이동
    • observability 페이지로 이동
    • [초안] 커머스/F&B 채널 장애 첫 5분과 관측성 기본기
    • [초안] 운영 데이터 정합성 장애 대응 — 결제 취소 누락과 중복 적재 런북
    • Envoy Proxy
    • [초안] F&B / e-Commerce 운영 장애 대응과 모니터링 — 백엔드 관점 정리
    • Graceful Shutdown
    • [초안] 시니어 백엔드를 위한 SLO와 Error Budget 기반 장애 대응
  • http 페이지로 이동
    • HTTP Connection Pool
    • HTTPS는 어떻게 안전한가 — TLS, 인증서, 그리고 termination
  • interview 페이지로 이동
    • [초안] AI 서비스 팀 경험 기반 시니어 백엔드 면접 질문 뱅크 — Spring Batch RAG / gRPC graceful shutdown / 전략 패턴 / 12일 AI 웹툰 MVP
    • Observability — 면접 답변 프레임
    • [초안] 시니어 Java 백엔드 면접 마스터 플레이북 — 김병태
    • [초안] NSC 슬롯팀 경험 기반 질문 은행 — 도메인 모델링·동시성·성능·AI 협업
  • java 페이지로 이동
    • concurrency 페이지로 이동
    • jdbc 페이지로 이동
    • opentelemetry 페이지로 이동
    • spring 페이지로 이동
    • spring-batch 페이지로 이동
    • 더_자바_코드를_조작하는_다양한_방법 페이지로 이동
    • [초안] Java 동시성 락 정리 — 커머스 메뉴/프로모션 정책 캐시 갱신 관점
    • [초안] JVM 튜닝 실전: 메모리 구조부터 Virtual Threads, GC 튜닝, 프로파일링까지
    • Java의 로깅 환경
    • MDC (Mapped Diagnostic Context)
    • Java StampedLock — 읽기 폭주에도 쓰기가 밀리지 않는 락
    • Virtual Thread와 Project Loom
  • javascript 페이지로 이동
    • typescript 페이지로 이동
    • AbortController
    • Async Iterator와 제너레이터
    • CommonJS와 ECMAScript Modules
    • 제너레이터(Generator)
    • Http Client
    • Node 백엔드 운영 패턴 — Streams 백프레셔, pipe/pipeline, 멱등성 vs 분산 락
    • Node.js
    • npm vs pnpm — 어떤 기준으로 선택했나
    • `setImmediate()`
  • kafka 페이지로 이동
    • [초안] Kafka 기본 개념 — 토픽, 파티션, 오프셋, 복제
    • Kafka를 사용하여 **데이터 정합성**은 어떻게 유지해야 할까?
    • [초안] Kafka 실전 설계: 파티션 전략, 컨슈머 그룹, 전달 보장, 재시도, 순서 보장 트레이드오프
    • 메시지 전송 신뢰성
    • [초안] Spring Kafka 컨슈머 오프셋 커밋과 트랜잭션 정렬: AckMode, manual ack, 멱등 처리
  • linux 페이지로 이동
    • fsync — 리눅스 파일 동기화 시스템 콜
    • tmux — Terminal Multiplexer
  • mlops 페이지로 이동
    • Python CUDA 버전 생태계 — nvidia-smi, nvcc, pip, conda가 다 다른 버전을 말하는 이유
    • GPU 컨테이너의 CUDA 버전 호환성 — nvidia-smi부터 이미지 다이어트까지
    • Kubernetes GPU 노드에서 /run tmpfs가 꽉 차서 Pod가 안 뜰 때
    • GPU·CUDA·MPS 기초 — 자바 백엔드 개발자가 처음 만나는 그림
    • Multi-process GPU 워크로드 — 자바 ThreadPool 사용자가 만나는 모델 차이
    • ML 서비스 성능 분석 워크플로 — 자바 백엔드 트러블슈팅과 다른 점
    • 한 GPU 를 여러 프로세스가 나눠 쓰기 — Time-Slicing 과 MPS
  • network 페이지로 이동
    • L2(스위치)와 L3(라우터)의 역할 차이
    • L4와 VIP(Virtual IP Address)
    • IP Subnet
  • python 페이지로 이동
    • Python async/await — CompletableFuture·Reactor 와 다른 점, 그리고 blocking I/O 함정
    • Python 의존성 관리 — Java Maven/Gradle 사용자가 만나는 첫 충격
    • FastAPI 기초 — Spring Boot 사용자가 빠르게 익히는 법
    • Java 개발자를 위한 Python 심화 — OOP·데코레이터·컨텍스트 매니저
    • PyTorch 기초 — 텐서, 디바이스, 그리고 모델 로딩이 무거운 이유
    • Java 개발자를 위한 Python 문법 핵심
    • OCR 동작 원리 — Layout · Text · Post-process 3단계
    • Python 서버의 RSS 가 안 줄어드는 이유 — gc.collect 의 한계와 malloc_trim
  • rabbitmq 페이지로 이동
    • [초안] RabbitMQ Basics — 실전 백엔드 관점에서 정리하는 메시지 브로커 기본기
    • [초안] RabbitMQ vs Kafka — 백엔드 메시징 선택 기준과 실전 운영 관점
  • security 페이지로 이동
    • [초안] 시니어 백엔드를 위한 보안 / 인증 스터디 팩 — Spring Security, JWT, OAuth2, OWASP Top 10
    • [초안] Spring Security 6.x OAuth2 + JWT 상용 인증 설계 — Grant 선택, Resource Server, Refresh Rotation, 로그아웃
  • task 페이지로 이동
    • ai-service-team 페이지로 이동
    • nsc-slot 페이지로 이동
    • sb-dev-team 페이지로 이동
    • the-future-company 페이지로 이동
  • testing 페이지로 이동
    • [초안] 시니어 Java 백엔드를 위한 테스트 전략 완전 정리 — 피라미드부터 TestContainers, 마이크로벤치, Contract까지
  • travel 페이지로 이동
    • 오사카 3박 4일 일정표: 우메다 쇼핑, USJ, 난바·도톤보리, 오사카성
  • web 페이지로 이동
    • [초안] HTTP / Cookie / Session / Token 인증 기본기 — 레거시 JSP와 모바일 API가 공존하는 백엔드 관점
FOS-BLOG · FOOTERall systems normal·v0.1 · 2026.04.27·seoul, kr
Ffos-blog/study

개발 학습 기록을 정리하는 블로그입니다. 공부하면서 기록하고, 기록하면서 다시 배웁니다.

visitors
01site
  • Home↗
  • Posts↗
  • Categories↗
  • About↗
02policy
  • 소개/about
  • 개인정보처리방침/privacy
  • 연락처/contact
03categories
  • AI↗
  • Algorithm↗
  • DB↗
  • DevOps↗
  • Java/Spring↗
  • JS/TS↗
  • React↗
  • Next.js↗
  • System↗
04connect
  • GitHub@jon890↗
  • Source repositoryjon890/fos-study↗
  • RSS feed/rss.xml↗
  • Newsletter매주 1 회 · 한 편의 글→
© 2026 FOS Study. All posts MIT-licensed.
built with·Next.js·Tailwind v4·Geist·Pretendard·oklch
fos-blog/database/OpenSearch vs Milvus — 벡…
db

OpenSearch vs Milvus — 벡터 검색, 무엇이 어떻게 다른가

RAG 를 OpenSearch 의 k-NN 으로 운영하다가 전용 벡터 DB 인 Milvus 로 옮길지 검토하면서, 두 제품을 아키텍처부터 검색·메모리·운영까지 1:1 로 뜯어봤다. 4제품을 훑는 선택 가이드와 달리, 이 글은 실제로 저울에 올린 두 후보를 깊게 대조한다. 한 줄 요약 — 검색 품질은 사실상 동등하고, 진짜 차이는 아키텍처 철학(범용 검색엔진...

2026.06.18·6 min read·5 views

RAG 를 OpenSearch 의 k-NN 으로 운영하다가 전용 벡터 DB 인 Milvus 로 옮길지 검토하면서, 두 제품을 아키텍처부터 검색·메모리·운영까지 1:1 로 뜯어봤다. 4제품을 훑는 선택 가이드와 달리, 이 글은 실제로 저울에 올린 두 후보를 깊게 대조한다.

한 줄 요약 — 검색 품질은 사실상 동등하고, 진짜 차이는 아키텍처 철학(범용 검색엔진 vs 전용 분산 DB)과 기능의 폭이다.


출발점이 다르다

  • OpenSearch — Elasticsearch 계열의 범용 검색·분석 엔진. 원래 텍스트 검색(역색인, BM25)이 본업이고, 여기에 k-NN 플러그인으로 벡터 검색을 얹었다. 벡터는 knn_vector 필드 타입으로 들어간다.
  • Milvus — 처음부터 벡터를 위해 설계된 전용 분산 DB. 컴포넌트를 잘게 쪼개고 저장과 연산을 분리했다.

이 출발점 차이가 아래 모든 차이의 뿌리다.


아키텍처와 노드 역할

OpenSearch

  • Master node — 클러스터 상태·메타 관리(샤드 할당 등). 데이터를 직접 검색하지 않는다.
  • Data node — 샤드를 보관하고 색인·검색을 실제로 수행. 벡터도 여기 메모리에 올라간다.
  • Coordinating node — 요청을 받아 data node 에 분산하고 결과를 합친다.
  • 데이터는 인덱스 → 샤드 단위로 나뉘고, 각 data node 가 자기 샤드를 책임진다. 저장과 연산이 같은 노드에 묶여 있다.

Milvus

저장(storage)과 연산(compute)을 완전히 분리한 게 핵심이다.

  • Proxy — 요청 진입점(무상태).
  • Coordinator — 일명 MixCoord, 두뇌 역할. 스케줄링·메타·일관성을 맡고 데이터 메모리는 거의 안 짊어진다.
  • QueryNode — 영속화된 과거 데이터(sealed segment) 검색. 벡터 메모리의 주력.
  • StreamingNode — 최신 인입 데이터(growing segment) 검색.
  • DataNode — 컴팩션·인덱스 빌드.
  • Storage — etcd(메타) + Object Storage(벡터 원본) + WAL.
관점OpenSearchMilvus
설계범용 검색엔진 + 벡터 플러그인전용 벡터 DB
저장·연산같은 노드(data node)에 결합분리(QueryNode 연산 / S3 저장)
메타 관리master nodeCoordinator + etcd
데이터 단위인덱스/샤드collection/partition/segment

벡터는 어떤 노드가 메모리에 들고 있나

전환을 검토하며 가장 헷갈렸던 지점이다. 결론은 둘 다 master/coordinator 가 아니다.

  • OpenSearch — data node 가 자기 샤드의 벡터를 메모리(주로 off-heap, faiss/lucene)에 올려 검색한다.
  • Milvus — QueryNode 가 sealed segment 의 벡터를 메모리에 로드해 검색한다. 평소 원본은 Object Storage(S3)에 있다가 검색을 위해 로드된다.

차이는 확장 방식이다. OpenSearch 는 검색 부하가 늘면 data node 를 늘리고 샤드를 리밸런싱한다(저장과 연산이 같이 움직인다). Milvus 는 저장은 그대로 두고 QueryNode 만 늘려 검색 메모리·연산을 분산한다. 검색만 따로 키우기는 Milvus 쪽이 깔끔하다.


인덱스 선택지

OpenSearchMilvus
HNSW◎ (lucene / faiss / nmslib)◎
IVF 계열◎ (faiss)◎
DiskANN(온디스크)△◎
GPU 인덱스✗◎
양자화(PQ/SQ)○◎

기본 HNSW 는 둘 다 잘 된다. 벌어지는 지점은 대규모·메모리 제약일 때다 — DiskANN(그래프를 디스크에 두고 일부만 메모리), GPU 인덱스가 Milvus 에만 있다. 다만 이건 수억 벡터·초고QPS 에서 의미가 크고, 수천만 규모에선 둘 다 HNSW 로 충분하다.


검색 기능 — RAG 관점

기능OpenSearchMilvus
dense ANN◎◎
하이브리드(키워드+벡터)◎◎
학습형 sparse(SPLADE)✗◎
multi-vector✗◎
메타데이터 필터링◎◎

둘 다 dense + 키워드(BM25) 하이브리드는 된다. Milvus 만 있는 건 두 가지다. 하나는 학습형 sparse — SPLADE 처럼 BM25 를 넘는 신경망 희소 임베딩이다. 다른 하나는 multi-vector — 한 컬렉션에 여러 벡터 필드를 두고 함께 검색·reranking 하는 기능이다. 이게 필요 없다면 OpenSearch 로도 충분하고, 필요하다면 Milvus 가 앞선다.


한국어 처리

한국어는 띄어쓰기만으로 단어가 안 갈려서 형태소 분석이 필수다.

  • OpenSearch — nori (nori_tokenizer + nori_part_of_speech 필터)
  • Milvus — lindera + ko-dic(MeCab 한국어 사전) + korean_stop_tags 필터

같은 품사 태그 체계를 쓰기 때문에 설정이 거의 1:1 로 대응한다. 직접 같은 문장을 양쪽에 넣어보면, 조사·어미를 걸러낸 의미 토큰은 사실상 같았다. 오히려 복합명사는 lindera 쪽이 덜 쪼갰다("데이터베이스"를 통째로 vs nori 는 "데이터/베이스").


검색 품질 — 직접 비교해 봤다

로컬에 Milvus 와 OpenSearch 를 같이 띄우고, 같은 임베딩(bge-m3, 1024차원)과 같은 한국어 데이터(KorQuAD)로 비교했다.

먼저 recall 개념부터. recall@k 는 전수 비교로 찾은 진짜 최근접 k 개 중 근사 검색이 실제로 회수한 비율이다. ANN 은 빠른 대신 가끔 진짜 정답을 놓치므로 recall 이 1.0 보다 낮을 수 있다.

결과는 이랬다.

  • dense 검색 정합성 — 같은 임베딩이라 OpenSearch 와 Milvus 의 상위 결과가 약 95% 겹쳤다. 의미 검색 엔진으로서 사실상 동등하다는 뜻이다.
  • 하이브리드 recall — Milvus 하이브리드(dense + BM25, RRF 융합)가 0.99 대로 단일 모드보다 높았다.

즉 검색 품질에서 둘은 우열을 가리기 어렵다. 같은 벡터를 넣으면 같은 결과가 나온다.


메모리와 비용

벡터를 메모리에 올리는 비용은 양쪽 다 든다. 1,600만 벡터 × 1024차원이면 raw 약 68GB 다.

다만 풀 메모리가 강제는 아니다.

  • 양자화 — float32 → int8(SQ, 약 1/4) 또는 PQ(1/8 이상)로 줄인다. recall 을 조금 내주는 대신 메모리를 크게 아낀다.
  • 온디스크 — Milvus 는 DiskANN/mmap 으로 벡터를 디스크에 두고 일부만 메모리에 둘 수 있다. OpenSearch 도 디스크 기반 옵션이 있지만 선택지는 Milvus 가 넓다.
  • 저QPS 환경 — 검색이 초당 몇 건 수준이면 디스크 기반의 추가 지연을 충분히 감당한다. 굳이 다 메모리에 올릴 이유가 없다.

여기서 중요한 점 — 이 메모리 비용은 OpenSearch 로 운영 중이라면 이미 내고 있는 비용이다. Milvus 로 옮긴다고 새로 생기는 게 아니라, 오히려 줄일 선택지가 늘어난다.


운영과 확장

관점OpenSearchMilvus
운영 난이도중 (ELK 에 익숙하면 친숙)높음 (컴포넌트 다수: etcd·메시지 큐·S3·여러 노드)
확장data node 추가 + 샤드 리밸런싱컴포넌트별 독립 확장(QueryNode 만 등)
스키마 변경필드 타입 변경 불가 → 재색인·alias 전환상대적으로 유연
생태계크고 성숙(ELK)큼(LangChain·LlamaIndex 등 LLM 친화)

OpenSearch 는 이미 쓰던 팀이라면 학습 비용이 거의 없다는 게 강점이다. Milvus 는 분리 구조 덕에 확장은 유연하지만, self-host 하면 컴포넌트가 많아 운영이 무겁다(관리형 상품을 쓰면 이 부담은 상품이 흡수한다).


언제 무엇을

  • 이미 OpenSearch/ELK 를 운영 중이고, 하이브리드(키워드+벡터) 수준이면 충분 → OpenSearch 유지가 합리적. 새 시스템 비용이 없다.
  • 학습형 sparse·multi-vector·GPU·대규모 분산 같은 기능이 필요하거나, 벡터를 1급으로 다루고 싶다 → Milvus.
  • 수천만 벡터 이하라면 성능은 변별점이 아니다. 둘 다 충분하니 기능과 운영으로 고르면 된다.

정리

  • 검색 품질은 같은 임베딩이면 사실상 동등하다(직접 비교 시 dense 결과 약 95% 일치).
  • 한국어도 nori ↔ lindera ko-dic 으로 거의 1:1 대응한다.
  • 메모리는 OpenSearch 의 data node, Milvus 의 QueryNode 가 담당한다 — master/coordinator 가 아니다.
  • 진짜 차이는 **아키텍처 철학(결합 vs 분리)과 기능의 폭(학습형 sparse·multi-vector·GPU)**이다.
  • 수천만 규모에선 성능이 아니라 기능·운영·생태계가 선택을 가른다.

벡터 DB 일반론과 다른 후보까지 보려면 벡터 DB 선택 가이드를, Milvus 내부 동작이 궁금하면 Milvus 아키텍처 글을 참고.


참고 링크

  • Milvus Architecture Overview
  • OpenSearch k-NN
  • Milvus vs OpenSearch (Zilliz)
  • Milvus Index Explained
on this page
  • 01출발점이 다르다
  • 02아키텍처와 노드 역할
  • OpenSearch
  • Milvus
  • 03벡터는 어떤 노드가 메모리에 들고 있나
  • 04인덱스 선택지
  • 05검색 기능 — RAG 관점
  • 06한국어 처리
  • 07검색 품질 — 직접 비교해 봤다
  • 08메모리와 비용
  • 09운영과 확장
  • 10언제 무엇을
  • 11정리
  • 12참고 링크

이런 글도

  • 벡터 DB를 실제로 도입한 사례 — 빅테크 프로덕션
    벡터 DB를 공부하다 보면 "실제 큰 서비스가 전용 벡터 DB를 운영에 올린 사례"가 궁금하다. ANN 라이브러리(FAISS·Annoy)나 임베딩 모델이 아니라, 벡터 DB 제품을 프로덕션에 도입한 사례를 회사 엔지니어링 블로그(1차 출처) 중심으로 모았다. | 회사 | 도입 | 규모 | use case | | --- | --- | --- | --- | |...
    🗄️ db
    db
    2026.06.18
  • 벡터 DB 어떻게 고를까 — OpenSearch · Milvus · Qdrant · Vespa 비교
    RAG 를 만들면 임베딩한 벡터를 어딘가에 저장하고 검색해야 한다. 처음엔 쓰던 검색엔진(OpenSearch)에 벡터 기능을 얹어 시작했는데, 전용 벡터 DB 로 옮길지 고민이 생기면서 후보들을 제대로 비교해 봤다. 결론부터 말하면, 규모가 크지 않으면 뭘 골라도 성능은 충분하고 선택을 가르는 건 성능이 아니라 기능과 운영이라는 것이었다. 이 글은 Open...
    🗄️ db
    db
    2026.06.18
  • Milvus 벡터 데이터베이스 입문 — 아키텍처와 동작, 그리고 실무 규모에서의 성능
    RAG 시스템을 OpenSearch 의 k-NN 으로 운영해 오다가, 전용 벡터 데이터베이스인 Milvus 를 본격적으로 들여다볼 일이 생겼다. 막상 공부해 보니 일반적인 DB 와 구조가 꽤 달랐다. 컴포넌트가 예닐곱 개로 쪼개져 있고, "storage 와 compute 를 분리했다"는 말이 핵심이라는데 처음엔 그게 왜 중요한지 잘 와닿지 않았다. 이 글은...
    🗄️ db
    db
    2026.06.18
  • [초안] Redis Streams 소비자 그룹 신뢰성 — PEL, 재할당, 멱등성까지
    > 이 문서는 Redis Streams의 소비자 그룹(Consumer Group)이 어떻게 메시지 유실 없이 분산 처리를 보장하는가를 운영·장애 관점에서 정리한다. Stream의 기본 명령어와 Pub/Sub과의 비교는 pub-sub.md에 이미 있으므로, 본 문서는 그 위에서 한 단계 더 들어간다 — 소비자가 죽었을 때 메시지는 어디에 남고, 누가 다시 처...
    🗄️ db
    db
    2026.06.11

댓글 (0)