벡터 DB를 공부하다 보면 "실제 큰 서비스가 전용 벡터 DB를 운영에 올린 사례"가 궁금하다. ANN 라이브러리(FAISS·Annoy)나 임베딩 모델이 아니라, 벡터 DB 제품을 프로덕션에 도입한 사례를 회사 엔지니어링 블로그(1차 출처) 중심으로 모았다. | 회사 | 도입 | 규모 | use case | | --- | --- | --- | --- | |...
벡터 DB를 공부하다 보면 "실제 큰 서비스가 전용 벡터 DB를 운영에 올린 사례"가 궁금하다. ANN 라이브러리(FAISS·Annoy)나 임베딩 모델이 아니라, 벡터 DB 제품을 프로덕션에 도입한 사례를 회사 엔지니어링 블로그(1차 출처) 중심으로 모았다.
| 회사 | 도입 | 규모 | use case |
|---|---|---|---|
| LINE VOOM | Milvus | — | 실시간 추천 |
| Milvus | 3.4억 벡터 | 게시물 검색·추천 | |
| TripAdvisor | Qdrant | 10억+ 벡터 | 멀티모달 검색 |
| eBay | Vertex AI Vector Search | 리스팅 19억+ | 광고 추천 |
| Vinted | Vespa | — | 추천 retrieval(FAISS 대체) |
| Notion | Turbopuffer | 100억+ 벡터 | RAG Q&A |
| Amazon Music | OpenSearch | 10.5억 벡터 | 음악 추천 |
| Adobe Acrobat | OpenSearch | 수억 사용자 | RAG 인용·출처 |
| 우아한형제들(배민) | pgvector(RDS) | — | 위치 기반 추천 |
LINE 의 숏폼 피드 VOOM 은 실시간 추천에 Milvus 를 도입했다. 오프라인 배치(최대 하루 지연)에서 온라인 즉시 유사도 검색으로 바꿔, 당일 게시물의 당일 노출이 크게 늘었다. Qdrant 와 비교해(2,406 req/s vs 326 req/s, 인덱스 10종 vs 1종, storage-compute 분리) Milvus 를 골랐고, 2년 넘게 프로덕션 운영 중이다.
Reddit 은 11개 후보를 검토하고 Qdrant 와 Milvus 를 정량 평가했다(3.4억 벡터·384차원). 순수 성능은 Qdrant 가 앞섰지만, 복제 확장성·운영성·조직 역량을 이유로 Milvus 를 택했다(Go 기반이라 팀 스택과 맞았다). 성능 1등이 곧 선택은 아니라는 대표 사례다.
리뷰와 이미지를 합친 10억+ 멀티모달 벡터(업체 1,100만)를 Qdrant 로 서빙한다. LINE·Reddit 과 달리 Qdrant 를 택했다 — 정답이 하나가 아님을 보여준다.
eBay 의 광고 추천(Recs) 팀이 딥러닝 시맨틱 임베딩 검색에 Google Cloud 의 관리형 Vertex AI Vector Search 를 도입했다. 카탈로그 19억+ 리스팅, 초당 수천 TPS, p95 읽기 지연 4ms 미만(벤더 케이스 스터디 수치).
유럽 최대 중고 패션 마켓 Vinted 는 개인화 홈 추천 retrieval 에 Vespa 를 도입하며 기존 FAISS 를 대체했다. FAISS 가 실시간 업데이트와 메타데이터 pre-filtering 을 못 해, 필터링이 후처리로 밀리는 문제를 풀기 위해서다. (전사 제거가 아니라 추천 retrieval 워크로드 한정 교체)
Notion 은 2023년 출시한 AI Q&A(워크스페이스 RAG)의 벡터 워크로드를 object-storage-first 벡터 DB 인 Turbopuffer 로 옮겼다(100억+ 벡터). 전용 pod → 서버리스 → Turbopuffer 로 단계 전환하며 비용을 크게 줄였다(자체 보고).
앞서 "OpenSearch 도입 사례가 잘 안 보인다"고 했지만, 대규모 named 사례가 분명히 있다. 다만 전용 벡터 DB 처럼 "새로 도입"이 아니라 기존 검색 인프라를 확장한 형태다.
우리 사내 RAG 도 OpenSearch 기반이라, 이 둘이 가장 직접적인 대규모 프로덕션 근거다.
참고: Uber 도 OpenSearch 로 15억+ 아이템(약 400차원) 벡터 검색을 다뤘는데, 자체 블로그가 이를 "2024년 프로토타입"으로 명시한다. 대규모 사례지만 "프로덕션 도입"으로 분류하긴 이르다.
배민 추천 프로덕트팀은 실시간 위치 기반 가게 추천에 벡터 검색을 도입하며, 2단계 평가(1차: Milvus·Redis·MongoDB·OpenSearch / 2차: MongoDB·OpenSearch·pgvector) 끝에 Amazon RDS for PostgreSQL 의 pgvector 를 택했다.
핵심은 "배달 가능한 가게"라는 강한 pre-filtering 요구였다. 위치로 후보를 강하게 걸러야 해서 순수 ANN 의 이점이 줄었고, 이미 운영하던 RDS 에 여유가 있어 pgvector 가 합리적이었다. Pinecone 같은 상용 관리형 대신 기존 인프라와 OSS 를 우선한 것이다.
이건 우리 멀티테넌시 고민과도 통한다 — 필터링이 강하면 "순수 벡터 성능"보다 "필터 + 기존 스택 적합성"이 선택을 가른다.
같은 "벡터 검색"이라도 전용 DB 제품 도입과 라이브러리 자체 서빙은 다르다. 다음은 후자라 위 목록에서 뺐다.
벡터 DB 자체를 더 보려면 Milvus 아키텍처와 벡터 DB 선택 가이드를 참고.