목표
핵심 역할
문서 수집/벡터화 -> 벡터 스토어 관리 -> 쿼리 시 검색 -> 적절한 모델 선택/호출 -> 응답 조립 후 반환
[Client(App/Web)]
|
v
[API Gateway / Spring RAG API] --(Auth, Rate Limit)
|
|---> [RAG Orchestrator(Service Layer)]
| |
| |---> [Vector Store (pgvector / Redis / Pinecone)]
| |---> [Document Store (RDB / S3)]
| |---> [Model Router]
| |---> [LLM Provider 1 (OpenAI, Claude, etc)]
| |---> [LLM Provider 2 (HuggingFace Inference)]
| |---> [Internal Model Server (Python, gRPC/HTTP)]
|
|---> [Monitoring/Logging (OTel, Prometheus, ELK)]
|
[Offline Ingestion Pipeline]
|
+---> [Document Collector/Parser]
[Chunker + Embedder]
[Vector Store Writer]
Document(id, title, body, metadata)text-embedding-3-small결론은 X
올바른 방식
왜 문서를 합치면 안 되는가?
결국 내가 원하는 특정 데티터가 담긴 문서를 찾아 프롬프트에 첨부해 같이 질문하면 원하는 결과가 더 잘나오는 것이라고 이해
아래 문서를 참고하여 답변해줘.
[문서 내용]
"환불은 구매 후 7일 이내 가능합니다."
사용자 질문:
"환불 신청은 구매 후 며칠 이내 가능한가?"