[멘토링]Vector DB 도입 질문(답변 희망 멘토 : lu.na) #219
-
|
🙋질문자 판교 3기 / 9팀 (Promise9) - estar.yoon(윤동규)/AI 🙋 답변 희망 멘토 RAG(Retrieval-Augmented Generation) 기반 서비스에서 VectorDB를 선택할 때, ChromaDB, FAISS-GPU, Milvus 중 어떤 기준으로 선택하는 것이 적절한지 궁금합니다. [추가 이해를 위한 디테일한 질문] 프로덕션 환경에서 각 VectorDB의 실제 운영 경험 및 고려사항 👀 시도한 방식 현재 설계: ChromaDB 선택저희 프로젝트(취준생 AI 어시스턴트)에서는 RAG 기반 컨텍스트 검색을 위해 ChromaDB를 선택했습니다. 선택 이유
Collection 설계대안 검토: FAISS-GPU vs Milvus
고민 포인트
⏭️ 이제 어떻게 하려고 하는지? 현재 계획: ChromaDB 유지 + 확장성 문서화## 향후 확장 계획 (Architecture Decision Record)
### 현재: ChromaDB
- 6주 개발 기간 대비 적절한 복잡도
- 예상 사용자 규모 (100명 이하) 감당 가능
### Phase 2 (사용자 1,000+ 시): FAISS 마이그레이션 검토
- 검색 성능 벤치마크 후 결정
- 메타데이터는 PostgreSQL과 조인
### Phase 3 (엔터프라이즈): Milvus 도입 검토
- 분산 환경, 고가용성 필요 시
- Kubernetes 기반 배포질문 요약
|
Beta Was this translation helpful? Give feedback.
Replies: 1 comment 1 reply
-
|
@yoondonggyu 안녕하세요:) faiss-gpu는 개인적으로는 실서빙 이전 실험시에 자주 애용하곤 합니다. milvus는 직접 사용해보진 않았어요. chromaDB도 괜찮은 선택으로 보입니다. 아무래도 langchain과 쉽게 연동되는 것들 찾으신거같은데, 현 프로젝트 상 스케일이 크진 않을 듯 하여 괜찮지 않을까 싶네요! 그래서 답변을 드리자면,
|
Beta Was this translation helpful? Give feedback.
@yoondonggyu 안녕하세요:)
우선 현업에서는 서비스시 보통 사내 k8s툴을 이용해서 생성하기 때문에, 인프라쪽에서 안정적으로 서빙이 확신된 버전과 db를 주로 사용합니다. 그래서 최근에는 postgresql 에 잘 붙는 pgvector를 사용했었어요.
faiss-gpu는 개인적으로는 실서빙 이전 실험시에 자주 애용하곤 합니다. milvus는 직접 사용해보진 않았어요.
chromaDB도 괜찮은 선택으로 보입니다. 아무래도 langchain과 쉽게 연동되는 것들 찾으신거같은데, 현 프로젝트 상 스케일이 크진 않을 듯 하여 괜찮지 않을까 싶네요!
그래서 답변을 드리자면,