21 向量数据库怎么选:Chroma、Milvus、Qdrant、pgvector 对比
专栏:大模型应用开发:从原理到生产
篇号:21
内容标签:向量数据库、RAG、Milvus、Qdrant、pgvector
上一篇我们讲了 Embedding 和向量检索。
现在问题来了:
文本块已经变成向量了。
这些向量、原文、标题、来源、版本、权限标签,到底应该存在哪里?
这就是向量数据库要解决的问题。
很多人第一次做 RAG,会把向量数据库选型想得很玄。
好像必须先看一堆性能榜单、索引算法、分布式架构、云服务价格,才能开始。
其实不用。
大多数项目一开始只需要回答几个很实际的问题:
- 你是在学习验证,还是要上线生产?
- 你们团队有没有现成 PostgreSQL?
- 数据量和并发大不大?
- 权限过滤和元数据查询复杂不复杂?
- 能不能接受多维护一个数据库服务?
- 是否需要私有化部署、备份、审计和监控?
这些问题比“哪个数据库最强”更重要。
向量数据库不是越重越好。
选型的核心是:
用当前阶段最合适的基础设施,支撑 RAG 稳定检索、可追溯、可维护。
