当前位置：首页 > news >正文

002、环境搭建：Python生态与向量数据库选型部署

news 2026/6/17 2:18:42

昨天深夜调试一个RAG原型，明明本地跑得好好的，一上测试服务器就报numpy版本冲突。查了半天发现是transformers库依赖的numpy版本和我的向量计算模块要求不一致。这种环境依赖问题在RAG系统搭建初期特别常见——今天我们就来彻底解决它。

Python环境：别用系统Python

新手最容易犯的错误就是直接使用系统自带的Python。上周帮同事排查一个faiss安装失败的问题，根源就是Ubuntu自带的Python 3.8缺少某些底层依赖。我的建议是：永远使用虚拟环境。

# 强烈推荐miniconda，管理不同Python版本很方便# 创建环境时指定Python版本，避免后续麻烦conda create-n rag_env python=3.10-y# 激活环境后第一件事：升级pippip install--upgrade pip# 这个步骤能避免很多奇怪的安装错误

如果你坚持用venv，记得检查Python版本：

python--version# 确保是3.8以上，3.10最稳

核心依赖：先装这些基础包

安装顺序其实有讲究。先装数值计算基础库，再装AI框架，能减少很多依赖冲突。

# 基础三件套，按这个顺序装pip install numpy==1.24.3# 固定版本，避免上下游兼容问题pip install scipy==1.10.1# 很多向量计算依赖它pip install pandas==2.0.3# 数据处理必备# 深度学习框架：选torch就对了# 去官网复制安装命令，根据CUDA版本选择pip install torch torchvision torchaudio--index-url https://download.pytorch.org/whl/cu118# 没GPU的话用CPU版本，但推理速度会慢很多

向量数据库选型：我踩过的坑

去年测试了五种向量数据库，简单说说实际感受。

FAISS：Facebook出品，单机性能王者。但只支持向量检索，需要自己搭元数据管理。内存模式用起来简单：

importfaiss dimension=768# 你的向量维度index=faiss.IndexFlatL2(dimension)# L2距离，最常用# 记得normalize向量，不然余弦相似度不准# 我在这里栽过跟头：faiss的IndexFlatIP需要单位向量

Chroma：入门最友好，API设计得像操作字典。适合快速原型：

importchromadb client=chromadb.Client()collection=client.create_collection("docs")# 自动管理元数据，但数据量大时内存有点吃紧# 生产环境需要换成持久化模式

Qdrant：云原生设计，支持过滤查询。用Docker部署最省心：

dockerrun-p6333:6333 qdrant/qdrant# HTTP API很完善，多语言客户端支持好# 但资源消耗比FAISS高一些

Milvus：功能最全，也最重。适合企业级场景：

# 单机测试可以用Standalone模式# 生产一定要集群部署，运维成本不低

PGVector：如果你已经在用PostgreSQL，这是最自然的选择。不用维护两套存储：

-- 装个插件就能用CREATEEXTENSION vector;-- 查询语法和普通SQL一样，学习成本低

我的部署方案

对于大多数中小规模RAG应用，我现在的选择是：开发阶段用Chroma快速迭代，上线用Qdrant平衡功能和复杂度。

这是我们的生产环境docker-compose片段：

version:'3.8'services:qdrant:image:qdrant/qdrant:latestports:-"6333:6333"volumes:-./qdrant_storage:/qdrant/storage# 资源限制很重要，不然容易OOMdeploy:resources:limits:memory:4G

向量维度设置有个经验值：BERT系模型用768维，Sentence-Transformer常用384维，新一代模型可能到1024维。维度不是越大越好，768维比1024维检索快30%，精度损失往往不到2%。

环境检查清单

部署完一定要跑这个测试脚本：

defcheck_environment():importsysprint(f"Python版本:{sys.version}")# 测试关键库try:importtorchprint(f"PyTorch可用, CUDA:{torch.cuda.is_available()}")exceptImportError:print("警告: PyTorch未正确安装")# 向量数据库连接测试try:importchromadb client=chromadb.Client()print("Chroma连接正常")exceptExceptionase:print(f"向量数据库异常:{e}")# 运行检查check_environment()