当前位置：首页 > news >正文

Milvus 向量数据库部署与 BGE-M3 模型加载的踩坑记录

news 2026/6/24 7:58:37

前言

在搭建本地 RAG 应用时，我选择了 Milvus 作为向量数据库，BGE-M3 作为嵌入模型。整个过程比预想的曲折，这里记录下从“不懂”到“跑通”的完整过程与踩坑点。

一、Milvus 部署与 Attu 客户端连接

1.1 为什么选 Milvus？

Milvus 是开源向量数据库的事实标准，支持海量向量的存储与检索，并提供官方图形化管理工具 Attu。对于本地开发测试，单机 Docker 部署最为便捷。

1.2 预期目标

在本地（Windows / macOS / Linux）通过 Docker Compose 运行 Milvus 2.4.11 单机版
使用 Python 客户端pymilvus连接
通过 Attu 可视化界面管理集合

1.3 标准部署步骤（脱敏版）

# 创建工作目录mkdir~/milvus&&cd~/milvus# 下载官方 docker-compose 配置curl-L-odocker-compose.yml https://github.com/milvus-io/milvus/releases/download/v2.4.11/milvus-standalone-docker-compose.yml# 启动服务dockercompose up-d# 查看状态dockercomposeps# 三个容器应均为 Up

安装 Python 客户端并测试：

pipinstallpymilvus

frompymilvusimportconnections connections.connect(host='localhost',port='19530')print("连接成功")

部署 Attu：

dockerrun-d--nameattu-p8000:3000-eMILVUS_URL=host.docker.internal:19530 zilliz/attu:latest

浏览器访问http://localhost:8000，即可管理 Milvus。

1.4 踩坑记录

端口冲突：本机已有服务占用了9000/9001，导致 Milvus 内置的 MinIO 无法启动。
解决：修改docker-compose.yml中 MinIO 服务的端口映射，例如改为9002:9000和9003:9001，然后docker compose down && docker compose up -d。
wget命令不存在：在 Git Bash 中执行wget报错。
解决：改用curl -L -o docker-compose.yml <URL>下载。
docker compose port报错“service not running”：虽然容器实际已运行，但该命令返回误导信息。
解决：以docker compose ps为准，不依赖port子命令。
Attu 连接 Milvus 失败，提示14 UNAVAILABLE：使用host.docker.internal时，Windows + WSL2 环境下容器无法解析该域名。
验证：在宿主机执行curl -v telnet://localhost:19530成功连通，说明 Milvus 服务正常。
解决：改用宿主机实际 IP（例如通过ipconfig或ifconfig获得的局域网 IPv4 地址）运行 Attu：
```
dockerrm-fattudockerrun-d--nameattu-p8000:3000-eMILVUS_URL=<宿主机IP>:19530 zilliz/attu:latest
```
然后在 Attu 界面手动填写该 IP 即可连接。
容器名冲突：重复运行docker run创建 attu 时报错Conflict. The container name "/attu" is already in use。
解决：先执行docker rm -f attu删除旧容器。

二、BGE-M3 嵌入模型加载

2.1 为什么选 BGE-M3？

BGE-M3 是 BAAI 最新开源的嵌入模型，支持多语言、稠密与稀疏向量混合检索，在中文任务上表现优异。RAG 应用中需要用它将文档和查询转为向量。

2.2 预期目标

在 Python 环境中加载 BGE-M3 模型，并能够对文本生成向量。

2.3 标准加载方式（推荐）

importos os.environ['HF_ENDPOINT']='https://hf-mirror.com'# 国内镜像（网络受限时使用）fromsentence_transformersimportSentenceTransformer model=SentenceTransformer("BAAI/bge-m3",cache_folder="./models/bge-m3_cache"# 可选：指定缓存目录)# 测试编码emb=model.encode("你好，世界")print(emb.shape)# (1024,)

2.4 踩坑记录

使用FlagModel加载本地路径失败：
```
fromFlagEmbeddingimportFlagModel model=FlagModel("D:/downloaded_models/bge-m3")
```
报错：Repo id must use alphanumeric chars...
原因：FlagModel将本地路径误认为 model repo ID，不支持 Windows 盘符格式。
解决：改用sentence-transformers库，它对本地路径支持更友好。
本地模型文件不完整：从 ModelScope 下载的文件夹内缺少pytorch_model.bin等权重文件。
现象：sentence-transformers加载时报Error no file named pytorch_model.bin ... found。
解决：放弃本地残缺文件夹，从国内镜像重新下载完整模型。
无法连接 Hugging Face 官方源：默认下载时出现Connection to huggingface.co timed out。
解决：设置环境变量HF_ENDPOINT=https://hf-mirror.com使用国内镜像。
模型下载速度慢/中断：大文件（2.2GB）下载易失败。
解决：使用cache_folder指定一个有充足空间的目录，并保持网络稳定。或使用modelscope命令行工具提前下载到指定路径：
```
modelscope download--modelBAAI/bge-m3--local_dir./models/bge-m3
```
然后用SentenceTransformer("./models/bge-m3")加载本地目录。

三、总结

组件	核心踩点	有效解决方案
Milvus	端口冲突、Attu 连接失败、wget 缺失	修改 docker-compose 端口；Attu 改用宿主机 IP；curl 替代 wget
BGE-M3	本地路径不支持、网络不通、文件不完整	改用 Sentence‑Transformers；设置 HF 镜像；重新下载完整模型

这两项基础环境的搭建虽有小波折，但最终都顺利解决。希望这份记录能帮你避开同样的坑，更快完成 RAG 应用的本地开发。

附：前面提到的踩坑记录（简明版）

Milvus 部署
- 端口冲突 → 修改 yml
- Attu 连不上 → 用宿主机 IP 而非 host.docker.internal
- 命令不存在 → 用 curl 代替 wget
BGE-M3 加载
- FlagModel 不接受本地路径 → 换 Sentence‑Transformers
- 模型文件缺失 → 从镜像重下
- 外网不通 → 设置 HF_ENDPOINT 镜像

查看全文

http://www.jsqmd.com/news/771940/