当前位置：首页 > news >正文

faiss向量检索库(并非向量数据库)

news 2026/6/12 1:50:49

文章目录

- - - faiss是一个轻量数据库吗?
    - 安装依赖
    - 最简单示例
    - 带持久化的简单示例

faiss # 轻量
chromadb # 中量
milvus # 重量

faiss是一个轻量数据库吗?

轻量 # 对
数据库 # 错，它不是一个完整的数据库(没有服务、没有事务、没有分布式)，只是一个向量检索库

安装依赖

注：安装的包名是faiss-cpu，不是faiss。

pip install faiss-cpu

最简单示例

代码：

importnumpyasnpimportfaiss data=np.array([[1.0,1.0],[1.0,2.0],[5.0,5.0],[5.0,6.0],[9.0,1.0]],dtype='float32')# ⚠️ 注意：FAISS 必须用 float32# IndexFlatL2 代表：计算欧几里得距离（直线距离）dimension=2index=faiss.IndexFlatL2(dimension)index.add(data)print(f"📚 库里现在有{index.ntotal}条数据")# 进行搜索 假设用户问了一个问题，它的向量是 (1.1, 1.1) —— 离 (1,1) 最近query=np.array([[1.1,1.1]],dtype='float32')# k=2 表示返回最近的 2 个结果D,I=index.search(query,k=2)print("🔍 查询向量:",query)print("📏 距离 (越小越近):",D)print("🆔 找到的索引位置:",I)# 验证：I[0][0] 应该是 0，因为 data[0] 是 [1.0, 1.0]，离 [1.1, 1.1] 最近print(f"✅ 最相似的数据是第{I[0][0]}条，内容是:{data[I[0][0]]}")

只需要关注这3个对象：
1、data (矩阵)
你的数据库内容。必须是 float32 格式的 NumPy 数组。
2、index (索引)
这就是“数据库引擎”。
IndexFlatL2 是最基础的索引，意思是“把所有数据存下来，查的时候一个个算距离”。它不需要训练，适合小数据量（<10万）。
3、D 和 I (结果)
search 函数永远返回两个值。
D (Distance)：距离。数值越小，代表越相似。
I (Index)：下标。代表这个数据在原来数组里的第几行。

带持久化的简单示例

要实现持久化，核心就是利用FAISS自带的write_index和read_index函数。

importnumpyasnpimportfaissimportos# 定义文件名INDEX_FILE="my_faiss_index.bin"dimension=2ifos.path.exists(INDEX_FILE):print(f"📂 发现本地文件{INDEX_FILE}，正在加载...")# 【关键步骤】从硬盘读取索引index=faiss.read_index(INDEX_FILE)else:print("✨ 未找到文件，正在创建新索引...")# 1.1 准备数据 (注意这里强制转为 float32)data=np.array([[1.0,1.0],[1.0,2.0],[5.0,5.0],[5.0,6.0],[9.0,1.0]],dtype='float32')# 1.2 建立索引并添加数据index=faiss.IndexFlatL2(dimension)index.add(data)# 【关键步骤】将索引保存到硬盘print(f"💾 正在保存索引到{INDEX_FILE}...")faiss.write_index(index,INDEX_FILE)print("✅ 保存完成！")query=np.array([[1.1,1.1]],dtype='float32')D,I=index.search(query,k=2)print("-"*30)print(f"🔍 查询结果 (距离:{D}, 索引:{I})")print(f"当前内存中数据总量:{index.ntotal}")