当前位置: 首页 > news >正文

15天学会AI应用开发(九)利用Chroma持久化向量数据

向量数据库Chroma

Chroma是一个本地向量数据库,专门用来保存 RAG 知识库,并且快速检索相关内容。Chroma与FAISS之间的区别如下:

1、只做检索,不做保存;Chroma既支持检索,也支持保存。
2、FAISS运行于内存,速度快;Chroma需要从磁盘加载数据,启动稍慢。
3、FAISS适合临时检索,多用于简单RAG;Chroma支持长期使用,尤其是资料较多的RAG。

总而言之,Chroma属于本地 + 简单 + 自带持久化的 RAG 专用数据库,可以理解为给大模型用的本地知识小仓库。

二、如何使用Chroma

Python代码里的Chroma主要完成三件事:创建数据库与数据表、保存知识向量、在用户提问时检索知识,如下代码所示:

import chromadb # 创建数据库,指定本地的数据库路径 client = chromadb.PersistentClient(path="./chroma_db") # 创建数据表 collection = client.get_or_create_collection("knowledge_base") # 把 文本+向量 一起存进去 collection.add(documents=knowledge, embeddings=vectors, ids=ids) # 提问 → 自动检索最相似的 results = collection.query(query_embeddings=q_vec, n_results=1)

可见Chroma的使用步骤与FAISS一一对应,如下所示:

1、FAISS的第一步是建立内存索引,而Chroma的第一步是创建数据库与数据表。
2、FAISS的第二步是把知识向量放入内存索引,而Chroma的第二步是把知识向量保存到数据表。
3、FAISS的第三步是从内存索引查找相关知识,而Chroma的第三步是从数据表查找相关知识。

三、结合all-MiniLM-L6-v2与Chroma实现RAG

接下来演示如何使用all-MiniLM-L6-v2与Chroma实现RAG检索功能。在编写Python代码前,要先在命令行执行下面的pip安装命令:

pip install chromadb sentence-transformers

然后编写下面的Python检索测试代码:

from sentence_transformers import SentenceTransformer import chromadb # ===================== 知识库(不变) ===================== knowledge = [ "什么是AI:人工智能(AI)是一门使机器模拟人类智能的技术。", "什么是RAG:RAG代表检索增强生成,通过检索外部知识提升大模型回答准确性。", "本地RAG消耗Token吗:本地RAG不调用云端API,不消耗Token,完全免费。", "FAISS是什么:FAISS是Facebook开源的向量检索库,用于本地高效检索。", "RAG的作用:RAG让大模型能引用外部知识,避免胡说八道。" ] # ===================== 加载本地embedding模型(不变) ===================== embed_model = SentenceTransformer("./all-MiniLM-L6-v2", device="cpu") # 生成向量(把知识库向量化) vectors = embed_model.encode(knowledge) # ===================== Chroma 初始化 ===================== # 添加到 Chroma,要持久化用: client = chromadb.PersistentClient(path="./chroma_db") # 创建/获取集合 collection = client.get_or_create_collection(name="knowledge_base") ids = [f"doc_{i}" for i in range(len(knowledge))] collection.add( documents=knowledge, embeddings=vectors.tolist(), # 传入向量(也可让Chroma自己embedding) ids=ids ) # ===================== RAG 检索(逻辑不变) ===================== def rag(question): print("\n 问题:" + question) # 把问题向量化 q_vec = embed_model.encode([question]) # 从 Chroma 检索对应的知识 results = collection.query( query_embeddings=q_vec.tolist(), n_results=1 ) best = results["documents"][0][0] answer = best.split(":")[-1] print(" 答案:" + answer) print("-" * 50) # ===================== 运行 ===================== if __name__ == "__main__": print("=== 本地智能 RAG 系统(Chroma版)===") while True: q = input("\n请输入问题(q退出):") if q.lower() == "q": break rag(q)

运行上面的Python代码,根据提示输入问题“AI是什么?”,输出日志结果如下:

=== 本地智能 RAG 系统(Chroma版)=== 请输入问题(q退出):AI是什么? 问题:AI是什么? 答案:人工智能(AI)是一门使机器模拟人类智能的技术。 --------------------------------------------------
http://www.jsqmd.com/news/1093601/

相关文章:

  • 已知某防御系统的导弹拦截目标的命中率为70%,为提高拦截成功率,决定同时发射导弹拦截同一目标,若三枚导弹彼此间互不干扰,则拦截成功的概率为 正确应该选A70%
  • 《Linux 设备驱动开发详解:基于最新的 Linux 4.0 内核》 附录 A VirtualBox + Ubuntu 开发环境搭建
  • 2026年ASIC芯片爆发:云厂商与AI实验室发力,重塑半导体产业链!
  • 额度突降、请求被拒、会话中断——ChatGPT Plus限额异常诊断手册,含4步自查清单与实时监控脚本
  • intel下代CPU最高474瓦,电脑功耗真要干趴空调了
  • 【2026】MapGIS 6.7(地理信息系统)下载安装超详细教程(附安装包)
  • 别让 AI Agent 裸奔:Harness 到底是什么,为什么它决定了 AI 应用能不能上线?
  • 终极指南:如何让老旧Mac重获新生,免费升级到最新macOS系统
  • Iceberg HDP 文件监听与 Spark 任务自动提交模块设计文档
  • 一次遗留接口改造复盘:从长文档到测试清单的验证流程
  • 帮你理解golang与AI Agent
  • 日志收集分析
  • 给孩子选护眼台灯前,先看完这篇:10款主流型号真实差距拆解(含书客/霍尼韦尔/明基/松下/米家等),哪个牌子的护眼灯好用?一步到位选对灯!
  • 智能交通中的感知融合与协同控制
  • 创新实训博客1
  • Java毕设项目:基于 JavaWeb+MySQL 的油田物料综合管理系统 数字化油田物资调度管理系统的设计与实现 (源码+文档,讲解、调试运行,定制等)
  • 通芝科技复杂用工AI无感出勤 依托合规引擎解决制造业灵活用工合规痛点
  • nip.io介绍(把IP地址包装成域名的免费动态DNS服务)sslip.io、OAuth登录、Cookie Domain、HTTPS证书测试、访问集群访问、本地微服务开发
  • 终极指南:如何使用Tinke完整工具集进行NDS游戏文件编辑
  • 深入解析TSB83AA23:IEEE 1394b芯片架构、硬件设计与驱动开发实战
  • 关于美利坚的opus4.8max模型的权威破甲流程
  • 从 “特调媒体机” 事件拆解:性能优化与技术作弊的边界在哪?
  • 专业在线排计划工具落地应用指南
  • AI当「老板」:14位参赛选手多数亏损,Fable 5成最强「AI老板」
  • 百考通一次搞定查重高、AI概率高难题
  • 刷屏全网的蛋挞小姐姐 藏着科技最温柔的力量
  • Kubernetes StatefulSet 容器存储架构
  • 分享一个免费的 API 接口网站——摸鱼API
  • Docker部署Oracle 19c实战指南:从零到一键连接(含避坑详解)
  • 回流焊的工作原理及操作流程