当前位置: 首页 > news >正文

大模型---FAISS/Chroma

目录

1.FAISS

2.Chroma


Embedding 负责把文本变成向量;FAISS/Chroma 负责把这些向量建成可查询的本地索引(把向量和对应的文档/ID/元数据存到本地机器上,并建立最近邻搜索结构)。关于embedding,之前的博客有详细讲:

大模型---embedding

RAG的流程:文本切块-->生成 embedding-->建索引-->查询文本也做 embedding-->最近邻检索-->返回相关块。FAISS/Chroma就是负责建立索引。

为什么要先embedding在检索:

如果只用关键词检索,用户说法和文档说法不一致时,系统很容易漏召回。Embedding 检索的核心优势就是:即使字面不一样,只要意思接近,也能被找出来。Chroma 文档明确说,它会把 embedding 建索引,然后高效搜索相似内容;FAISS 文档则把“给定查询向量,寻找最相似向量”定义为它的核心工作。FAISS 偏底层,重点是“高效向量索引和相似搜索”;Chroma 更像“面向应用的本地向量数据库/数据层”,在向量索引之上又加了 collection、documents、metadata、filter、client 等更完整的接口。

1.FAISS

Faiss 中的数据结构就是一个 index,它有add方法把向量加进去,然后对查询向量做

http://www.jsqmd.com/news/723751/

相关文章:

  • “线上搓虾子 线下嘬虾子”燃动江城
  • 坤和静界·春藤计划:用“家庭系统干预“破解青少年休学难题的实践与思考
  • 认知虫洞穿越:软件测试中的时空探索与风险管控
  • 从浪潮服务器到VMware虚拟机:一份通用的Ubuntu 20.04 Netplan静态IP配置避坑手册
  • 说说全国口碑好的网球场地租赁品牌,梅江南网球俱乐部排第几? - 工业设备
  • 【仅限头部技术团队解密】:PHP订单分布式链路追踪黑盒——基于OpenTelemetry自研TraceID穿透方案,将平均排查耗时从43分钟压缩至86秒
  • Linux下cmake构建方法
  • 32位微控制器技术解析与应用选型指南
  • GitHub中文插件:3分钟破解代码协作的语言壁垒,让全球开发者平台说中文
  • 2025届毕业生推荐的六大降AI率神器横评
  • 2026年网红开会语音转文字app多维度实测对比,全面PK后,差距竟然这么大
  • VCS用户必看:Python脚本处理寄存器Excel的5个常见坑与避坑指南
  • 别再让多线程搞乱你的计数器!手把手教你用Linux内核atomic_t实现线程安全(附完整代码)
  • 探讨服务不错的网球俱乐部品牌,梅江南网球俱乐部口碑如何? - 工业设备
  • 算法训练营第十七天 | 151.反转字符串中的单词
  • 伊辛机副本耦合拓扑结构优化与误差缓解方法研究
  • 微信小程序自定义TabBar踩坑实录:TDesign组件与getTabBar接口的配合使用指南
  • 索引失效案例分析:5个让SQL不走索引的坑
  • C++信号处理
  • SeqTrack模型专题全面调研
  • 【附Python源码】基于MLP的波士顿房价预测
  • 性价比高的专用汽车汇总,程力专用汽车可靠吗及行业口碑揭秘 - 工业设备
  • 合规消费增值:从市场痛点到落地玩法,商家、用户、平台都能赢
  • 重载型工业安全地毯,机械作业安全防护优选
  • LDR6500U:Type‑C PD 取电 “一芯通吃”,赋能全场景高效供电
  • 天线测量技术:频谱与网络分析仪应用指南
  • 全志D1s RISC-V开发板:十美元Linux方案解析
  • 记一次 OpenClaw Token 费用优化:从日均 50 美元到 12 美元的技术拆解
  • CBCX平台:多市场接入与跨境交易适配
  • Keithley 2600B系列SMU仪器:高精度电子测试解决方案