当前位置: 首页 > news >正文

AI:RAG

定义

将检索系统与大型语言模型相结合的AI技术。

Embedding模型获取

https://modelscope.cn

在LangChain中,问答链的文档处理方法主要有以下几种:

1. Stuff(填充)

原理:将检索到的所有文档直接拼接成一个完整的上下文,一次性输入给LLM
优点:简单高效,保留所有信息,文档间关系完整
缺点:受限于上下文窗口大小,文档太多时会截断信息
适用场景:少量相关文档的简单问答

2. Map-Reduce(映射-归约)

映射阶段:对每个文档分别调用LLM,生成对应的文档摘要
归约阶段:将所有摘要汇总,再次调用LLM生成最终答案
优点:可处理大量文档,不受上下文窗口限制
缺点:计算成本高,可能丢失文档间的关联信息
适用场景:大量文档的复杂分析任务

3. Refine(精炼)

迭代过程:先用一个文档生成初步答案,然后逐步用其他文档精炼完善答案
特点:保持答案的连贯性,逐步优化
优点:相比Map-Reduce更连贯,保留文档间关系
缺点:迭代调用LLM,响应较慢
适用场景:需要高质量答案且文档数量适中的场景

4. Map-Rerank

步骤:分别处理每个文档并给出评分,选择最佳答案
特点:多候选答案比较,选择最优解
适用场景:对答案质量要求极高的场景

http://www.jsqmd.com/news/415482/

相关文章:

  • NCE-Flow 是什么?新概念英语开源学习系统安装与使用教程
  • 远方好物:4年暴涨200万会员,GMV破20亿!它不投广告、不搞流量,凭什么杀出重围?
  • chili3d 是什么?开源在线3D建模工具安装与使用教程
  • 专家安全测试_动态安全服务_移动 APP 漏洞扫描修复工具
  • 对话“五度妙笔”|小核酸药物市场规模与投资前景分析
  • AI Coding
  • 零基础转行网络安全运维?收藏这篇,学习顺序搞错=白费功夫!
  • 记录在vmware虚拟机Ubuntu22.04上编译doom
  • 大数据领域数据中台的实时数据服务接口
  • 丝杆支撑座类型对设备精度的差异化影响
  • AI时代开发者如何转型:AI 求职技能与岗位方向指南
  • 如何每天花10分钟跟上AI重要动态:AI日报信息源推荐指南
  • 如何快速修改图片 DPI?实用方法分享
  • 惠普Deskjet 2132打印机驱动安装与修复,一文搞定所有问题
  • 3D 模型压缩工具 Draco All In One
  • 2026年台北GEO优化公司推荐TOP8:实战效果与技术实力深度测评 - 小白条111
  • CTF夺旗赛完全指南:从零基础到拿分,工具+赛事清单,收藏版直接抄作业!
  • 浅析Superpowers(专为AI编程Agent打造的完整软件开发方法论)强大的软件开发工作流skills
  • 2026年西安GEO优化公司Top7深度测评:从技术实力到效果落地的选型指南 - 小白条111
  • 2026年西宁GEO优化公司TOP9推荐:基于本地产业适配的深度测评与选型指南 - 小白条111
  • C++中的友元 之一
  • 2026年西安GEO优化公司推荐Top5:从技术到效果的深度测评与选型指南 - 小白条111
  • 2026年南昌GEO优化公司Top8测评:从技术实力到效果落地的精准选型指南 - 小白条111
  • 2026年西宁GEO优化公司推荐TOP4:深度测评与企业选型指南 - 小白条111
  • 2026年拉萨GEO优化公司TOP8深度测评:从技术实力到效果落地的选型指南 - 小白条111
  • 2026年北京靠谱GEO优化服务商深度测评:从技术实力到效果落地的选型指南 - 小白条111
  • 2026年西宁GEO优化公司推荐TOP6:基于AI搜索效果的专业测评与选型指南 - 小白条111
  • 一、选型前必看:台北企业GEO优化的4个核心需求 - 小白条111
  • 2026年南宁GEO优化公司推荐TOP8:从技术实力到效果落地的深度测评榜单 - 小白条111
  • 2026年西宁GEO优化公司推荐Top5:专业测评拆解,AI搜索获客选对服务商很关键 - 小白条111