当前位置: 首页 > news >正文

解释一下RAG中的Rerank

Rerank其实一个是对初步检索返回的候选文档列表再次进行排序的过程。

如果把RAG的检索过程类比成公司的招聘过程,则有如下对应关系:

1.初步检索(Retrieval)
这一步就类似于HR筛选简历,找工作的人往往很多,HR每天都可能收到上万份甚至几万份简历。

假设有1万份简历,1个HR每天工作8小时,那么1小时之内就得看完1250份,平均到1分钟以内就得看完20多份,这几乎是不可能的。

所以,不可能每份简历HR都会细看。

那她会怎么看呢,主要就是看关键词,比如Java、 大模型等等,看到简历上有这些匹配的关键词字眼 ,就筛选出来。

这样做就会导致看似简历已经匹配上关键词了,但是候选人的能力可能还不太符合要求,只能选出前100个看似还行的候选人。

我们把这个场景对应到RAG的检索过程里面就是,向量检索,它虽然算得快,但是对语义的理解还差点意思。

2.重排序(Rerank)

这个过程就类似于企业招聘过程的业务面试,也就是主管把这100人的简历打印出来仔细阅读,如果觉得候选人的过往经历和工作经验很符合要求,就会约下一步的一对一业务面试。

这个过程花费的时间比较长,消耗的精力也更多,但是筛选出来的候选人也更符合要求。

这也就是RAG检索过程的Rerank,可以精准地判断初步检索返回的文档是不是真正能够回答用户的问题,最后再喂给大模型去生成一个答案。

http://www.jsqmd.com/news/178077/

相关文章:

  • 深度学习毕设选题推荐:基于图像处理和机器学习的水浑浊度预测研究与系统实现
  • 【课程设计/毕业设计】基于MobileNet v2模型的口罩实时检测系统实现
  • 最详细的FME安装指南
  • 深度学习毕设选题推荐:基于卷积神经网络的垃圾分类系统实现(GUI应用)
  • 最详细的miniconda、python安装指南
  • 【课程设计/毕业设计】基于图像处理和机器学习的水浑浊度预测研究与系统实现
  • Java是怎么实现跨平台的?
  • 个人电脑上的私有知识库:访答知识库使用指南
  • 深度学习毕设选题推荐:基于MobileNet v2模型的口罩实时检测系统实现
  • 【毕业设计】基于MobileNet v2模型的口罩实时检测系统实现
  • 【毕业设计】基于图像处理和机器学习的水浑浊度预测研究与系统实现
  • 2026年,最新百度夸克搜索资源站点, 不用注册登录,完全免费,无广告
  • 说说编译执行和解释执行的区别
  • DeepSeek 开年王炸:mHC 架构用流形约束重构 ResNet 残差连接
  • pythonstudy Day47
  • AI应用架构师带你掌握AI系统灾备方案设计技巧
  • Leetcode1438绝对值不超过限制的最长连续子数组
  • 基于SpringBoot的学生志愿者管理系统的设计与实现毕业设计源码
  • 如何在电商中实施社交媒体营销策略
  • 全网最详细的 NVM、node.js、pnpm 安装指南
  • Angular入门启蒙02,深度解析TypeScript与Angular的适配逻辑:为何是天作之合?
  • 什么时候@Async会失效?
  • Node.js heapdump轻松查内存泄漏
  • 《CPU的指令集架构:定义计算之基的格式、寻址与范式》
  • 手把手教你学Simulink--基础光伏储能场景实例:基于Simulink的光储系统惯量响应控制仿真
  • 学霸同款2025 AI论文网站TOP8:继续教育必备测评
  • Spring Boot 3.x和2.x版本相比有哪些区别与改进?
  • 《从零到一:一个拒绝空谈的学生管理系统实战指南》
  • 学Simulink--基础光伏储能场景实例:基于Simulink的光储系统自适应MPPT算法仿真
  • MySQL 分库分表全攻略:策略、演进路径与避坑指南