当前位置: 首页 > news >正文

RAG 必看!检索不准?全靠 rerank 救场

RAG系统中, 检索(retrieval)步骤完成之后, 可以从矢量数据库中根据相似性, 把相关的文档切片读取出来, 而文档切片的相关性排序, 对于最终的生成结果, 影响很大

今天Chris就来扒一扒, 如果出现了检索文档排序不准确的问题, 应该如何解决?

Rerank

顾名思义, Rerank就是在检索之后, 对检索出来的结果, 再进行一次语义分析, 然后重新对文档进行重新的排序

Rerank的原理

Rerank的原理在于采用了不同的transformer模型架构: Cross-Encoder. 而普通检索阶段的模型架构叫做Bi-Encoder.

Bi-Encoder 会分别独立处理query和document, 把它们处理成相同维度的矢量. 对于document资料的矢量化处理, 发生在离线状态; 而对于query的矢量化, 发生在检索的过程中. 这样做, 检索的时候性能会非常好, 响应会很快.

相比而言, Cross-Encoder 会同时处理query和document, 彼此作为各自的context上下文, 一起传给transformer. 熟悉注意力(attention)机制的朋友, 一下就能明白此处的玄机了. 因为query 和 document 串接在一起, 作为一个整体去计算注意力权重, 那准确性自然要更高了!!! 当然这样做, 计算成本很高了, 所以不适合大规模的线上检索处理了!

最佳实践(best practice)

所以当前的最佳实践就是两段处理: 基于Bi-Encoder的retrieval + 基于Cross-Encoder的rerank.
就能兼顾性能和准确性了.

这里给大家精心整理了一份全面的AI大模型学习资源包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享

👇👇扫码免费领取全部内容👇👇

1. 成长路线图&学习规划

要学习一门新的技术,作为新手一定要先学习成长路线图方向不对,努力白费

这里,我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。可以说是最科学最系统的学习成长路线。

2. 大模型经典PDF书籍

书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础(书籍含电子版PDF)

3. 大模型视频教程

对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识

4. 2026行业报告

行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

5. 大模型项目实战

学以致用,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。

6. 大模型面试题

面试不仅是技术的较量,更需要充分的准备。

在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。

7. 资料领取:全套内容免费抱走,学 AI 不用再找第二份

不管你是 0 基础想入门 AI 大模型,还是有基础想冲刺大厂、了解行业趋势,这份资料都能满足你!
现在只需按照提示操作,就能免费领取:

👇👇扫码免费领取全部内容👇👇

http://www.jsqmd.com/news/546521/

相关文章:

  • 2026年AI搜索优化服务商深度测评:专业实力与诚信保障并重的五大选择 - 2026年企业推荐榜
  • nli-distilroberta-base多场景落地:教育题干-答案逻辑验证工具开发
  • 2026园林绿化花卉种子优质供应商推荐榜 - 资讯焦点
  • Si7055高精度温度传感器驱动与嵌入式集成指南
  • OpenClaw监控方案:nanobot模型健康状态实时预警
  • douyin-downloader:重新定义抖音内容管理,让效率提升90%的智能解决方案
  • zyfun:重新定义跨平台视频播放体验的全能媒体中心
  • 避坑指南:Pyannote3.1+Whisper本地部署的5个常见报错解决方案
  • Phi-4-Reasoning-Vision行业落地:农业病虫害图像+农技问题联合诊断
  • 药毒性检测光谱分析仪租赁平台哪家性价比高 - 资讯焦点
  • AI音频修复从入门到精通:VoiceFixer全流程技术指南
  • 38亿参数也能高性能?Phi-3-mini-128k-instruct显存优化部署教程(vLLM实测)
  • 20元改造服务器风扇:用ESP01S+ESPhome实现智能无极调速(附完整代码)
  • 聊聊Agent热潮的底层逻辑ReAct
  • LFM2.5-1.2B-Thinking-GGUF应用场景:智能硬件说明书问答机器人落地实践
  • 选靠谱实验室色谱分析仪租赁 安全租赁更安心 - 资讯焦点
  • 浙江润鑫STW-18小车轮荷检测秤:小巧身躯,精准丈量小车轮荷 - 资讯焦点
  • 如何高效使用AsrTools:快速上手指南与实用功能详解
  • OpenClaw极简部署:星图平台Qwen3-VL:30B一键体验
  • FreeRTOS学习笔记(9):将FreeRTOS 移植到 STM32F4 开发指南
  • STM32智能井盖监测系统设计与实现
  • ESLyric歌词源高效配置与避坑指南:Foobar2000用户进阶教程
  • Llama-3.2V-11B-cot实战教程:用一张产品图生成技术规格与风险提示
  • UniApp开发避坑指南:这些官方UI组件帮你轻松搞定表单验证、复杂布局与交互细节
  • 实测10好用的美白牙膏推荐!2026年哪款清洁牙齿产品最有效?多维美白 - 资讯焦点
  • Qwen3-14B-AWQ模型效果深度评测:在算法题求解上的表现
  • Easy-Scraper:Rust 构建的现代化网页数据采集解决方案
  • Chord视频分析工具Streamlit界面解析:宽屏双列布局提升视频分析效率
  • 告别Python环境依赖!用PyInstaller打包Tkinter/Selenium程序的最佳实践
  • PTA 7-37 整数分解为若干项之和