当前位置: 首页 > news >正文

RAG实战揭秘:嵌入、切片、相似度与重排模型,让你的AI知识库查询更精准!收藏这份干货指南!

RAG技术通过在知识库中进行语义搜索而非关键词匹配,增强LLM的回复准确性与可信度。文章深入解析了嵌入、切片、相似度、重排模型及查询改写等核心概念,并结合百度千帆、dify等平台实例,阐述了如何通过优化这些环节提升知识库检索效果,降低“幻觉”风险,为高要求的AI应用提供可靠支持。


原理大概就是当用户向关联了知识库的 AI 智能体提出问题时,查询不会直接发送给 LLM,而是先在知识库(如企业的文档库,记忆库,数据库等)中检索相关信息。这种检索不仅仅是关键词匹配,而是“语义搜索”,理解用户提出的问题和词语背后的含义。系统会提取最相关的知识切片(chunk),并将这些切片“增强”到原始提示中,最终,这个增强后的提示被送入 LLM,基于上下文,生成既流畅自然又有事实依据的回复。

因此,RAG能够让 LLM 能够访问知识库的内容,突破静态训练数据的限制,利用企业内部文档或 Wiki 等专业知识降低了“幻觉”(虚假信息)的风险,另外一个重要优势是能够提供“引用”,明确指出大模型回复信息的来源,提升 AI 响应的可信度和可验证性,这个在一些财务或对于回复可信度要求较高的,极为重要。

但如果要想更深入了解下RAG相关的一些内容,有几个核心的概念,必须得先了解下,这里也结合最近在项目上的一些了解学习,以及市面上常见智能体平台来解释下。

1、嵌入

在 LLM 语境下,嵌入是文本(如词语、短语或文档)的数值表示,通常为向量(数字列表)。其核心思想是用数学空间表达语义和文本间的关系。含义相近的词或短语,其嵌入在向量空间中距离更近。

在百度千帆中,用户在知识库上传文件后,支持选择向量模型进行嵌入,就是把我上传的文件解析出来之后,对文件内容进行向量化表示。用户提问时,系统通过计算问题嵌入与文档嵌入的相似度,检索最相关的信息用于生成答案。一般常见的开源模型就是bge-large。向量化之后一般就是存储在ES数据库。

2、切片

将大文档拆分为更小、更易处理的片段。RAG 系统无法将整本大文档输入 LLM,而是处理这些小块。如下图,coze将一篇比较大的文档切分成小的片段。

而同样的文档,在百度千帆平台中,则被切成了575个小的分段。

不同的切片策略,会导致同一个切分出来的效果不一样,这里有几个点:

原因说明
✅ 分块大小(chunk size)最直接原因:小块 → 更多分段
✅ 分段重叠(overlap)重叠会显著增加块数
✅ 切分策略(智能语义 vs 固定)段落感知切分 vs 硬切
✅ 文本预处理差异是否去噪、压缩、去掉换行符,制表符等
✅ 平台默认设计哲学效率优先 vs 精度优先

在dify内,切片后会形成父子切片,子分段会被切得更细,这样在知识库内容的命中上会更精确。用户提问时,系统先通过 父分段 快速判断主题是否相关。若相关,则深入检索对应的 子分段 获取精确答案,这样可以避免在海量文本中盲目搜索,提升效率。

3、相似度

指两段文本或语义的相似程度,可分为表层(词汇重叠)和深层(语义)。如下面的两张图,在百度千帆和dify中,当知识库切片后,可以通过召回测试,测试其召回后的内容,并会对召回内容进行相似度的打分,分数越高,代表当前召回的文本切片相关度就越高。

文本相似度一般就是计算查询向量与所有文档向量的余弦相似度,返回 Top-K 最相似的文档,下图中,召回数量就是topk。

4、重排模型

对“Query-候选片段”重新排序并打分,更准确地修正知识检索环节后的排序结果。目前用的比较多的大部分都是开源的模型,bge-reranker-large,典型流程是:

初筛(Retrieval):用向量搜索从文档中快速召回 Top-K(如 K=100)候选。

重排(Reranking):用更精细的模型对这 K 个候选重新打分排序,选出最相关的 Top-N(如 N=5)送入 LLM,这样就能避免“检索到但排错位”的问题。如下图所示。

5、查询改写

当用户开启“多轮对话改写”后,在正式检索知识库之前,系统会插入一个额外的大模型处理步骤:获取上下文:收集当前对话的历史记录(history)和当前用户输入(current_question)。调用大模型,使用固定提示词模板(Prompt)引导模型输出:你是一个查询改写助手……要求输出仅为改写后的查询语句,不加解释、标注或其他内容。

用改写后的查询 替代原始输入,执行后续的知识库检索,从而提高后续知识检索的相关性和准确度。

AI时代,未来的就业机会在哪里?

答案就藏在大模型的浪潮里。从ChatGPT、DeepSeek等日常工具,到自然语言处理、计算机视觉、多模态等核心领域,技术普惠化、应用垂直化与生态开源化正催生Prompt工程师、自然语言处理、计算机视觉工程师、大模型算法工程师、AI应用产品经理等AI岗位。

掌握大模型技能,就是把握高薪未来。

那么,普通人如何抓住大模型风口?

AI技术的普及对个人能力提出了新的要求,在AI时代,持续学习和适应新技术变得尤为重要。无论是企业还是个人,都需要不断更新知识体系,提升与AI协作的能力,以适应不断变化的工作环境。

因此,这里给大家整理了一份《2026最新大模型全套学习资源》,包括2026最新大模型学习路线、大模型书籍、视频教程、项目实战、最新行业报告、面试题、AI产品经理入门到精通等,带你从零基础入门到精通,快速掌握大模型技术!

由于篇幅有限,有需要的小伙伴可以扫码获取!

1. 成长路线图&学习规划

要学习一门新的技术,作为新手一定要先学习成长路线图,方向不对,努力白费。这里,我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。

2. 大模型经典PDF书籍

书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础(书籍含电子版PDF)

3. 大模型视频教程

对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识

4. 大模型项目实战

学以致用,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。

5. 大模型行业报告

行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

6. 大模型面试题

面试不仅是技术的较量,更需要充分的准备。

在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。

为什么大家都在学AI大模型?

随着AI技术的发展,企业对人才的需求从“单一技术”转向 “AI+行业”双背景。企业对人才的需求从“单一技术”转向 “AI+行业”双背景。金融+AI、制造+AI、医疗+AI等跨界岗位薪资涨幅达30%-50%。

同时很多人面临优化裁员,近期科技巨头英特尔裁员2万人,传统岗位不断缩减,因此转行AI势在必行!

这些资料有用吗?

这份资料由我们和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。


大模型全套学习资料已整理打包,有需要的小伙伴可以微信扫描下方CSDN官方认证二维码,免费领取【保证100%免费】

http://www.jsqmd.com/news/432685/

相关文章:

  • 智慧园区:当传统管理遇上数字神经,一场效率革命正在发生
  • 20260302 模拟测 总结
  • MySQL 5.7和MySQL 8的GROUP BY使用差异
  • 2026年干燥设备发展趋势与实力厂家推荐,桨叶干燥机/热风循环烘箱/闪蒸干燥机/干燥机,干燥设备厂家推荐排行榜 - 品牌推荐师
  • 收藏!5步高效搭建AI智能体,小白也能轻松搞定,提升效率必备!
  • 2026年防静电无尘服厂家推荐排行榜:防静电工作服/防静电防护服/防静电洁净服/防静电连体服,专业洁净防护与持久耐用口碑之选 - 品牌企业推荐师(官方)
  • 2026年工业移动电源厂家实力推荐榜:大功率/便携式/应急储能,覆盖220V至380V全场景应用的顶尖品牌深度解析 - 品牌企业推荐师(官方)
  • 2026年智能离子风机厂家实力推荐榜:单头/两头/三头高频除静电,台式交流直流全系列深度解析与选购指南 - 品牌企业推荐师(官方)
  • LeetCode1545:找出第N个字符串的第K位
  • 这个框架会过时吗——AI的天花板和你的判断力
  • 耐磨瓷砖水太深!家装vs工装,耐磨瓷砖怎么选?从最新国家标准到实战选购,一篇讲透! - 野榜精选
  • AI产品经理必看!从能跑到落地,90%的项目死在这里!不看后悔,速收藏!
  • 收藏!深度解析RAG架构,这12种变体让你秒懂信息检索核心!速进!
  • 2026要租垫路钢板,这些做得好的企业值得选,铺路钢板租赁/钢板出租/路基钢板租赁,垫路钢板出租公司找哪家 - 品牌推荐师
  • 2026 年 AI Agent 从零基础到生产级落地实战指南
  • 小体积,大作为——石英加速度计为航空航天导航精准掌舵
  • uni-app——uni-app 小程序 之 【按钮失效问题排查(前端+后端)】
  • P2756 飞行员配对方案问题
  • 馏分/组分/自动/样品收集器选型指南:上海金鹏核心产品深度解析 - 品牌推荐大师
  • 一个命令,切换整个世界:CCSwitch 到底是什么?
  • 2026年碟形弹簧/碟簧垫圈/蝶形垫片/碗形垫圈厂家推荐排行榜:不锈钢、耐高温及主轴碟簧专业实力与创新工艺深度解析 - 品牌企业推荐师(官方)
  • 2026年 无机纤维喷涂厂家实力推荐榜:硬质/外墙/高铁机场/电梯井/地下室/车库顶板/厂房/矿物/隔音/超细无机纤维棉喷涂全方位解析 - 品牌企业推荐师(官方)
  • 两数之和
  • Mac部署ollama本地大模型
  • 史上最细,银行测试-核心系统与网上银行业务,一篇策底打通...
  • 制造业/政务/跨国企业如何选?2026低代码软件行业适配指南
  • Blender角色肖像全流程教程
  • ClawX 本地部署实战:OpenClaw 安装、API 配置与用法详解
  • GISer必备收藏:5款主流GIS工具优缺点全解析
  • 2026年东莞宠物项圈厂家推荐榜:防水宠物项圈、项圈外贸、项圈定制、项圈OEM工厂、项圈ODM工厂创新选择指南 - 海棠依旧大