当前位置: 首页 > news >正文

大模型应用开发:从RAG到Agent的智能问答系统优化之路,解决场景区分不清的难题

文章讲述了智能问答系统从纯RAG技术到结合Agent技术的优化过程。针对三个子场景中结构化和非结构化数据混合查询的问题,作者最初按场景建立三个知识库,但遇到召回率低、场景判断不准的困境。后改为从数据类型维度建立两个知识库(结构化和非结构化),并实现条件查询和相似度查询两种工具。通过让模型根据查询需求选择合适工具,并结合type字段判断场景,成功解决了多场景混合数据查询难题,技术实现更简单且效果显著提升。


大模型应用开发流程正确,但结果不一定正确。

由于大模型技术的复杂性,再加上不同业务场景的特殊需求,导致大模型应用的开发难度很大;但大模型应用开发最难的不是做出来而是要做好。

这次还以作者手里的智能问答项目来说,记录一下智能问答系统的踩坑记录,从怎么都达不到想要的效果,到能够很好的满足业务场景。

从作者这些年的开发经验来看,很多时候开发技术栈是有限的,遇到问题更多的是思路问题而不是纯粹的技术问题。

智能问答系统的优化方案

在介绍解决方案之前先来再简单介绍一下项目背景。

作者手里的这个项目是一个智能问答场景,但根据业务类型又区分为三个不同的子场景,并分别对应三种不同的知识问答。业务需求上要求这三个子场景使用同一个入口,并最好能不需要人工区分场景(如三个子菜单或下拉框),能够让系统根据问题智能判断不同的场景并选择不同的文档。

业务架构如下所示:

但这里有几个问题,场景1和场景2除了知识文档不同,其它的都很相似,文档类型也都是word,pdf这种非结构化数据;但场景3比较特殊,它的主要功能是查数据,而且文档类型是结构化+非结构化数据。

说到场景3可能有些人不是很理解这有什么特殊的地方,下面我们就来解释一下场景3的特殊点。

先说查数据,在之前的文章中有提到过查数据这个问题;在RAG增强检索中,检索和增强是分开的,并且没有限制检索的方式是相似度语义检索还是基于传统的数据库结构化检索。

但在基于自然语言的对话中,如果使用相似度语义检索很简单,直接把问题和知识转换成向量,然后进行相似度匹配就行了;但如果要使用传统的条件筛选,这就需要使用智能体(agent)技术了。

所以这个就是基于语义检索的缺陷问题,无法实现条件匹配;而智能体可以让模型理解用户的问题,然后生成查询条件调用接口或生成SQL进行条件检索。

第二个问题是,场景3的知识文档是结构化数据+非结构化数据;结构化数据需要使用条件筛选,非结构化数据需要使用语义匹配,这样才能达到最好的效果;虽然理论上把结构化数据转换成markdown或html格式,也可以实现相似度检索,但这种方式在实操检验中效果并不好。

所以说,怎么用技术解决这个问题?技术架构应该怎么做?

刚开始由于业务需求不明确,也没现在这么复杂,并且对业务和技术了解不深;所以作者选择的是使用纯RAG技术解决来实现这个功能,并且基础的技术架构是根据三个子场景,创建三个不同的知识库,也就是三张表(数据量不大,也就几万条)。

技术架构如下所示,是通过把非结构化数据转换成markdown这种半结构化数据保存到向量库中;而结构化数据,采用markdown+元数据的方式进行保存。

但是,经过实测发现这种效果很差,用户那边一直反馈效果不理想,甚至会胡编乱造;而从技术的角度来看就是,文档召回率和准确率都不足,虽然使用了很多种召回优化的手段,但都没有达到想要的效果,特别是三个场景区分不清楚。

这时作者区分三个子场景的实现原理是,根据用户问题先去三个知识库中分别检索相关数据,然后再重排序之后,找到其中相关性最高的,这个文档在哪个知识库,就是那个子场景。但由于文档召回率和准确率不足,导致场景判断也出现偏差。

所以,这时想的是既然纯RAG或者说相似度检索解决不了问题,那么我们就用智能体去解决。

但说起来简单,但等到真正把技术和业务结合的时候才发现,好像远远没有那么简单。

首先的问题就是,设计几个智能体,从哪个维度设计智能体?

如果给每个场景都单独设计一个智能体,那在不主动区分场景的情况下,我怎么知道调用那个智能体呢?

如果从场景的维度的维度设计智能体,那怎么解决相似度查询和条件查询的问题,工具上怎么设计,怎么实现,怎么匹配?

这个问题大家可以先思考一下,然后再看下面的解决方案。

所以,现在新的解决方案是什么样的呢?

解决方案

首先,作者刚开始就陷入了一个思维误区,那就是知识库为什么要根据三个场景建立三个知识库,不能从其它维度建立知识库吗?

既然三个场景无法区分,并且知识文档分为结构化和非结构化文档,并且只有第三种场景才有结构化文档;那么我们就可以从结构化和非结构化的角度来建立知识库。

因此,作者就创建了两个知识库,一个知识库用来保存第三种场景的结构化数据;这样就可以完全使用条件查询或者组合条件(标量)查询和相似度查询;而另外一个知识库专门用来保存非结构化文档,并且使用type字段来区分三种不同的场景。

这样业务逻辑就简单多了,而且实现智能体时也简单多了;只需要实现两个工具即可,一个是条件查询工具,另一个是相似度查询工具;简单来说就是两个知识库各实现一个查询工具即可。

然后在工具介绍中告诉模型,需要查数据的使用条件查询工具,需要匹配概念,语义的使用相似度查询工具。

这样在调用相似度查询工具时,再根据工具的返回结果中的type字段来判断到底属于哪个子场景。

如下图所示:

这样就完美解决了结构化文档和非结构化文档的混合查询问题,以及不同场景的判断问题。最重要的是其在技术实现上也变得简单了好多。

而且,经过实际测试,其效果远比之前的纯相似度检索效果要好上许多。

AI时代,未来的就业机会在哪里?

答案就藏在大模型的浪潮里。从ChatGPT、DeepSeek等日常工具,到自然语言处理、计算机视觉、多模态等核心领域,技术普惠化、应用垂直化与生态开源化正催生Prompt工程师、自然语言处理、计算机视觉工程师、大模型算法工程师、AI应用产品经理等AI岗位。

掌握大模型技能,就是把握高薪未来。

那么,普通人如何抓住大模型风口?

AI技术的普及对个人能力提出了新的要求,在AI时代,持续学习和适应新技术变得尤为重要。无论是企业还是个人,都需要不断更新知识体系,提升与AI协作的能力,以适应不断变化的工作环境。

因此,这里给大家整理了一份《2025最新大模型全套学习资源》,包括2025最新大模型学习路线、大模型书籍、视频教程、项目实战、最新行业报告、面试题等,带你从零基础入门到精通,快速掌握大模型技术!

由于篇幅有限,有需要的小伙伴可以扫码获取!

1. 成长路线图&学习规划

要学习一门新的技术,作为新手一定要先学习成长路线图,方向不对,努力白费。这里,我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。

2. 大模型经典PDF书籍

书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础(书籍含电子版PDF)

3. 大模型视频教程

对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识

4. 大模型项目实战

学以致用,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。

5. 大模型行业报告

行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

6. 大模型面试题

面试不仅是技术的较量,更需要充分的准备。

在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。

为什么大家都在学AI大模型?

随着AI技术的发展,企业对人才的需求从“单一技术”转向 “AI+行业”双背景。企业对人才的需求从“单一技术”转向 “AI+行业”双背景。金融+AI、制造+AI、医疗+AI等跨界岗位薪资涨幅达30%-50%。

同时很多人面临优化裁员,近期科技巨头英特尔裁员2万人,传统岗位不断缩减,因此转行AI势在必行!

这些资料有用吗?

这份资料由我们和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。


大模型全套学习资料已整理打包,有需要的小伙伴可以微信扫描下方CSDN官方认证二维码,免费领取【保证100%免费】

http://www.jsqmd.com/news/115620/

相关文章:

  • UVa 12018 Juice Extractor
  • JSP标签JSTL标签EL表达式
  • 大数据工程师必看:批处理性能优化的10个黄金法则
  • ProcessExplorer_17.09_x64-Chs 新版本升级:我看到的区别与优势(含升级思路与注意点)
  • SpringBoot勤工助学信息管理高效的平台|1125(领完整源码)可做计算机毕业设计JAVA、PHP、爬虫、APP、小程序、C#、C++、python、数据可视化、全套文案
  • COMSOL激光超声仿真:激光激发超声波的产生瑞利波的数值模拟 版本为6.1,低于此版本打不开此模型
  • AI Agent在企业数字化转型中的关键角色与实施策略
  • 从零到飞:四旋翼无人机智能控制与路径规划全解析
  • 3Arduino IDE 安装
  • AI Agent架构师必备:30个核心术语速成指南
  • 水凝膜、电镀钢化膜和UV光固膜哪个更防指纹,哪个透光更高呢?排序一下?
  • 【节点】[LinearToGammaSpaceExact节点]原理解析与实际应用
  • 2Arduino 板型号
  • 大模型岗位全解析:从预训练到应用开发,5大梯队深度指南+2026转型攻略
  • 【硕士论文完美复现】【价格型需求响应】基于需求侧响应的配电网供电能力综合评估(Python代码实现) - 指南
  • 8款AI论文辅助工具全面评测:改写与原创写作能力分析
  • 详细介绍:测试用例的八大核心要素
  • 线性筛素数 - Rye
  • 从“软件3.0”到“深度求索”:我们这代程序员,正站在一个怎样的路口?
  • 提示词工程精华总结:掌握ICIO框架与五大核心要素,AI应用效率翻倍,建议收藏!
  • 提示词工程精华总结:掌握ICIO框架与五大核心要素,AI应用效率翻倍,建议收藏!
  • 网络传输原理(TCP/IP)
  • 大模型应用开发避坑指南:从Demo到实战的6大性能陷阱与解决方案
  • CSS animation-timeline动画时间线 - 详解
  • 广州新加坡留学机构 TOP5 评测!大湾区优质教育培训机构榜单发布,助力学子规划海外升学之路 - 全局中转站
  • Aspire 与 Azure Functions 深度集成:架构范式、工程实践与运维
  • AI大模型引发的产业变革:把握智能时代机遇的全面指南
  • 广州英国留学机构TOP5评测!大湾区优质升学机构榜单发布,助力学子规划海外升学之路 - 全局中转站
  • 杭州到大连、沈阳、鄂尔多斯、包头、呼和浩特、长春、哈尔滨、大庆搬家公司搬家物流省心推荐!跨省搬家费用明细 - 物流人
  • Collections.unmodifiableSet()