当前位置: 首页 > news >正文

AI大模型之Agent,RAG,LangChain(二)

这一期我来详细分析一下RAG的基础理论知识.

RAG作为LLM重要的一种思想,在工作中的应用是相当广泛的.

一.为什么使用RAG

1.传统LLM

在传统LLM中,有四个重要的缺陷有待解决.

  • LLM的数据不是实时的.

在这里我举个例子,比如说,不使用LLM工具,直接询问当下热点事件,大模型会回答你他不知道,这是因为大模型的数据是不能自动更新的,他的数据停留在最后训练这个模型的时间点.

  • LLM缺乏专业领域的知识

就比如说,你想制造一个火箭,这是问不出来的.

  • LLM会造成信息泄露

公司内部的数据使用LLM会造成信息泄露,公司内部会有自己内部训练的LLM防止信息泄露.

  • 幻觉问题

LLM在不知道的问题上会胡编乱造,这就是幻觉问题.

2.RAG

为了解决LLM痛点,提出了RAG.

RAG叫做检索增强生成. 个人理解为:检索外部文档,提升生成结果的质量

那么RAG是如何解决传统LLM的痛点的.

下面是一个RAG大致的执行流程.

二:RAG工作原理

1.RAG执行流程

这里我自己画了一张RAG的大致执行流程:

在这里我们可以明显发现,有了RAG以后,传统LLM的缺陷被很好的解决了.

2.RAG缺陷

但是仔细观察执行图会发现,问题和外挂数据库结合后还是要在LLM里面处理,这还是会导致信息泄露.

如何解决这个问题呢?这里提供两种解决方法.

首先就是公司员工按需检索,其次是RAG通过用户检索提供片段内容回答.

总的来说就是通过减少信息暴露来解决RAG的这个缺陷.

三:RAG详细执行流程

我在这里列出一张详细的RAG执行流程图:

大家可以先大致的看一下这个执行流程,下面我将详细的分析一下这张执行流程图,包括重点和注意点.

  • 服务端

用户输入问题-->向量嵌入用户输入的问题-->放到词向量库准备和专用知识库向量进行相似度匹配

  • 外挂知识库端

知识数据库里面有很多类型的数据(pdf,csv,word等),把这些格式的数据全部转换为字符串.然后把这些字符串切割为标准长度的chunk(数据块),然后进行向量嵌入处理后放到词向量库和词向量进行相似度匹配.

  • 输出端

客户端提问向量和外挂知识库相似度匹配后根据需求找出匹配度前几项,然后把这几项和原始问题结合起来组成prompt,把prompt提供给LLM处理后输出结果.

这里我来解释一下什么是向量嵌入.

向量嵌入指的是给你输入的文本贴上标签.对于用户提问来说,就是给你的提问变成向量然后贴上标签,对于外挂知识库来说,就是给你的chunk变成词向量然后贴上标签.

这就是RAG执行的细致流程.

四.常见的向量库

这里我自己总结了一写常见的向量库,我们使用的较多的是milvus.他们各自适用的场景我也列出来提供比较.

五.小结

个人认为这一节的基础知识是学习LangChain的重要部分,务必要完全掌握.列出几个比较简单的问题来回忆.

http://www.jsqmd.com/news/84329/

相关文章:

  • 技术周报 | 特朗普签令统一AI监管;长三角启动应用征集;多场开发者大会本周密集召开
  • 恢复条码至compvalue里
  • 北京陪诊服务权威推荐榜单 - 品牌排行榜单
  • HNOI2019《序列》
  • 峰值检测电路
  • 基于Java的安全生产投诉智慧管理系统的设计与实现全方位解析:附毕设论文+源代码
  • 【Godot】【入门】Godot 是什么?适合做哪些类型的游戏(附路线图+避坑清单)
  • 北京上门收画服务权威推荐榜单​ - 品牌排行榜单
  • 从零到一:构建一个实时语音翻译应用(Vue3 + Web Speech API)
  • 前端性能与监控指标采集系统设计方案
  • PWA资产生成器终极教程:5分钟快速创建专业级图标和启动画面
  • 基于PyTorch的深度学习基础课程之十:损失函数
  • 学习Linux要注意的地方
  • 43、Python 并发与网络编程全解析
  • Spark:革命性的命令行数据可视化工具,让DevOps监控更高效
  • [技术讨论] 三极管高低温特性测试
  • 12306反反爬虫策略:Python网络请求优化实战
  • 清华virtuoso简明教程PDF资源完整指南
  • # NCHUD-数字电路模拟程序和课堂测验
  • Android Studio + Gemini 移动创建领域的一次范式转移
  • 20251213 - 最小生成树
  • ISC-3000S的U-Boot 镜像头部解析
  • 实战干货:影刀RPA一键生成小红书竞品分析报告,效率飙升[特殊字符]
  • 影刀RPA×AI双剑合璧!小红书商品笔记自动发布,效率飙升50倍![特殊字符]
  • 基于Java的安全检查巡视智慧管理系统的设计与实现全方位解析:附毕设论文+源代码
  • 基于Java的安全生产智经营理系统的设计与实现全方位解析:附毕设论文+源代码
  • MarkDown指令学习
  • 还在手动上架TikTok商品?影刀RPA一键搞定,效率提升500%[特殊字符]
  • 基于Java的安全生产检查统计分析智慧管理系统的设计与实现全方位解析:附毕设论文+源代码
  • 3步打造Switch专属开机动画:让你的主机从启动就与众不同