当前位置: 首页 > news >正文

【AI】第三篇 RAG是什么

一、RAG 的完整工作流程(一步拆透)

RAG 不是单一技术,而是 “检索→增强→生成” 的闭环流程,每一步都有明确作用:
  1. 用户提问:比如 “2025 年污水厂氨氮排放标准最新要求是什么?”(环保场景典型问题)
  2. 问题预处理:LLM 先理解问题意图,转化为 “检索关键词 / 向量”(比如提取 “2025 污水厂 氨氮 排放标准”)【大模型的分析能力,提取重点】
  3. 检索阶段:检索器(Retriever)从知识库(环保法规文档、行业标准 PDF)中,通过 “向量匹配 / 关键词匹配” 找到最相关的内容片段(比如《城镇污水处理厂污染物排放标准(GB 18918-2024 修订版)》中氨氮限值条款)
  4. 增强阶段:将 “用户问题 + 检索到的相关片段” 一起喂给 LLM(相当于给 LLM “开卷考试”,提供参考资料)  【大模型对数据分析,归纳总结】
  5. 生成阶段:LLM 基于参考资料回答问题,同时标注信息来源(比如 “根据 GB 18918-2024 第 5.2 条,一级 A 标准氨氮限值为 1.5mg/L”)

二、RAG 的核心组件(缺一不可)

你提到的 “检索器、知识库、LLM” 是三大核心,我们展开说明每个组件的作用和选型要点:
组件核心作用环保行业选型建议
知识库 存储结构化 / 非结构化数据(文档、表格、API 数据) 优先用向量数据库(Milvus/Chroma)+ 传统数据库(MySQL),分别存储环保法规文档(非结构化)和监测数据(结构化)
检索器 精准找到与问题匹配的内容 混合检索(向量检索 + 关键词检索),比如用向量匹配找法规条款,用关键词匹配找监测数据编号
LLM 理解问题、整合检索内容、生成回答 通用场景用 Qwen/DeepSeek,专业场景用行业微调模型
嵌入(Embedding)+重排序 将文本转化为可计算的向量(检索的基础) 用 bge-large-zh,确保专业术语(如 “总氮”“TP”)的向量准确性

三、RAG 的 “增强” 价值再拆解

  总结的 “知识增强” 和 “可信度增强” 是核心

  1. 知识增强:突破 LLM 的 “知识过期” 问题

  • 比如LLM 训练数据截止到 2024 年,无法知道 2025 年新修订的行业标准;
  • 通过 RAG 对接最新的相关公告和文档,AI 能准确回答 “2025 年 VOCs 排放新要求”,实现知识实时更新。

  2. 可信度增强:杜绝 “幻觉”,符合环保合规要求

  • 某些行业对数据准确性要求极高(比如排污许可申报、环评报告撰写),RAG 让 AI 回答 “有据可查”;
  • 示例:AI 回答 “某污水厂总磷排放标准” 时,必须引用《GB 18918-2024》具体条款,而非凭空生成数值,避免合规风险。

四、RAG 的落地误区(环保行业需规避)

  1. 误区 1:认为 “把文档扔进向量库就完事”—— 一些文档(如监测报告、法规)有大量表格 / 公式,需先做结构化处理(比如用 OCR 提取表格数据),否则检索不到关键信息;
  2. 误区 2:忽略 “检索精度”—— 行业术语多(如 “CODcr”“BOD5”),需优化嵌入模型的专业词汇适配,避免检索到无关内容;
  3. 误区 3:不做 “来源标注”—— 行业合规场景要求回答可追溯,必须让 AI 标注信息来源(文档名称、条款号),否则无法用于正式报告。

总结

  RAG 的本质是 “让 AI 带着‘参考书’回答问题”—— 对大部分行业而言,这套架构既解决了 AI“不懂最新政策 / 企业数据” 的问题,又满足了合规场景下 “可追溯、无幻觉” 的要求,是目前大部分行业中 AI 应用中最成熟、最易落地的架构模式。
http://www.jsqmd.com/news/73133/

相关文章:

  • 【AI】前置篇 Ai Agent的全貌概览
  • 12.11 程序员修炼之道:从小工到专家 第八章 注重实效的项目 - GENGAR
  • 125K RFID解码
  • OneClip 开发经验分享:从零到一的 macOS 剪切板应用开发
  • LeeCode_4. 寻找两个正序数组的中位数
  • 考陪诊师为什么选北京守嘉陪诊报名? - 品牌排行榜单
  • task5
  • 【torch】torch.cat和直接相加的区别
  • Flink学习笔记:多流 Join
  • python装饰器 —— @lru_cache
  • Java基础补缺2
  • Ai元人文:对岐金兰观察的深度回应——价值协商与数值优化的范式调和
  • 如何编写优秀的 CLAUDE.md
  • 记最近找的一款时间管理软件 - Higurashi
  • 《综合项目实战-局域网内的沟通软件》
  • 1-Year XTOOL D9 EV Update Service: Keep Diagnostics Current for Euro/American Vehicles
  • AI智能相机未来应用 - 指南
  • 12/11
  • Boost Diagnostics with Autel MaxiVCI V150 Wireless Dongle – CAN FD/DOIP for 900 Series Scanners
  • 1-Year XTOOL X100 PADS Update: Keep Your Tool Updated for Euro/American Vehicles
  • 面向对象编程
  • 深入解析:[特殊字符] 在 Windows 上设置 SQLite
  • 爬虫专栏:抗封禁实战——代理技术全解析与央视节目爬虫落地案例
  • 实用工具:VS Code 配置 Markdown 编译器全指南
  • 实用指南:《嵌入式成长系列之51单片机 --- Keil5创建工程》
  • python —— 求解斐波那契数列
  • 机器学习超参数调优:十个实用的贝叶斯优化(Bayesian Optimization)进阶技巧
  • 模糊测试助力黑客攻防:关键信息泄露漏洞挖掘实录
  • 007.高精度模板(重载运算符)
  • 停止用 nohup 启动生产