当前位置: 首页 > news >正文

从 0 到 1 实战:基于 Qwen3 Embedding 构建 RAG 智能问答系统全指南(附教程)

RAGFlow 是一个基于深度文档理解的开源 RAG(检索增强生成)引擎。 与 LLM 集成后,它能够提供真实的问答功能,并以来自各种复杂格式数据的可靠引用为支撑。

使用云平台:OpenBayes

openbayes.com/console/sig…

首先点击「公共教程」,在公共教程中找到「构建 RAG 系统:基于 Qwen3 Embedding 的实践 」,单击打开。

页面跳转后,点击右上角「克隆」,将该教程克隆至自己的容器中。

平台会默认选配好原教程所使用的算力资源、镜像版本,不需要再进行手动选择。目前平台计费方式已经更新,大家可以按照需求选择「按量付费」或「包日/周/月」。点击「继续执行」,等待分配资源。


模型文件较大,稍等容器启动 5-6 分钟后访问,否则将显示「Bad Gataway」。代码和数据同步完成,带容器状态显示为「运行中」后,打开 API 地址。

一、启动 RAGFlow 服务器

本教程已为 RAGFlow 的服务配置完毕,您无需自行部署,启动容器后,可直接点击 API 地址访问。

二、创建一个知识库

借助多个知识库,您可以构建更灵活、更多样化的问答系统。要创建您的第一个知识库,请执行以下操作:

以下屏幕截图展示了知识库的配置页面。合理的知识库配置对于未来的 AI 聊天至关重要。例如,选择错误的嵌入模型或分块方法会导致聊天中出现意外的语义丢失或答案不匹配的情况。

1.选择分块

RAGFlow 提供多种分块模板,方便对不同布局的文件进行分块,并确保语义完整性。在分块方法中,您可以选择适合您文件布局和格式的默认模板。下表列出了每个支持的分块模板的描述及其兼容的文件格式:

注意:您还可以在数据集页面上更改文件的分块方法。

2.选择嵌入

嵌入模型将块转换为嵌入。一旦知识库包含块,它就无法更改。要切换到不同的嵌入模型,必须删除知识库中所有现有的块。支持以下嵌入模型:

3.上传 RAGFlow 的文件管理

允许您将一个文件链接到多个知识库。您也可以将单个文件或文件夹(批量上传)从本地计算机上传到知识库。 建议您将文件上传到「文件管理」,然后再链接到目标知识库,以避免永久删除风险。

4.解析

文件解析的两个核心操作:

选择分块方法和嵌入模型后,即可开始解析文件。

5.干预文件解析

RAGFlow 允许您查看和干预分块结果:

6.运行检索

RAGFlow 使用「全文搜索 + 向量搜索」多重召回机制。建议在设置 AI 聊天前调整以下参数:

三、根据知识库建立 AI 聊天

知识库、无幻觉聊天和文件管理是 RAGFlow 的三大支柱。 RAGFlow 中的聊天基于一个或多个特定知识库。创建知识库并完成文件解析后,即可开始 AI 对话。

1.开始人工智能

您可以通过创建助手来开始 AI 对话: 单击页面中间顶部的「聊天选项卡 > 创建助手」,以显示下一个对话的聊天配置对话框。 RAGFlow 提供灵活的模型配置方式:每个对话可选择不同模型,也可在系统设置中配置默认模型。

2.配置助手信息

助手名称:您的聊天助手名称。每个助手都对应一个具备唯一配置的对话(知识库、提示、搜索设置等)。

空响应:

留空:RAGFlow 在无法检索到答案时尝试生成内容(可能出现幻觉)。

填写:限制回答来源于知识库,统一返回指定内容。

显示引用:默认启用。RAGFlow 会标明回答所依据的来源信息。

选择知识库:支持多选。需保证所选知识库使用相同的嵌入模型,否则会报错。

3.现在发送一个名为「XX 虚拟机图形虚拟化增强技术软件测试大纲 V3」的文档,在下面的对话框输入问题「责任作者是谁?」,点击发送,可以看到人工智能分析文档很快给出了正确答案。


将鼠标悬停在目标聊天助手上点击 「编辑」,显示聊天配置对话框:

四、开启第一个 Agent——创建 Text2SQL 代理

利用 RAGFlow 的 RAG 功能构建 Text2SQL 代理,可以弥合自然语言处理(NLP)和结构化查询语言(SQL)之间的差距。Text2SQL 代理致力于使数据库查询更加直观、用户友好,同时确保效率和准确性。它迎合了广泛的用户群体,从完全不懂技术的个人到经验丰富的数据分析师和开发人员。

1.数据准备

我们已经通过数据库定义脚本创建了一个简化的电商系统,并在Agent中建立好连接,包含以下四张表:

Customers(客户表)

CustomerID: 客户唯一编号(主键)

UserName: 用户名

Email: 邮箱

PhoneNumber: 电话号码

Products(产品表)

ProductID: 产品唯一编号(主键)

ProductName: 产品名称

Description: 产品描述 Price: 单价

StockQuantity: 库存数量

Orders(订单表)

OrderID: 订单唯一编号(主键)

CustomerID: 下单客户的编号(外键)

OrderDate: 下单日期

TotalPrice: 总金额

OrderDetails(订单详情表)

OrderDetailID: 明细项编号(主键)

OrderID: 所属订单编号(外键)

ProductID: 产品编号(外键)

UnitPrice: 单个商品价格

Quantity: 数量

TotalPrice: 明细总价(单价 × 数量)

这四张表共同描述了一个简化的电商系统。该系统能够记录以下信息:

客户信息:包括客户的基本信息,如用户名、邮箱和电话号码。

产品信息:包括产品的详细信息,如名称、描述、价格和库存数量。

订单信息:包括客户的订单记录,如下单日期和订单总金额。

订单详情:包括每个订单中具体包含的产品及其数量和价格。

2.配置知识库

对于 RAGFlow 基于 RAG 的 Text2SQL,通常需要以下知识库:

DDL(数据库表创建语句)

DB_Description(表和列的详细描述)

Q->SQL(自然语言查询描述以及相应的 SQL 查询示例)

在专业查询场景中,用户查询可能包含特定领域术语的缩写或同义词。如果用户引用了特定领域术语的同义词,系统可能无法生成正确的 SQL 查询。因此,建议整合同义词库以帮助代理生成更准确的 SQL 查询:

3.运行并测试 选择代理,在上方面板选择Agent,并选择Text to SQL。

启动Text to SQL代理,点击运行按钮启动代理

输入问题「Help me summarize stock quantities for each product」,单击发送按钮将问题发送给代理,等待执行完成并查看对应的 SQL 查询结果。

通过以上步骤,您可以成功创建并测试 Text2SQL 代理,利用自然语言查询数据库,提高查询效率和准确性。

这里给大家精心整理了一份全面的AI大模型学习资源包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享

👇👇扫码免费领取全部内容👇👇

1. 成长路线图&学习规划

要学习一门新的技术,作为新手一定要先学习成长路线图方向不对,努力白费

这里,我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。可以说是最科学最系统的学习成长路线。

2. 大模型经典PDF书籍

书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础(书籍含电子版PDF)

3. 大模型视频教程

对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识

4. 2026行业报告

行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

5. 大模型项目实战

学以致用,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。

6. 大模型面试题

面试不仅是技术的较量,更需要充分的准备。

在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。

7. 资料领取:全套内容免费抱走,学 AI 不用再找第二份

不管你是 0 基础想入门 AI 大模型,还是有基础想冲刺大厂、了解行业趋势,这份资料都能满足你!
现在只需按照提示操作,就能免费领取:

👇👇扫码免费领取全部内容👇👇

http://www.jsqmd.com/news/503900/

相关文章:

  • 安防监控新助手:基于MogFace的人脸检测工具在安防场景的应用
  • 2026无人机实操培训及租赁选择优质机构推荐 - 优质品牌商家
  • S32DS实战指南:GPIO配置与按键控制LED的深度解析
  • ARM TCM vs 缓存:什么时候该用紧耦合存储器?选型指南
  • RTOS内存占用骤降42%,启动时间缩短至83ms(C语言级裁剪性能压测全记录)
  • Debian双网卡配置与NAT转发实战指南
  • CoPaw模型进行代码重构与优化建议生成效果实测
  • 5分钟搞定Google Images API调用:Python实战教程(附完整代码)
  • Qwen-Audio多语言语音识别效果展示:支持30+任务的实测对比
  • HY-MT1.5-7B翻译模型开箱即用:5步搞定多语言翻译服务搭建
  • Java程序员如何开发一个分布式系统?
  • nodejs+vue基于springboot的摄影设备租赁管理系统设计与
  • 【秣厉科技】LabVIEW工具包实战——二维码(QRCode)的生成、解码与自定义
  • FireRedASR-AED-L长音频处理效果展示:一小时访谈录音的精准转录
  • uniapp中使用uni.getLocation获取坐标后,如何精准匹配天地图?5步搞定偏移修正
  • 基于Django会话管理的视频学习平台防作弊策略优化
  • 视频资源高效管理:自媒体创作者的资源获取与整理解决方案
  • 从‘语义打架’到精准匹配:拆解DecAlign框架在情感分析中的跨模态融合黑科技
  • 深入解析Marvell MV88E6390交换机MDIO接口:Clause 22与Clause 45寻址模式实战指南
  • Qwen3.5-9B视觉语言模型入门必看:统一token训练机制详解
  • Nomic-Embed-Text-V2-MoE开发备忘:Java面试中常问的模型压缩与加速技术关联
  • AI裁员的风,还是吹向了造风的人
  • Python itertools.pairwise:从基础到实战的迭代器魔法
  • 【MCP协议性能安全双模基线】:基于Linux eBPF+eXpress Data Path的实时QoS保障方案,REST API无法复现的微秒级SLA控制(源码级配置手册限时开放)
  • Ostrakon-VL-8B模型效果深度评测:与Claude、GPT-4V多维度对比
  • GLM-4-9B-Chat-1M效果展示:输入整车电子电气架构文档,输出ECU通信矩阵与诊断协议
  • 从冰箱隔音到潜艇隐身:亥姆霍兹共振器在水声工程中的5个高阶应用案例
  • Qwen-Image定制镜像惊艳效果:Qwen-VL对艺术风格迁移图的创作意图解析
  • 春节写对联新姿势!春联生成模型-中文-base亲测:简单好用,效果惊艳
  • ArcGIS小白必看:5分钟搞定道路中心线提取(附详细操作截图)