当前位置: 首页 > news >正文

小白也能学会!Dify搭建知识库智能体,轻松解决公司信息查找难题!

01 先聊聊痛点

你有没有遇到过这些情况:

新员工入职,翻了两天文档找不到报销流程,最后还得问老员工;销售见客户前想问个产品参数,在群里@了半天技术,没人回。

问题的本质不是没有文档,而是文档太多、太散、不好找。

传统的关键词搜索,你得猜对词才能找到;比如你想查「年假怎么休」,文档里写的是「带薪年休假实施办法」,关键词对不上,就搜不到。

知识库智能体解决的就是这个问题:你不用猜词,用自然语言问,它就能理解你的意思,从文档里找到答案。

02 知识库是怎么工作的

简单说一下原理,不复杂。

传统搜索是「关键词匹配」,你搜「年假」,它找带「年假」两个字的文档;文档里写的是「带薪年休假」,对不起,搜不到。

知识库用的是「语义搜索」,它把你的问题转换成一串数学向量,去文档库里找意思相近的内容;所以「年假怎么休」和「带薪年休假实施办法」虽然在字面上不一样,但在语义上是匹配的。

这个过程叫 RAG(检索增强生成),三个步骤:

第一步,索引:上传文档后,Dify 会自动把文档切分成小段,然后转成向量存起来。

第二步,检索:你提问的时候,系统把你的问题也转成向量,去库里找最相关的几个片段。

第三步,生成:把找出来的片段加上你的问题,一起发给大模型,让它组织答案。

大模型并不「知道」你的文档内容,它只是根据检索出来的片段来回答;这样既保证答案有依据,又能利用大模型的表达能力。

03 动手搭建

好了,理论说完了,咱们开始动手~

3.1 准备工作

上篇文章我们搭过dify了,这里直接拿来用

浏览器访问http://你的虚拟机IP,用管理员账号登录

大模型我用的是DeepSeek,用国内的通义千问也行,dashscope.aliyun.com,也送免费额度;OpenAI效果最好但需要海外支付~

配置入口在「设置」→「模型供应商」,选择模型后填 API Key 👇

第一次玩推荐DeepSeek,注册就送额度,不用绑卡

3.2 准备知识库内容

为了演示,我准备了一份《公司员工休假管理制度》文档,可以直接复制下面的内容保存成一个txt、md或word文件用来测试。

# 公司员工休假管理制度## 第一章 总则第一条 为规范公司休假管理,保障员工合法权益,根据国家相关法律法规,结合公司实际情况,制定本制度。第二条 本制度适用于公司全体正式员工。## 第二章 年休假第三条 员工累计工作已满1年不满10年的,年休假5天;已满10年不满20年的,年休假10天;已满20年的,年休假15天。第四条 国家法定休假日、休息日不计入年休假假期。第五条 年休假在1个自然年度内可以集中安排,也可以分段安排,一般不跨年度安排。确有必要跨年度安排的,可以跨1个年度安排。第六条 员工有下列情形之一的,不享受当年的年休假:(一)累计工作满1年不满10年,请病假累计2个月以上的;(二)累计工作满10年不满20年,请病假累计3个月以上的;(三)累计工作满20年以上,请病假累计4个月以上的。## 第三章 病假第七条 员工请病假需提供医院出具的病假证明。第八条 病假期间工资按以下标准发放:(一)工龄不满2年,按本人工资的60%计发;(二)工龄满2年不满4年,按本人工资的70%计发;(三)工龄满4年不满6年,按本人工资的80%计发;(四)工龄满6年不满8年,按本人工资的90%计发;(五)工龄满8年及以上,按本人工资的100%计发。第九条 医疗期最长不超过24个月。## 第四章 事假第十条 员工请事假须提前3个工作日申请,经批准后方可休假。第十一条 事假期间不计发工资。## 第五章 婚假第十二条 员工结婚可享受婚假3天。晚婚员工(男满25周岁,女满23周岁)增加婚假7天。第十三条 婚假须在领取结婚证后6个月内一次性休完。## 第六章 产假第十四条 女职工生育享受产假98天,其中产前可以休假15天。第十五条 难产的,增加产假15天;生育多胞胎的,每多生育1个婴儿,增加产假15天。第十六条 女职工怀孕未满4个月流产的,享受15天产假;怀孕满4个月流产的,享受42天产假。## 第七章 请假流程第十七条 所有请假均需通过OA系统提交申请,按以下权限审批:(一)请假1天以内,由部门主管审批;(二)请假1-3天,由部门总监审批;(三)请假3天以上,由分管副总审批。第十八条 请假申请须在休假开始前完成审批。紧急情况可先口头请示,事后3个工作日内补办手续。## 第八章 附则第十九条 本制度自2024年1月1日起执行。第二十条 本制度由人力资源部负责解释。

也可以用自己公司的文档,原理是一样的

3.3 创建知识库

点击「知识库」➔「创建知识库」

然后上传刚才准备好的文档

点击「下一步」

这里有几个设置比较关键:

  1. 分段最大长度,我习惯设 500,太长了检索不准,太短了语义不连贯,500 算是个比较平衡的值。
  2. 分段重叠长度设 50,这个是为了防止关键信息正好被切在两段的边界上,留一点重叠能兜住。
  3. 索引方式建议选「高质量」,效果比「经济」模式好不少。

不过这里有个坑,我用 DeepSeek,选「高质量」的时候提示不兼容👇

如果不想换模型,选「经济」模式也能用,只是检索精度会差一些,这里我就先选「经济」模式了~

点「保存并处理」,系统开始处理文档

处理完成后,点击「前往文档」

进来之后能看到文档被切成了一个个片段,Dify还提供了数据标注功能,可以手动调整片段内容和关联问题,不过咱们第一次玩,先保持默认看看效果

3.4 创建聊天助手

知识库准备好了,接下来搭一个前台来回答问题

点顶部菜单的「工作室」,选「聊天助手」,然后点「创建空白应用」

名称写「HR助手」

进去之后是编排页面。

中间是工作区,右边可以调试。

先写一段系统提示词,告诉AI它的角色和行为规范👇

你是一个专业的HR助手,负责回答员工关于休假制度的问题。回答要准确、简洁,并且注明信息来源。如果问题超出知识库范围,请告知用户联系人力资源部。

然后在「知识库」这里点「添加」,选刚才创建的「公司员工休假管理制度」文档

04 测试效果

下面来试几个问题:

① 先问个简单的

我工作3年了,年假有几天?

② 再来个带条件的

我工作12年了,今年请了4个月病假,还能休年假吗?

③ 最后试个知识库里没有的

公司附近有什么好吃的?

以上就是 Dify 搭建知识库智能体的入门流程,全程不到半小时,你的第一个智能体就上线了。

关于 Dify 还能怎么玩,后面咱们慢慢聊。


说真的,这两年看着身边一个个搞Java、C++、前端、数据、架构的开始卷大模型,挺唏嘘的。大家最开始都是写接口、搞Spring Boot、连数据库、配Redis,稳稳当当过日子。

结果GPT、DeepSeek火了之后,整条线上的人都开始有点慌了,大家都在想:“我是不是要学大模型,不然这饭碗还能保多久?”

我先给出最直接的答案:一定要把现有的技术和大模型结合起来,而不是抛弃你们现有技术!掌握AI能力的Java工程师比纯Java岗要吃香的多。

即使现在裁员、降薪、团队解散的比比皆是……但后续的趋势一定是AI应用落地!大模型方向才是实现职业升级、提升薪资待遇的绝佳机遇!

这绝非空谈。数据说话

2025年的最后一个月,脉脉高聘发布了《2025年度人才迁徙报告》,披露了2025年前10个月的招聘市场现状。

AI领域的人才需求呈现出极为迫切的“井喷”态势

2025年前10个月,新发AI岗位量同比增长543%,9月单月同比增幅超11倍。同时,在薪资方面,AI领域也显著领先。其中,月薪排名前20的高薪岗位平均月薪均超过6万元,而这些席位大部分被AI研发岗占据。

与此相对应,市场为AI人才支付了显著的溢价:算法工程师中,专攻AIGC方向的岗位平均薪资较普通算法工程师高出近18%;产品经理岗位中,AI方向的产品经理薪资也领先约20%。

当你意识到“技术+AI”是个人突围的最佳路径时,整个就业市场的数据也印证了同一个事实:AI大模型正成为高薪机会的最大源头。

最后

我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。

我整理出这套 AI 大模型突围资料包【允许白嫖】:

  • ✅从入门到精通的全套视频教程
  • ✅AI大模型学习路线图(0基础到项目实战仅需90天)
  • ✅大模型书籍与技术文档PDF
  • ✅各大厂大模型面试题目详解
  • ✅640套AI大模型报告合集
  • ✅大模型入门实战训练

这份完整版的大模型 AI 学习和面试资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

①从入门到精通的全套视频教程

包含提示词工程、RAG、Agent等技术点

② AI大模型学习路线图(0基础到项目实战仅需90天)

全过程AI大模型学习路线

③学习电子书籍和技术文档

市面上的大模型书籍确实太多了,这些是我精选出来的

④各大厂大模型面试题目详解

⑤640套AI大模型报告合集

⑥大模型入门实战训练

👉获取方式:
有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

http://www.jsqmd.com/news/711314/

相关文章:

  • 视频扩散模型实现4D可控生成:子弹时间特效新突破
  • 2026 收藏|大模型爆发期来袭!小白 程序员零基础转型全攻略
  • 如何快速配置剑网3自动化脚本:JX3Toy新手完整指南
  • Qwen2.5多模态大模型与历史文档OCR技术解析
  • mediasoup中ip与announceAddress配置要点
  • DeepSeek-V4横空出世!AI巨头争相接入,国产大模型引领算力浪潮!
  • 视觉生成模型:离散与连续表示的技术对比与优化
  • 【开源首发】全域场态原生架构:根底座级AI原生架构开源
  • 开源工具opik:文本数据集质量评估与清洗实战指南
  • 大模型自学指南:13本不可或缺的书籍,2026最新的大模型书籍都在这里!
  • 2026年4月运城防水机构****:一城一家防水为何备受青睐? - 2026年企业推荐榜
  • DeepSeek-V4重磅发布!百万字上下文、Agent能力开源第一、4元百万Token,国产大模型再爆王炸!
  • 【Docker AI沙箱生产落地黄金法则】:20年SRE亲授5大隔离失效陷阱与零事故部署 checklist
  • 微信聊天记录永久保存:WeChatMsg完整免费解决方案
  • 终极数据恢复指南:如何用TestDisk PhotoRec拯救丢失的分区和文件
  • Android Studio 常用快捷键总结
  • 扩散策略与GPC框架在机器人控制中的应用解析
  • 如何用evernote-backup工具完整保护你的数字笔记资产
  • DeepSeek-V4 爆发!无预告开源,百万上下文+华为昇腾,中国AI破局之战!
  • 洞察2026年4月奉贤白蚁防治市场:上海惠特尼白蚁消杀的专业壁垒解析 - 2026年企业推荐榜
  • 基于Remotion与AI TTS的全自动视频播客制作流水线实战
  • UniDFlow框架:多模态生成系统的统一概率接口与优化策略
  • 基于大语言模型的智能PPT生成:Agent架构、提示词工程与Python-pptx实践
  • C语言固件安全加固黄金标准(2024版):静态代码混淆+动态内存指纹+可信启动链三重熔断机制
  • 【Docker AI Toolkit 2026终极指南】:5大颠覆性新功能+3类生产环境避坑清单,早用早降本37%
  • 如何用FanControl在5分钟内彻底掌控电脑风扇:新手必看的完全指南
  • 2026年Q2非开挖修复管道深度解析:成都厂家地址与材料优势 - 优质品牌商家
  • Avey-B模型架构解析:动态与静态层协同设计
  • 高效解决EPUB电子书编辑复杂问题的完整方案
  • 2026年4月新消息:四川地区高性价比隔音棉采购指南及厂家联系解析 - 2026年企业推荐榜