当前位置: 首页 > news >正文

【2026最新版|收藏备用】用Skill简化大模型知识库连接,小白程序员入门必看

本文专为2026年入门大模型的小白、程序员打造,详细介绍如何通过Skill技术简化大模型与外部知识库的对接流程,对比传统RAG方法的繁琐痛点,手把手讲解Markdown(.md)格式文档的存储技巧、SKILL.md文件的技能描述与导航方法,推荐2026年Obsidian最新版本及官方CLI工具的高效用法,最后通过完整个人知识库实践案例,演示如何结合OpenClaw 2026最新版与Skill,实现用户、大模型之间的可读可写交互闭环,全程实操性拉满,建议收藏备用!

1、md文件

提到信息存储,一般都是txt、word、excel、ppt、pdf等格式的文件,这也是之前在RAG使用中,导入文件时常见的格式。

而随着OpenClaw的火爆,Markdown(后缀为.md)格式的文件也大量被使用。这是能让AI读懂的,最好的格式之一。

  • OpenClaw的记忆系统(memory.md)、灵魂三件套(AGENTS.md、SOUL.md、USER.md)等,都是使用的md文件。

  • Skill也是使用的SKILL.md文件来描述技能。

要想将现在有文档,转换为md格式的,有很多工具能实现,例如上海人工智能实验室开源的MinerU

官网:https://mineru.net

https://github.com/opendatalab/MinerU

2、Skills

之前讲过Skills的目录结构

那么想要实现知识库的架构,其中一种做法是:

  • references里,放你的各种文件;SKILL.md作为导航。
  • SKILL.md文件里的name,是这个技能的名称。
  • SKILL.md文件里的description,是这个技能的描述,告诉大模型,何时可使用这个技能。
  • SKILL.md文件里的正文,则是对references的各个文件的概括,便于大模型知道要去找哪个md文件。

以上这些工作,都不用自己去做,只要把规则发给龙虾,他就能调用自带的skill-creator技能来创建一个我们需要的skill。

此外,还可以接着改善,例如将知识库文档外移;references中增加对pdf、excel等文件的处理说明;scripts中增加具体的处理脚本等。

https://github.com/ConardLi/rag-skill

3、Obsidian

md的笔记软件有很多,例如Obsidian、Typora、Nation、有道、印象等,这些里面,最推荐的就是Obsidian(黑曜石)。因为他全力支持CLI(命令行界面)。

https://obsidian.md/zh

官方在2026年发布的1.12版本中,正式推出了官方的CLI工具。功能非常全面,正如其口号所说:“Anything you can do in Obsidian you can do from the command line.”(你在 Obsidian 里能做的任何事,都可以通过命令行完成)。

OpenClaw官方自带的Obsidian的skill,使用的是第三方的CLI工具,建议禁用,重新下载官方CLI的技能。

为啥要用CLI,Linux系统自带的grep不行吗?

  • 性能差异显著:对于孤立笔记、全库语义搜索等方面,CLI更快。Token消耗更少。
  • 真正的语义搜索:CLI调用的是ob自身的搜索引擎,支持标签、属性、反向链接等高级查询方式。这意味着用户长期积累的双向链接、MOC结构、标签体系等知识组织成果,终于能够被AI Agent真正“理解”和“看见”。

至此,我们实现了一个可读可写,相互交互的闭环:

  • 用户写:可通过ob的GUI界面创建内容;

  • 龙虾读:将ob作为知识库,调用官方的CLI查询内容。

  • 龙虾写:可通过skill,来调用官方的CLI,写入内容。例如用户发送一个链接,龙虾使用x-reader等工具,访问网址、读取内容、调用CLI、写入ob;

  • 用户读:可通过ob的GUI界面,读取龙虾写入的内容;

4、个人知识库实践

就来一个很简单的个人知识库实操。

1、用户通过ob的GUI界面写入文档。

2、OpenClaw安装skill(获取调用CLI的技能)。

3、OpenClaw创建一个skill,通过CLI读取文档,并返回结果。

4、用户通过OpenClaw查询。

1、写入ob文档

本来应该是用户日常输入的文档内容,这里为了方便,直接使用MinerU的Skill来将一个在线文档,转换成md文档。

首先安装skill。mineru支持多种虾

https://mineru.net/ecosystem

根据提示去安装即可。或者通过腾讯的skillhub来安装。

https://skillhub.tencent.com

clawhub install mineru-ai skillhub install mineru-ai

然后将对应文档链接发给龙虾,要求他转换为md格式,并保存到指定目录中。

使用mineru-ai这个技能,将这个网页转换为md格式的文件,保存到 /home/leger/obdata 这个目录下,https://www.court.gov.cn/zixun/xiangqing/233181.html,去除段前的空格

2、安装ob cli skill

ob官方目前没有提供明确的CLI Skill,需要使用别的用户上传的技能。ClawHub上有很多,随便找一个即可。

clawhub install obsidian-cli-official

确保Obsidian在运行,且设置里开启了CLI,并成功注册到环境变量。

使用前,可先验证该技能是否能正常使用。一般都是让龙虾自己进行测试,确保该Skill所需的环境变量、插件等都已安装成功。

这里有个坑,建议是卸载重装官方最新版本。

两个版本都要达标

不然可能会报错

3、创建skill

4、通过OpenClaw查询

5、禁用approve

在OpenClaw2026.3.28版本中,官方就加上了审批approve的功能。龙虾在调用工具、执行操作时,需要用户审批。此后的版本中(3.31、4.1、4.2等),也一直有这个功能,并对消息渠道等方面进行了优化。

如何关闭呢?有两个文件需要修改。

1、openclaw.json

web界面操作

或者直接修改json文件

"tools": { "profile": "full", "exec": { "security": "full", "ask": "off" } },

2、exec-approvals.json

在.openclaw目录下,有个exec-approvals.json文件也需要修改。

改成如下的即可。

"defaults": { "security": "full", "ask": "off", "askFallback": "full", "autoAllowSkills": false }, "agents": { "main": { "security": "full", "ask": "off", "askFallback": "full" } }

两个都改完之后,记得重启Gateway。

以上内容,截至OpenClaw2026.4.1版本。

最后

对于正在迷茫择业、想转行提升,或是刚入门的程序员、编程小白来说,有一个问题几乎人人都在问:未来10年,什么领域的职业发展潜力最大?

答案只有一个:人工智能(尤其是大模型方向)

当下,人工智能行业正处于爆发式增长期,其中大模型相关岗位更是供不应求,薪资待遇直接拉满——字节跳动作为AI领域的头部玩家,给硕士毕业的优质AI人才(含大模型相关方向)开出的月基础工资高达5万—6万元;即便是非“人才计划”的普通应聘者,月基础工资也能稳定在4万元左右

再看阿里、腾讯两大互联网大厂,非“人才计划”的AI相关岗位应聘者,月基础工资也约有3万元,远超其他行业同资历岗位的薪资水平,对于程序员、小白来说,无疑是绝佳的转型和提升赛道。


对于想入局大模型、抢占未来10年行业红利的程序员和小白来说,现在正是最好的学习时机:行业缺口大、大厂需求旺、薪资天花板高,只要找准学习方向,稳步提升技能,就能轻松摆脱“低薪困境”,抓住AI时代的职业机遇。

如果你还不知道从何开始,我自己整理一套全网最全最细的大模型零基础教程,我也是一路自学走过来的,很清楚小白前期学习的痛楚,你要是没有方向还没有好的资源,根本学不到东西!

下面是我整理的大模型学习资源,希望能帮到你。

👇👇扫码免费领取全部内容👇👇

1、大模型学习路线

2、从0到进阶大模型学习视频教程

从入门到进阶这里都有,跟着老师学习事半功倍。

3、 入门必看大模型学习书籍&文档.pdf(书面上的技术书籍确实太多了,这些是我精选出来的,还有很多不在图里)

4、AI大模型最新行业报告

2026最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

5、面试试题/经验

【大厂 AI 岗位面经分享(107 道)】

【AI 大模型面试真题(102 道)】

【LLMs 面试真题(97 道)】

6、大模型项目实战&配套源码

适用人群

四阶段学习规划(共90天,可落地执行)
第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范
第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署
第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建
第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型

  • 带你了解全球大模型

  • 使用国产大模型服务

  • 搭建 OpenAI 代理

  • 热身:基于阿里云 PAI 部署 Stable Diffusion

  • 在本地计算机运行大模型

  • 大模型的私有化部署

  • 基于 vLLM 部署大模型

  • 案例:如何优雅地在阿里云私有部署开源大模型

  • 部署一套开源 LLM 项目

  • 内容安全

  • 互联网信息服务算法备案

  • 👇👇扫码免费领取全部内容👇👇

3、这些资料真的有用吗?

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

http://www.jsqmd.com/news/786342/

相关文章:

  • Dify工作流实战:构建HR与网络安全AI应用脚本库
  • 09-扩展知识——05. date 类 - 处理日期
  • 基于Kubernetes的AI应用控制平面:kiro-acp架构解析与实践指南
  • Bean 会被 JVM 回收吗?
  • Animal-AI环境:连接强化学习与认知科学的3D虚拟实验室
  • 网络安全工程师超详细职业规划!零基础从入门到精通全程路线,看这一篇就够了
  • 收藏!2026年转AI大模型应用开发,正确学习顺序别踩坑(小白/程序员必看)
  • Undertow高性能Web服务器:架构解析与Java微服务实战
  • 医学影像分割:2D超图像与3D网络性能对比与选型指南
  • AI编程助手本地化提速:钩子拦截模式实现零延迟命令执行
  • Clawd-Code:基于LLM与代码库构建智能开发Agent的开源框架
  • CANN/cann-learning-hub:算子Kernel直调编程
  • 收藏必看!2026年AI内卷混战风口拆解,小白也能轻松入局大模型
  • OpenClaw本地AI智能体部署指南:从Docker到多平台实战
  • SSD主控架构到工业存储落地:天硕自研主控技术路径参照
  • 2026年国内GEO公司综合实力前五强榜单推荐:主流头部GEO服务商实力全解析 - GEO优化
  • 2026 年广州 GEO 服务商综合实力五强榜单与实战选型指南 - GEO优化
  • 容器是怎么管理 Bean 的?
  • 2026年近期大庆企业如何选择专业可靠的短视频服务伙伴? - 2026年企业推荐榜
  • 云原生性能测试平台OpenClaw Cloud:架构解析与实战部署指南
  • 第四篇:RDB与AOF持久化——宕机后数据怎么恢复?
  • 2026年最新趋势:西安外贸企业如何选择建站服务商突围海外市场? - 2026年企业推荐榜
  • 认知科学视角下的AGI评测:超越传统基准的多维能力评估框架
  • AI工作流引擎:构建可观测、可扩展的AI应用开发框架
  • 抖音直播录制神器:40+平台自动值守,永久保存精彩瞬间
  • 通用人工智能系统(GPAIS)的技术挑战与可信AI治理框架
  • AutoKG:大语言模型与远程监督驱动的自动化知识图谱构建实战
  • CANN/ascend-transformer-boost算子演示示例
  • GitHub中文界面终极指南:3步免费快速安装,告别英文困扰
  • Xbox成就解锁器完全指南:轻松解锁Xbox游戏成就的免费神器