当前位置: 首页 > news >正文

吐血整理!AI大模型从入门到精通:99%的人看完这篇就够了

李宏毅刚刚发布了《一堂课搞懂 AI Agent 的原理》,非常深入浅出,强烈推荐。

李宏毅认为,从 LLM 的角度来看,它做 AI Agent 任务仍然是在做文字接龙。AI Agent 并不是语言模型的新技术,它比较像语言模型的一个应用。

视频如下:

课程主要内容:

备注:重点信息在第五部分,AI Agent 的关键能力剖析

一、AI Agent 的基本运作原理

核心循环:目标 (Goal) -> 观察 (Observation) -> 行动 (Action)。

Action 影响环境,产生新的 Observation。

循环往复,直至达成目标。

举例:AlphaGo

  • 目标:赢棋。

  • Observation:棋盘上的棋子位置。

  • Action:在棋盘上落子。

与强化学习 (RL) 的关系:

  • 传统上,AI Agent的打造依赖 RL 算法。

  • RL 的局限性:需要为每个任务单独训练模型。

  • 新的思路:能否直接用 LLM 作为 AI Agent?

二、LLM 作为 AI Agent

目标 (文字描述) -> 环境 (转为文字或直接使用图像) -> 行动 (文字描述,需转译为可执行指令)。

LLM 的核心是文字接龙,AI Agent 是 LLM 的一种应用。

本课程没有新的模型被训练,是基于现有LLM通用能力的应用。

历史回顾:2023 年春季出现过一波 AI Agent 热潮 (AutoGPT),但后来降温,因为实际效果不如预期。

LLM 驱动 AI Agent 的优势:

  • 行动可能性近乎无限,不再局限于预设行为。

  • 无需像 RL 那样定义 Reward,可直接提供错误日志等丰富信息。

三、AI Agent 实例

AI 村民:斯坦福小镇

AI 使用电脑:Cloud Computer Use、ChatGPT Operator。

AI 训练 AI 模型:Google 的 co-scientist 等

四、更即时的互动

需要能够根据环境的实时变化,立刻调整行动。

应用场景:语音对话

五、AI Agent 的关键能力剖析

李宏毅认为 AI Agent 需要三个核心能力:1、需要能够根据历史经验调整行为;2、使用工具;3、规划能力。

(一)根据经验调整行为

传统方法:调整模型参数 (本课程不涉及)。

LLM 的能力:直接提供错误信息,无需调整参数即可改变行为。

关键问题:如何管理和利用过去的经验?

解决方案:Memory 机制,类似于人类的长期记忆。

  • Read 模块:从 Memory 中选择与当前问题相关的经验,类似于 RAG 技术。

  • Write 模块:决定什么信息应该被记录下来。

  • Reflection 模块:对记忆中的信息做抽象、整理,建立经验之间的联系 (Knowledge Graph)。类似于 GraphRAG、HippoRAG。

(二)使用工具

工具定义:只需知道如何使用,无需了解内部运作。

常用工具:搜索引擎、程序 (LLM 自己编写)、其他 AI 模型。

使用工具 = 调用函数 (Function Calling)。

需要开发者搭建桥梁,将 Tool 指令转化为实际的函数调用。

具体工具:

  • 搜索引擎 (RAG)

-自己打造工具:LLM 自己编写程序,作为工具使用。

  • 其他 AI 作为工具:

文字模型调用语音识别、情绪识别等工具处理语音。

大模型和小模型协同工作。

过度相信工具的风险:LLM 有一定程度的判断力,但有时仍会出错。

使用工具会遇到的问题:内部知识 vs. 外部知识冲突

  • LLM 会在内部知识 (信念) 和外部知识 (工具结果) 之间进行权衡。

  • 外部知识与 LLM 信念差距越大,LLM 越不容易相信。

  • LLM 对自己信念的信心也会影响其是否被外部信息动摇。

另外,使用工具不一定总是更有效率,取决于 LLM 本身的能力。

(三)做计划

当前传统 LLM 的规划能力:介于有和没有之间。

进一步强化规划能力:与环境互动探索 (Tree Search),去除没希望的路径。

Tree Search 缺点:有些动作不可逆。

解决方案:让尝试发生在脑内模拟 (World Model),模拟环境变化。

用脑内小剧场进行规划:思考、验证可能性,模拟世界变化。

DeepSeek-R1 等思考模型确实有类似效果 。

但也存在过度思考的风险:LLM 可能会想太多,停滞不前,甚至直接放弃。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

http://www.jsqmd.com/news/98653/

相关文章:

  • 2025年年终透水砖厂家推荐:基于百项工程案例与多品牌对比的5家高可靠性供应商深度解析 - 十大品牌推荐
  • restTemplate发送POST
  • 2025年深圳口碑好的GEO推广专业源头厂家排行榜:看哪家性 - myqiye
  • 最长递增子序列
  • 公司新来一个浙大硕士,月薪27K。比我少5年工作经验,却因为学历光环直接空降任组长。而我每天996,领导却说:你已经到天花板了。
  • 2025 年 12 月稀土分析仪厂家权威推荐榜:高精度检测与快速响应,助力矿产与新材料行业精准把控 - 品牌企业推荐师(官方)
  • 【微信支付全流程实战:JSAPI+H5 支付对接指南】
  • kubuntu下配置kmail为QQ邮箱的客户端
  • Adaptive RAG:新一代智能检索增强生成,大模型优化!
  • 如何筛选真正靠谱的透水砖供应商?2025年年终最新厂家评估方法论及5家实力推荐! - 十大品牌推荐
  • 1216
  • 2026年AI大模型算法工程师转行指南:从零开始,迈向高薪未来的人工智能职业跃迁之路!
  • 201React-Query:useQuery基本使用
  • 2025服务不错的矩形方管工厂TOP5推荐:甄选制造商助力工 - mypinpai
  • 2026 AI大模型面试杀手锏:130道深度解析题及答案全攻略,助你轻松斩获心仪offer!
  • 详解一款可快速上手的开源订水小程序系统功能与优势
  • springboot宠物用品商城领养系统之家小程序_dsc9dqa7
  • 2025年度方矩管生产厂TOP5权威推荐:甄选优质服务商助力 - 工业品牌热点
  • 2025年长三角方管厂排行榜:推荐方管厂及方管个性化定制特色 - myqiye
  • springboot巴马旅居养老项目申请老年人健康档案系统 小程序
  • 0.6B参数逆袭7B基线?OpenTrackVLA重磅开源:重写具身智能的算力法则
  • 2025 GEO推广源头厂家排行TOP5:专业企业甄选指南 - 工业推荐榜
  • 以小博大!Nanbeige4-3B重磅开源:硬刚Qwen3,挑战小模型能力新高度
  • ECML-PKDD ‘25 | FCA-RL框架——基于强化学习的出行服务商动态市场环境效率保障方法
  • 横河WT1800E高性能功率分析仪WT1806E
  • 基于情感诱导的LastPass钓鱼攻击机制与防御策略研究
  • NeurIPS 2025 | 拒绝死记硬背!真正的高手模型,都在偷偷记“错题本”
  • AI代理自主钓鱼行为的威胁建模与行为护栏防御机制研究
  • 是德 DAQ970A 数据采集仪/DAQM901A模块
  • 基于动态UUID的高级钓鱼攻击机制与防御对策研究