当前位置: 首页 > news >正文

【AI Agent 学习笔记 task1】Day2:初识智能体

【AI Agent 学习笔记 task1】Day2:初识智能体

上一篇:【AI Agent 学习笔记】Hello-Agents 环境配置与首个 Agent 实战


一、Agent 的本质

Agent(智能体)=大模型(大脑)+ 工具(手脚)+ 控制循环(决策)

与普通 LLM 调用的区别:

特性普通 LLMAgent
执行方式单次问答多轮循环
工具使用可调用外部 API
决策能力自主规划执行步骤
结果反馈直接生成基于观察调整策略

二、ReAct 模式:Thought-Action-Observation

本章核心:ReAct(Reasoning + Acting)是 Agent 的主流实现范式。

2.1 三要素结构

Thought(思考)→ Action(行动)→ Observation(观察)→ ... → Finish(完成)

以我的运行日志为例:

循环ThoughtActionObservation
1用户要查天气+推荐景点,先获取天气get_weather(city="北京")小雨阵雨,10°C
2(模型输出为空)——❌ 解析失败:未找到 Action
3已获取天气,根据雨天推荐景点get_attraction(city="北京", weather="Light rain shower")博物馆、海洋馆等室内景点
4整合信息,生成回答Finish[...]任务完成

2.2 关键观察

错误循环的价值:第 2 轮模型输出为空导致解析失败,但 Agent自动重试进入第 3 轮。这说明:

  • Agent 具备容错能力
  • 控制循环会强制要求模型遵循格式规范
  • 失败后会重新调用 LLM,而非直接报错退出

三、工具(Tool)的作用

本章代码中 Agent 使用了两个工具:

# 工具定义示例get_weather(city:str)->str# 获取指定城市天气get_attraction(city:str,weather:str)->str# 根据天气推荐景点

核心设计:LLM 只负责决定"调用什么工具、传什么参数",实际执行由框架完成。这种分离让 Agent 既能利用大模型的推理能力,又能获得精确的外部数据。


四、Prompt 工程:控制模型行为

Agent 能遵循 Thought-Action 格式,核心在于System Prompt 的设计

你必须按以下格式回复: Thought: 你的思考过程 Action: 工具名(参数=值) 或者任务完成时: Action: Finish[最终答案]

Prompt 技巧:

  1. 少样本示例(Few-shot):给 1-2 个正确格式的例子
  2. 严格格式约束:明确分隔符、字段名
  3. 错误处理提示:告知模型输出错误会怎样

五、关键代码逻辑

max_loops=5# 防止无限循环foriinrange(max_loops):# 1. 组装 Prompt(历史记录 + 工具描述 + 用户输入)prompt=build_prompt(history,tools,user_input)# 2. 调用 LLMresponse=llm.chat(prompt)# 3. 解析 Thought 和 Actionthought,action=parse_response(response)# 4. 执行工具ifaction=="Finish":returnresult# 任务完成else:observation=execute_tool(action)history.append(f"Observation:{observation}")# 反馈给下一轮

六、学习总结

Agent 核心认知

  1. 不是更复杂的 Prompt,而是"推理-行动"的闭环
  2. LLM 当"决策者",工具当"执行者"
  3. 观察结果反馈给 LLM,实现动态调整

与上一篇的衔接

  • Day1:环境配置 + 跑通代码
  • Day2:理解 ReAct 原理 + 分析运行日志

下一步:学习第二章——工具的定义与注册机制。


运行截图


参考资源

  • 📖课程文档:第一章 初识智能体
  • 📄论文:ReAct: Synergizing Reasoning and Acting in Language Models

📖 项目教程地址

hello-agents - Datawhale AI Agent 入门教程
👉 https://github.com/datawhalechina/hello-agents


版权声明:本笔记基于 Datawhale hello-agents 开源项目整理,转载请注明出处。

记录时间:2026年3月17日
本文由AI润色输出总结

http://www.jsqmd.com/news/497590/

相关文章:

  • SpringBoot实现文件上传和下载
  • 上海小程序定制公司推荐:如何避开低价陷阱选对家
  • 2026农机橡塑配件推荐榜:排种器/排种盒/排种管/播种机塑料件/播种机尼龙件/播种机有机肥排肥装置/播种机有机肥施肥装置/选择指南 - 优质品牌商家
  • 大模型AI-入门-发展历程-机器学习
  • 上海新锐品牌Lifenias:用酸枣百合滴鸡精拯救睡眠 - 中媒介
  • 测试结果验证测试:无限递归的俄罗斯套娃
  • 链表_必会面试题2
  • 数据库安全最后一公里:金仓SQL防火墙如何填平开发留下的注入坑
  • 1391、STM32单片机智能语音识别分类垃圾桶 超声波检测溢满报警 语音播报垃圾分类(程序+原理图+PCB文件+proteus仿真+参考论文+开题报告+原理图文字讲解+程序流程图+硬件框图+器件清单
  • 「龙虾」来了!OpenClaw如何掀起AI智能体革命
  • 东华复试day17
  • 挺黑色幽默的笑话
  • python-flask导师选择分配管理系统 _0spy6
  • 基于LangChain的RAG与Agent智能体开发 - OpenAI库介绍和使用
  • 四川大学团队破解“万能图像修复“难题
  • AOP相关面试题
  • 提示系统SQL优化从慢到快:架构师用提示工程实现查询响应速度提升10倍
  • 英集芯IP2391N支持低功耗Boost充电的微光能量收集芯片
  • PCB抄板技术全流程解析
  • 如何在Dev-C++中设置临时环境变量?
  • 【码道初阶-Hot100】LeetCode 438 + 567 对照详解:一套滑动窗口模板,彻底讲透“固定长度窗口 + 计数数组 + count维护”
  • 基于「YOLO目标检测 + 多模态AI分析」的热轧钢带表面缺陷检测分析系统
  • 24大数据 R语言代码合集
  • 爬虫对抗实战 - ZLibrary反爬机制分析与突破
  • Spring Boot 配置文件优先级机制
  • intel wifi AX200停用,无线连接都不能用。
  • 【第7篇】Mamba 100篇合集 · 从入门到天花板
  • SQL SERVER 登陆错误:18456
  • 虚拟实验室:物理化学实验的计算机模拟
  • 图的领接矩阵表示法