当前位置: 首页 > news >正文

Agent 开发全流程:从概念到生产

Agent 开发全流程:从概念到生产

AI 核心技能系列 · 第 8 篇


导语

2026 年,Agent 是 AI 领域最热的方向,没有之一。

但"Agent"这个词被用得太泛了——ChatBot 是 Agent 吗?自动化脚本是 Agent 吗?一个套了 System Prompt 的聊天窗口就能叫 Agent 吗?

这篇文章帮你彻底搞清楚:Agent 到底是什么,主流架构模式有哪些,怎么选框架,以及——怎么从零开发一个能在生产环境跑的 Agent


一、什么是 Agent:从概念到定义

1.1 核心定义

Agent 是能自主感知环境、做出决策、采取行动来完成任务的 AI 系统。

关键词是"自主"——你给它一个目标,它自己决定怎么实现,而不是你一步步告诉它做什么。

1.2 Agent vs ChatBot vs Workflow

维度 ChatBot Workflow Agent
决策方式 人主导对话 预设流程 AI 自主决策
灵活性 低(一问一答) 中(固定路径) 高(动态调整)
工具使用 不用/很少 预设顺序 按需选择
错误处理 依赖人类 预设分支 自主重试/换策略
复杂任务 不擅长 固定复杂度 开放式复杂任务
类比 客服接线员 流水线工人 独立负责项目的员工

1.3 Agent 的核心能力

┌─────────────────────────────────────────┐
│              Agent 核心架构               │
│                                           │
│         ┌──────────────┐                  │
│         │   感知 Perceive │                │
│         │ 理解环境和任务  │                │
│         └──────┬───────┘                  │
│                │                          │
│         ┌──────▼───────┐                  │
│         │  推理 Reason   │                │
│         │ 分析+规划方案  │                │
│         └──────┬───────┘                  │
│                │                          │
│         ┌──────▼───────┐    ┌──────────┐ │
│         │  行动 Act      │───│ 工具调用  │ │
│         │ 执行具体操作   │   │ API/DB.. │ │
│         └──────┬───────┘    └──────────┘ │
│                │                          │
│         ┌──────▼───────┐                  │
│         │  记忆 Memory   │                │
│         │ 积累经验教训   │                │
│         └──────────────┘                  │
│                                           │
│     ↻ 循环直到任务完成或达到限制            │
└─────────────────────────────────────────┘

二、Agent 的架构模式

2.1 四种主流模式

1. ReAct 模式(Reasoning + Acting)

推理和行动交替进行,最经典的 Agent 模式。

Thought: 用户想知道最新的 AI 论文,我需要搜索。
Action: search_arxiv("LLM agent 2026")
Observation: 找到 5 篇相关论文...
Thought: 需要筛选出最相关的 2 篇,总结要点。
Action: read_paper("2026.12345")
Observation: 论文主要讲...
Thought: 我有足够的信息来回答了。
Answer: 以下是最新的 AI Agent 研究进展...

2. Plan-and-Execute 模式

先制定完整计划,再按步骤执行。

Planning Phase:Step 1: 搜索最新 AI 论文Step 2: 筛选前 3 篇最相关的Step 3: 阅读并总结每篇要点Step 4: 整合成一份综述Execution Phase:执行 Step 1... ✓执行 Step 2... ✓执行 Step 3... ✓(可能根据结果调整计划)执行 Step 4... ✓

3. 反思模式(Reflexion)

执行后自我评估,从错误中学习。

Action: 生成代码
Check: 运行测试 → 失败
Reflect: 分析错误原因,是边界条件没处理
Action: 修改代码,加上边界条件处理
Check: 运行测试 → 通过 ✓

4. 多 Agent 协作

多个专业化 Agent 分工合作。

Manager Agent├── Research Agent(负责搜索和调研)├── Coding Agent(负责写代码)├── Review Agent(负责代码审查)└── Testing Agent(负责测试)

2.2 选择指南

模式 适用场景 复杂度
ReAct 大部分单 Agent 场景 ★★
Plan-and-Execute 步骤明确的复杂任务 ★★★
Reflexion 代码生成、写作等可验证任务 ★★★
多 Agent 大型项目、需要不同专业能力 ★★★★★

三、主流 Agent 框架对比

框架 出品 学习曲线 功能 特点
LangGraph LangChain ★★★ ★★★★★ 状态图、最灵活
Claude Agent SDK Anthropic ★★ ★★★★ 官方框架、集成好
CrewAI 社区 ★★ ★★★★ 多 Agent 协作最简单
AutoGen 微软 ★★★ ★★★★ 多 Agent 对话
Dify / Coze 各厂商 ★★★ 低代码、快速原型
纯代码 自己写 ★★★★ 最灵活、理解原理

选择建议

  • 理解原理:先用纯代码实现一遍(本文会带你做)
  • 快速原型:Dify / Coze
  • 生产系统:LangGraph(复杂流程)或 Claude Agent SDK(Claude 生态)
  • 多 Agent:CrewAI 或 AutoGen

四、实战:从零构建一个完整 Agent

不依赖任何框架,用纯 Python + OpenAI API 实现一个 ReAct Agent。

import json
import openai
from typing import Callableclient = openai.OpenAI()# ===== 1. 定义工具 =====
def search_web(query: str) -> str:"""模拟网页搜索"""# 实际项目中对接搜索 APIreturn f"搜索'{query}'的结果: [模拟搜索结果]"def calculate(expression: str) -> str:"""安全的数学计算"""try:result = eval(expression, {"__builtins__": {}}, {})return str(result)except Exception as e:return f"计算错误: {e}"def read_file(path: str) -> str:"""读取文件内容"""try:with open(path) as f:return f.read()[:2000]except Exception as e:return f"读取失败: {e}"# 工具注册表
TOOLS = {"search_web": search_web,"calculate": calculate,"read_file": read_file,
}# OpenAI 工具定义
TOOL_DEFINITIONS = [{"type": "function","function": {"name": "search_web","description": "搜索互联网上的信息","parameters": {"type": "object","properties": {"query": {"type": "string", "description": "搜索关键词"}},"required": ["query"]}}},{"type": "function","function": {"name": "calculate","description": "执行数学计算","parameters": {"type": "object","properties": {"expression": {"type": "string", "description": "数学表达式,如 '2+3*4'"}},"required": ["expression"]}}},{"type": "function","function": {"name": "read_file","description": "读取本地文件的内容","parameters": {"type": "object","properties": {"path": {"type": "string", "description": "文件路径"}},"required": ["path"]}}}
]# ===== 2. Agent 核心循环 =====
SYSTEM_PROMPT = """你是一个智能助手,可以使用工具来完成任务。
请仔细分析用户的需求,选择合适的工具,逐步完成任务。
如果工具返回的结果不理想,可以尝试换一种方式。
当你有足够的信息回答用户问题时,直接给出最终回答。"""def run_agent(user_message: str, max_iterations: int = 10):"""Agent 主循环"""messages = [{"role": "system", "content": SYSTEM_PROMPT},{"role": "user", "content": user_message}]for i in range(max_iterations):print(f"\n--- 迭代 {i+1} ---")# 调用 LLMresponse = client.chat.completions.create(model="gpt-4o",messages=messages,tools=TOOL_DEFINITIONS,tool_choice="auto",)message = response.choices[0].messagemessages.append(message)# 如果没有工具调用,说明 Agent 已经给出了最终回答if not message.tool_calls:print(f"最终回答: {message.content}")return message.content# 执行工具调用for tool_call in message.tool_calls:func_name = tool_call.function.namefunc_args = json.loads(tool_call.function.arguments)print(f"调用工具: {func_name}({func_args})")# 执行if func_name in TOOLS:result = TOOLS[func_name](**func_args)else:result = f"未知工具: {func_name}"print(f"工具结果: {result[:200]}")# 将结果加入对话messages.append({"role": "tool","tool_call_id": tool_call.id,"content": str(result)})return "达到最大迭代次数,任务未完成。"# ===== 3. 运行 =====
if __name__ == "__main__":answer = run_agent("帮我搜索一下 2026 年最新的 AI Agent 框架,然后算一下如果每个框架学习需要 2 周,学完前 3 个需要多少天?")print(f"\n{'='*50}\n最终回答:\n{answer}")

这个 Agent 虽然简单,但已经具备了核心能力:

  • 感知:理解用户问题
  • 推理:决定用什么工具、按什么顺序
  • 行动:调用工具获取信息
  • 循环:根据结果决定下一步

五、生产部署注意事项

维度 措施
成本控制 Token 用量监控、设置 max_iterations 上限、用便宜模型做简单判断
延迟优化 流式输出、并行工具调用、缓存常见查询结果
可靠性 工具调用重试(3次)、超时处理(30s)、降级策略
可观测性 记录每轮的 thought/action/observation、追踪 Token 消耗
安全性 工具权限控制、沙箱隔离、高风险操作人工确认
评测 构建评测数据集,定期回归测试

六、职业视角

Agent 开发工程师是 2026 年最热门的技术岗位方向之一。

面试问题 核心答案要点
Agent 的核心架构? 感知-推理-行动-记忆循环
ReAct 的原理? 推理和行动交替,Thought→Action→Observation 循环
Agent 和 Workflow 的区别? Agent 自主决策动态调整,Workflow 预设流程固定路径
怎么保证 Agent 的可靠性? 设置迭代上限、工具重试、错误降级、人工兜底

Agent 工程师 vs 传统后端工程师的核心差异:不确定性。传统后端的输入输出是确定的,Agent 的每一步都有不确定性——你必须学会设计"容错"和"兜底"的系统。


总结

  1. Agent 定义:能自主决策、使用工具、完成复杂任务的 AI 系统
  2. 架构模式:ReAct(最通用)、Plan-and-Execute(复杂任务)、Reflexion(可验证任务)、多 Agent(大型项目)
  3. 框架选择:理解原理用纯代码,快速原型用 Dify,生产用 LangGraph/Claude SDK
  4. 核心循环:LLM 决策 → 工具执行 → 结果反馈 → 继续或结束
  5. 生产要点:成本、延迟、可靠性、可观测性、安全性缺一不可

本文是 AI 核心技能系列 第 8 篇,共 12 篇。上一篇:Fine-tuning 实战 | 下一篇:MCP 深入理解

关注公众号「coft」,获取完整系列更新、配套代码和学习路线图。一起交流 AI 转行经验,助力职业跃升,迈向高薪岗位。

http://www.jsqmd.com/news/417944/

相关文章:

  • 2026年重庆正规开密码锁服务标杆机构推荐:重庆附近开密码锁电话、门禁开密码锁、开密码锁电话、上门开密码锁、换锁芯、开防盗门、配汽车钥匙、指纹锁维修安装、重庆南岸区艺诚、便民服务新标杆 - 海棠依旧大
  • 区块链钱包与交易所的进化论:安全、效率与用户体验的三角博弈
  • 2026年 六安不锈钢金属回收厂家推荐排行榜:专业高效回收,环保再生资源,金属回收服务优选 - 品牌企业推荐师(官方)
  • 2026别错过!继续教育必备的降AIGC软件 —— 千笔·降AI率助手
  • 哈尔滨汽车音响哪家好,哪家技术更专业?首选哈尔滨博士达汽车音响!产品好、技术强,不走弯路效果好!
  • AI发展趋势(世界模型、Next-State Prediction范式、具身智能机器人)
  • OpenClaw 新手必看:为什么一定要先学会用 Skills
  • 百联卡回收最新攻略:1000面值94折,1分钟微信到账,亲测有效! - 畅回收小程序
  • Windows设置网络代理的几种方法
  • Nginx入门:服务器门童与端口管理
  • 实战复盘:如何用智能网关打通发那科机器人与西门子PLC的语言通信
  • 发卡不发愁!瑞祥商联卡回收新方法:秒审核秒提现,大面值也能一次搞定! - 畅回收小程序
  • 新手采购必看:痕量氨气监测与研究“靠谱”品牌红榜,拒绝踩雷 - 品牌推荐大师1
  • zhiluyun_article
  • 闲置永辉超市卡别浪费!超实用回收指南,常规方法一键get,轻松变现不踩坑 - 京回收小程序
  • 键盘送哪款好?2026电竞键盘十大排名:迈从Ace 68 Turbo成首选 - 速递信息
  • AD软件埋盲孔的相关设置
  • 企业人力外包避坑!人事岗位薪酬+灵活用工外包实测推荐 - 包罗万闻
  • 2026年2月成都市政管道、波纹管、骨架管、给水管、电力管厂家哪家好 - 2026年企业推荐榜
  • 2026年2月成都市政管道、波纹管、骨架管、给水管、电力管厂家推荐 - 2026年企业推荐榜
  • 嵌入式之XMOS打印Hello World
  • Python元类:我如何让所有类的实例化,都必须经过我的“出生登记处”?
  • 定稿前必看!AI论文平台,千笔 VS Checkjie,专为本科生设计!
  • 内存涨价:三星涨100%,苹果直接答应
  • 2026年全国靠谱保洁设备厂家榜 全品类覆盖 高效清洁更省心 适配各类需求 - 深度智识库
  • 城南核心地段现房交付,2026年购房者实景体验首选,学区房/70年大产权住宅/实景现房/南都新城,现房直销厂家有哪些 - 品牌推荐师
  • 【问题解决】vscode插件Jenkins Pipeline Linter Connector校验格式报错
  • 学长亲荐!一键生成论文工具,千笔·专业学术智能体 VS Checkjie
  • 综述不会写?AI论文网站 千笔·专业论文写作工具 VS speedai
  • 机器学习算法基本型 关联规则(笔记)