当前位置：首页 > news >正文

AI Agent 入门：从概念到实战

news 2026/7/1 16:41:11

AI Agent 入门：从概念到实战

什么是 AI Agent？

AI Agent（人工智能代理）是一种能够自主感知环境、做出决策并执行动作的智能系统。与传统的大语言模型（LLM）不同，Agent 不仅仅是"回答问题"，它还能主动调用工具、使用记忆、规划任务并持续与环境交互，直到完成目标。

简单来说：

LLM= 你问它答，一次性交互
Agent= 你给目标，它自己想办法搞定，多轮交互

Agent 的核心组件

一个完整的 AI Agent 通常包含以下四大核心模块：

组件功能 | 类比 ------------|------感知（Perception）接收环境输入（用户指令、工具返回、系统状态） | 人的眼睛和耳朵推理（Reasoning）分析信息、制定计划、选择行动方案 | 人的大脑行动（Action）执行具体操作（调用工具、输出结果、调用API） | 人的手和脚记忆（Memory）存储短期对话历史和长期知识经验 | 人的记忆系统

与大模型的本质区别

特性传统 LLM | AI Agent ----------------|---------- 交互模式单轮问答 | 多轮自主执行工具使用无 | 主动调用外部工具记忆能力仅上下文窗口 | 可持久化存储目标导向回答即结束 | 持续执行直到目标达成错误处理无 | 可重试、修正

一个简单的 Python Agent 示例

下面用最基础的 Python 代码展示一个极简 Agent 的结构：

import json

class SimpleAgent: def __init__(self, llm): self.llm = llm self.tools = {} self.memory = [] def register_tool(self, name, func, description): """注册一个工具""" self.tools[name] = {"func": func, "desc": description} def perceive(self, user_input): """感知用户输入""" self.memory.append({"role": "user", "content": user_input}) def think(self): """推理：决定下一步行动""" prompt = f""" 你是一个Agent。用户历史消息：{json.dumps(self.memory, ensure_ascii=False)} 可用工具：{json.dumps({k: v['desc'] for k, v in self.tools.items()}, ensure_ascii=False)} 请决定下一步：直接回答用户，或调用工具（返回JSON格式 {'action': 'call_tool', 'tool': '工具名', 'params': {...}}）。 """ response = self.llm(prompt) return response def act(self, decision): """执行行动""" if "call_tool" in decision: # 解析并调用工具 return self.tools[decision["tool"]]"func") return decision def run(self, user_input): """运行一个完整的Agent循环""" self.perceive(user_input) decision = self.think() result = self.act(decision) self.memory.append({"role": "assistant", "content": str(result)}) return result