当前位置: 首页 > news >正文

从零开始!用Python打造你的第一个Agent,小白也能轻松收藏学习大模型原理

很多人第一次接触 Agent,是从 LangChain、CrewAI、AutoGen 开始。框架文档里 Chain、Tool、Memory、Planner 一堆抽象,很容易让人觉得:Agent 很复杂,必须先学框架。

其实把框架剥开,底层逻辑就三件事:LLM 负责思考,工具负责行动,循环负责持续推进。

即:Agent = LLM + Tools + Loop。

理解这个公式,比背任何框架 API 都重要。框架会变,机制不会。下面用最小 Python Agent 把循环跑起来。

1. Agent 到底是什么?


普通 LLM 调用是一次性的:用户提问,模型回答,结束。Agent 多了”行动循环”:

  1. LLM 读取用户问题和当前状态;
  2. LLM 判断是否需要工具;
  3. 如果需要,程序执行工具并把结果返回给 LLM;
  4. LLM 基于新结果继续判断;
  5. 直到模型认为任务完成,输出最终答案。

这个模式常称ReAct:Reasoning + Acting。先推理,再行动,再观察结果,继续推理。

图1:Agent 循环流程图——用户输入进入 LLM,LLM 要么直接回答,要么调用工具;工具结果回传 LLM 继续思考,直到输出最终答案

什么时候需要 Agent?任务需要”多步判断 + 外部动作”时,如查资料、算数、调接口、读文件。只做改写、摘要、分类,普通 LLM 调用就够。

2. 用 Python 写一个最小 Agent


示例用 Anthropic Claude API 的tool_use。OpenAI function calling 同一套思想:定义工具 → 模型选工具 → 程序执行 → 结果回传。

先安装依赖,通过环境变量设置 Key(不要写进代码):

pip install anthropicexport ANTHROPIC_API_KEY="你的_API_Key"

2.1 定义工具

工具不是函数本身,而是给模型看的"能力说明书":工具叫什么、能做什么、需要哪些参数。

import reimport anthropicclient = anthropic.Anthropic()tools = [{ "name": "calculator", "description": "计算简单数学表达式,只支持数字、加减乘除和括号。", "input_schema": { "type": "object", "properties": { "expression": { "type": "string", "description": "数学表达式,例如 123 * 456 + 789" } }, "required": ["expression"] }}]

工具描述越清楚,模型越容易选对。这里只放一个计算器,方便看懂完整链路。

2.2 执行工具

模型不会真的执行代码。它只提出”我要调 calculator,参数是 x”。真正执行的是你的 Python 程序。

def run_tool(name: str, args: dict) -> str: if name != "calculator": return"未知工具" expr = args["expression"] ifnot re.fullmatch(r"[0-9+\-*/(). ]+", expr): return"表达式包含不允许的字符" try: return str(eval(expr, {"__builtins__": {}}, {})) except Exception as e: returnf"计算失败:{e}"

这里用白名单限制字符。生产环境更建议用专门数学解析库,别让模型生成内容直接进入高权限执行环境。

2.3 写 Agent 循环

核心就是一个for循环:请求模型 → 检查工具调用 → 执行工具 → 结果塞回历史 → 再请求模型。

def agent(user_input: str, max_steps: int = 5) -> str: messages = [{"role": "user", "content": user_input}] for _ in range(max_steps): response = client.messages.create( model="claude-opus-4-8", max_tokens=1024, tools=tools, messages=messages, ) messages.append({"role": "assistant", "content": response.content}) if response.stop_reason != "tool_use": return"".join( block.text for block in response.content if block.type == "text" ) tool_results = [] for block in response.content: if block.type == "tool_use": result = run_tool(block.name, block.input) tool_results.append({ "type": "tool_result", "tool_use_id": block.id, "content": result, }) messages.append({"role": "user", "content": tool_results}) return"达到最大循环次数,Agent 停止。"print(agent("123 乘以 456 再加上 789 等于多少?"))

典型运行:用户提问 → LLM 判断需要计算器 → 生成工具调用calculator({"expression":"123*456+789"})→ Python 执行得56877→ 结果回传 LLM → LLM 输出自然语言答案。

图2:Agent 运行过程——LLM 思考"需要计算器"→ 调用 calculator → 工具返回 56787 → LLM 组织最终回答

注意:图中示例数值用于展示流程;如果你换表达式,结果以程序实际计算为准。

什么时候用这个最小版?学原理、验证工具调用、做内部小工具。还不适合直接上生产——缺权限控制、日志、重试、上下文管理和人工确认。

3. 拆开看:Agent 的 4 个关键机制


机制一:工具定义

工具定义就是 LLM 的“工具菜单”。模型根据namedescription和参数 schema 判断能不能用、该不该用、怎么传参。

坑点:工具描述太泛会导致误选。例如“处理数据”不如“计算数学表达式并返回结果”。工具越多,描述越要互斥。

什么时候用:只要模型需要访问外部世界——数据库、文件、接口、搜索、计算——就要定义工具。

机制二:模型决策

Agent 不是你硬编码“先调 A,再调 B”。LLM 会根据问题和工具列表自己决定下一步。这是 Agent 相比普通脚本最大的区别。

什么时候用:路径不固定时用 Agent;路径固定时用普通代码编排更稳定、更便宜。

机制三:工具执行

LLM 只负责“提出动作”,程序负责“执行动作”。这个边界很重要:工具权限、参数校验、失败处理,都应该在你控制的代码里完成。

什么时候用:永远如此。不要让模型直接执行任意 shell、SQL 或高权限 API。

机制四:循环终止

stop_reason == "tool_use"表示模型还想行动;否则说明它准备回答。除此之外,还要加max_steps,防止无限循环。

什么时候用:所有 Agent 都必须有循环上限。没有上限,成本和风险都会失控。

4. 从最小 Agent 到实用 Agent


最小版本能说明原理,但实用 Agent 至少要补三层能力。

图3:从最简 Agent 到实用 Agent 的演进——补循环上限、补错误回传、补上下文管理

第一,循环上限。用max_steps控制最多执行几轮,避免模型在“搜索—总结—再搜索”里打转。

第二,错误回传。工具失败时不要吞错误,要把错误作为tool_result返回给模型。模型看见“参数不合法”或“接口超时”,才有机会换策略。

第三,上下文管理。每轮工具调用都会让消息历史变长。短任务可以直接保留全部历史;长任务要做截断、摘要或外部记忆,否则 token 会爆。

什么时候升级?当 Agent 需要跑很多步、接多个工具、给多人使用,或者会触碰文件/数据库/生产系统时,就不能停留在教学版。

5. 要不要用框架?


方案适合场景优点坑点
原生 API + 循环学原理、简单工具透明、好调试基建要自己补
LangChain快速原型、RAG生态大抽象多、版本变化快
CrewAI多角色协作任务组织清晰简单任务容易过度设计
AutoGen多 Agent 对话适合研究协作模式调试链路长

建议路线:先写原生 Agent,搞懂 LLM + Tool + Loop;再学框架。否则框架出错时,你分不清是模型没选对工具、schema 写错、工具执行失败,还是框架封装层的问题。

普通人如何抓住AI大模型的风口?

领取方式在文末

2026年入行AI大模型的黄金窗口!!!

AI产业正迎来前所未有的爆发式增长。从DeepSeek以百万年薪重金招募顶尖研究员,到百度、阿里、腾讯等头部企业加速推进AI Agent商业化布局,再到国家层面持续出台政策,大力扶持数字经济与AI人才培育体系,多重信号清晰指向一个共识:AI的“黄金十年”已全面开启

在产业浪潮的强劲推动下,AI人才争夺战日趋白热化。技术迭代与场景落地双轮驱动,催生海量高价值岗位。放眼未来,AI领域的职业发展前景广阔无垠,正涌现出大量高潜机遇,堪称一片值得深耕的**“人才蓝海”**。

脉脉数据显示📊:
2026年1-2月,AI岗位数量同比增长约12倍,增速远超新经济行业整体增幅;AI岗位在全部新经济岗位中的占比也从2025年同期的2.29%跃升至26.23%,几乎占据新经济招聘市场的四分之一。

与此同时,AI新发岗位平均月薪高达60738元,较新经济行业整体平均月薪48189元高出约26%。

这一切都说明一件事:2026年,正是入行AI大模型的黄金窗口❗️❗️

最佳学习路线

只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!

在当前这个人工智能高速发展的时代,AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长,真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料,能够帮助更多有志于AI领域的朋友入门并深入学习。

真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发

【附赠一节免费的直播讲座,技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等,欢迎大家~】

大模型全套学习资料展示

自我们与MoPaaS魔泊云合作以来,我们不断打磨课程体系与技术内容,在细节上精益求精,同时在技术层面也新增了许多前沿且实用的内容,力求为大家带来更系统、更实战、更落地的大模型学习体验。

希望这份系统、实用的大模型学习路径,能够帮助你从零入门,进阶到实战,真正掌握AI时代的核心技能!

01教学内容

  • 从零到精通完整闭环:【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块,内容比传统教材更贴近企业实战!

  • 大量真实项目案例:带你亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事‌!

02适学人群

应届毕业生‌:无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。

零基础转型‌:非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能突破瓶颈:传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型‌。

vx扫描下方二维码即可
【附赠一节免费的直播讲座,技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等,欢迎大家~】

本教程比较珍贵,仅限大家自行学习,不要传播!更严禁商用!

03入门到进阶学习路线图

大模型学习路线图,整体分为5个大的阶段:

04视频和书籍PDF合集

从0到掌握主流大模型技术视频教程(涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向)

新手必备的大模型学习PDF书单来了!全是硬核知识,帮你少走弯路(不吹牛,真有用)

05行业报告+白皮书合集

收集70+报告与白皮书,了解行业最新动态!

0690+份面试题/经验

AI大模型岗位面试经验总结(谁学技术不是为了赚$呢,找个好的岗位很重要)

07 deepseek部署包+技巧大全

由于篇幅有限

只展示部分资料

并且还在持续更新中…

人工智能大潮已来,不加入就可能被淘汰。如果你是技术人,尤其是互联网从业者,现在就开始学习AI大模型技术,真的是给你的人生一个重要建议!

真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发

【附赠一节免费的直播讲座,技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等,欢迎大家~】

http://www.jsqmd.com/news/1103094/

相关文章:

  • 别再盲目订阅了!——从Token成本、RAG延迟、API稳定性到合规审计,DeepSeek与ChatGPT的6维ROI对比表(限业内高管内部流通版)
  • 鸣潮自动化助手:3大核心功能帮你解放双手,专注游戏乐趣
  • 深度学习模型推理框架_SNPT 对比 TRT
  • 基于Si4731与PIC18的数字收音机开发指南
  • PDF 高级自动化实操:用 OpenClaw 批量加水印、加密、OCR 识别、拆分合并
  • 抖音批量内容采集工具:高效采集与智能管理全指南
  • 连续测试了 5 款 OCR 工具后,我发现真正的问题根本不是识别率
  • 浏览器运行Obsidian自托管平台Ignis
  • 计算机毕业设计之废旧塑料交易系统的设计与实现
  • Awesome .NET:21000 Star 的 .NET 生态资源清单
  • 哔咔漫画下载器完整指南:三步打造个人离线漫画图书馆的简单方法
  • 非机动车头盔检测 二轮非机动车与头盔穿戴佩戴 目标检测数据集 (yolo格式数据集+voc数据集+coco数据集)
  • 【企业级AI选型生死线】:当你的客户要求“等保三级+数据不出境+审计留痕”,ChatGPT与文心一言仅1家能闭环交付(含工信部备案编号验证路径)
  • 抖音批量下载工具:双版本架构下的高效内容采集解决方案
  • 3分钟免费安装:Windows鼠标指针蔚蓝档案主题终极指南
  • Python语言写入文件操作时报错TextIOWrapper.write() takes exactly one argument
  • test01
  • ImDisk虚拟磁盘驱动器:Windows系统虚拟磁盘管理的终极指南
  • Minecraft 1.21终极中文汉化指南:轻松解锁Masa模组全家桶完整功能
  • XInputTest:你的游戏手柄性能诊断专家,3分钟找出延迟真相
  • Virtualbox+Ubuntu26.04虚拟机安装教程
  • 小说下载终极指南:如何用novel-downloader永久保存你的数字图书馆
  • Gitee DevSecOps 军工软件工厂实践:以智能版本管理破解跨院所协同难题
  • Xshell连接Ubuntu虚拟机实战指南
  • 抖音批量下载工具深度解析:从单视频到用户主页的完整解决方案
  • 趋盛产品开发应用实战篇(四)
  • 从零开始:AKShare让你的Python金融数据分析变得如此简单
  • 增强型与耗尽型MOSFET核心区别:器件机理、偏置逻辑与工程选型详解
  • 泰安 EM3 三维植被网供应商揭秘!他们究竟有何独特之处?
  • Markdown Viewer:浏览器内实时渲染引擎带来的文档工作流效率跃迁