当前位置: 首页 > news >正文

[Deep Agents:LangChain的Agent Harness-01]LangChain、LangGraph和Deep Agents三者之间的关系

Deep Agents是LangChain团队在2025年正式发布的一个开源Agent框架,专门用于构建能够处理生产级、长时程、多步骤任务的深度Agent。与传统的浅层Agent(仅依赖 LLM + 简单工具调用循环)不同,Deep Agents 旨在模拟像Claude Code或Deep Research那样的复杂执行能力。作为一个Agent开发框架,Deep Agents内置了任务规划、文件系统、Sub-Agent生成和长期记忆等功能。我们可以将Deep Agents用于任何任务,包括复杂的多步骤任务。在介绍Deep Agents之前,我们先来简单概括一下LangChain、LangGraph和Deep Agents三者之间的关系。

  • LangChain:是一个Agent开发框架,提供了构建Agent的核心模块,如工具调用循环、提示管理、记忆管理等。
  • LangGraph:是一个运行时系统,提供了持久执行、流式传输、人机交互等功能。
  • Deep Agents:是一个基于LangChain构建的Agent开发框架,它使用LangGraph来实现持久执行、流式传输、人机交互等功能。

也许说了这些你还是觉得困惑,那我说得更简单一点:它们的最终使命都是利用构建的Agent来完成我们给它的任务,但是它们创建Agent的方式不同。

1. LangGraph:将StateGraph编程成Agent

它利用一个StateGraph对象作为Builder,通过添加节点和边根据推理任务构建具有对应结构的状态图。Agent正是StateGraph编译后的结果,它本质上是一个Pregel对象,一个由节点和通道组成的Actor模型。StateGraph的节点转换成Pregel的节点,状态成员转换成Pregel的通道,由边决定的执行流程转换针对通道的订阅规则。原则上任意复杂度的状态图都可以通过为StateGraph添加相应的节点和边构建出来。比如我们利用如下的程序构建了一个包含四个节点(foo、bar、baz和qux)的状态图,并按照流转规则添加了相应的边,最终将其编译成一个Agent。

fromtypingimportTypedDictfromlanggraph.graphimportStateGraphfromPILimportImageimportioclassState(TypedDict):passasyncdeffoo(state:State):passasyncdefbar(state:State):passasyncdefbaz(state:State):passasyncdefqux(state:State):passagent=(StateGraph(State).add_node("foo",foo).add_node("bar",bar).add_node("baz",baz).add_node("qux",qux).set_entry_point("foo").set_finish_point("qux").add_edge("foo","bar").add_edge("foo","baz").add_edge(["bar","baz"],"qux").compile())Image.open(io.BytesIO(agent.get_graph().draw_mermaid_png())).show()

我们调用Agent对象的get_graph方法可以得到一个Graph对象,调用它的draw_mermaid_png方法可以得到一个PNG格式的状态图(字节数组),最终利用PIL库将其展示出来。

2. LangChain:利用create_agent函数创建Agent

我们将LangChainLangGraphDeep Agents放在一起比较,会将关注点落在用来创建Agent的create_agent工厂函数上。create_agent函数根据指定的模型和工具集创建的Agent,依然是采用上面这道机制创建的。默认状态类型为AgentStatemessages作为核心成员,承载了模型、用户和工具三者之间的对话历史create_agent函数依然会先创建作为Builder的StateGraph,并为其添加两个节点,一个用于封装模型(节点默认名称为model),另一个承载所有的工具(节点默认名称为tools)。

模型节点与工具节点之间具有一条动态条件边,当LLM返回的AIMessage包含工具调用时,被激活的这条边会路由到tools节点完成工具调用,反之则意味着AIMessage携带的就是最终的结果,整个推理过程就此结束。工具节点与模型节点有一条静态边,所以工具执行后会再次回到模型节点,后者在新的状态下完成下一步推理。

LangChain利用create_agent工厂函数创建Agent,一个最简单的Agent只需要指定模型即可,但一般情况我们都需要注册相应的工具。下面的代码利用create_agent函数创建了一个由ChatOpenAI模型和两个注册工具组成的Agent:

fromlangchain.agentsimportcreate_agentfromlangchain.toolsimporttoolfromlangchain_openaiimportChatOpenAIfromPILimportImagefromdotenvimportload_dotenvimportio load_dotenv()@toolasyncdeffoo():"""test tool foo"""@toolasyncdefbar():"""test tool bar"""agent=create_agent(model=ChatOpenAI(name="gpt-5.2-chat"),tools=[foo,bar])Image.open(io.BytesIO(agent.get_graph().draw_mermaid_png())).show()

当这个Agent被转换成图后具有如下的结构。这是一个包含两个节点的状态图,一个是用于决策和推理的model节点,作为决策执行者的工具全部被封装到tools节点中。

这种AgentState + 双节点的结构虽然简单,但却能满足常规的推理任务。对于更复杂的推理任务,一方面我们可以扩展AgentState,提供更多的状态成员来承载更多的上下文信息;另一方面我们也可以通过注册AgentMiddleware来添加更多的节点来完善工作流。具体来说,注册的AgentMiddleware提供了如下的功能:

  • 添加状态字段:如果AgentMiddleware涉及到针对状态更新,对应的状态字段会定义在state_schema字段返回的状态类型中。此状态状态类型通常是AgentState的子类,定义其中的字段最终会转换成通道;
  • 用于注册工具:当Middleware被注册到创建的Agent上时,存储在其tools字段中的工具会自动注册到Agent上。这相当于提供了一种模块化的工具开发和注册的方式;
  • 添加节点:当Middleware重写了before_agent/abefore_agentbefore_model/abefore_modelafter_model/aafter_modelafter_agent/aafter_agent方法,都会在状态图中相应的位置添加一个节点。Middleware相当于利用此方式完善了Agent的工作流;
  • 包装模型和工具调用:Middleware利用重写的wrap_model_call/awrap_model_callwrap_tool_call/awrap_tool_call方法对模型和工具的调用进行包装,将AOP引入到模型和工具的调用中,使得在调用前后添加一些额外的操作变得非常简单。比如很多Middleware都具有各自的系统提示词,它们基本上都是利用重写的wrap_model_call/awrap_model_call方法的方式实现针对系统提示词的注入;
classAgentMiddleware(Generic[StateT,ContextT]):defbefore_agent(self,state:StateT,runtime:Runtime[ContextT])->dict[str,Any]|None:passasyncdefabefore_agent(self,state:StateT,runtime:Runtime[ContextT])->dict[str,Any]|None:passdefbefore_model(self,state:StateT,runtime:Runtime[ContextT])->dict[str,Any]|None:passasyncdefabefore_model(self,state:StateT,runtime:Runtime[ContextT])->dict[str,Any]|None:passdefafter_model(self,state:StateT,runtime:Runtime[ContextT])->dict[str,Any]|None:passasyncdefaafter_model(self,state:StateT,runtime:Runtime[ContextT])->dict[str,Any]|None:passdefafter_agent(self,state:StateT,runtime:Runtime[ContextT])->dict[str,Any]|None:passasyncdefaafter_agent(self,state:StateT,runtime:Runtime[ContextT])->dict[str,Any]|None:passdefwrap_model_call(self,request:ModelRequest,handler:Callable[[ModelRequest],ModelResponse],)->ModelCallResultasyncdefawrap_model_call(self,request:ModelRequest,handler:Callable[[ModelRequest],Awaitable[ModelResponse]],)->ModelCallResultdefwrap_tool_call(self,request:ToolCallRequest,handler:Callable[[ToolCallRequest],ToolMessage|Command[Any]],)->ToolMessage|Command[Any]asyncdefawrap_tool_call(self,request:ToolCallRequest,handler:Callable[[ToolCallRequest],Awaitable[ToolMessage|Command[Any]]],)->ToolMessage|Command[Any]

在下面的程序中,我们定义了一个FoobarMiddleware,并将其注册到Agent上。虽然它没有添加任何新的功能,但它会在Agent如下所示的状态图中添加四个新的节点,分别是before_agentbefore_modelafter_modelafter_agent节点。

fromlangchain.agentsimportcreate_agentfromdotenvimportload_dotenvfromlangchain.agents.middleware.typesimportAgentStatefromlangchain.toolsimporttoolfromlangchain_openaiimportChatOpenAIfromPILimportImagefromlangchain.agents.middlewareimportAgentMiddlewarefromtypingimportAnyfromlanggraph.runtimeimportRuntimeimportio load_dotenv()classFoobarMiddleware(AgentMiddleware):defbefore_agent(self,state:AgentState[Any],runtime:Runtime[None])->dict[str,Any]|None:returnsuper().before_agent(state,runtime)defbefore_model(self,state:AgentState[Any],runtime:Runtime[None])->dict[str,Any]|None:returnsuper().before_model(state,runtime)defafter_agent(self,state:AgentState[Any],runtime:Runtime[None])->dict[str,Any]|None:returnsuper().after_agent(state,runtime)defafter_model(self,state:AgentState[Any],runtime:Runtime[None])->dict[str,Any]|None:returnsuper().after_model(state,runtime)@toolasyncdeffoo():"""test tool foo"""@toolasyncdefbar():"""test tool bar"""agent=create_agent(model=ChatOpenAI(name="gpt-5.2-chat"),tools=[foo,bar],middleware=[FoobarMiddleware()])Image.open(io.BytesIO(agent.get_graph().draw_mermaid_png())).show()

状态图结构如下所示:

3. Deep Agents:利用create_deep_agent函数创建Agent

Deep Agents拥有属于自己的Agent工厂函数create_deep_agent,它其实最终也会调用LangChain的create_agent函数来创建Agent,它仅仅在调用此方法时利用注册的Middleware为Agent添加了更多的功能,如任务规划、用于上下文管理的文件系统、Sub-Agent生成和长期记忆等功能。

从LangGraph和LangChain创建Agent的方式可以看出,它们相当于是自助餐和套餐的差别。LangGraph赋予完全的自由度,我们可以根据具体的推理任务对状态图进行DIY。虽然灵活自由,实则对用户提出了更高的要求。相比之下,LangChain利用create_agent函数创建的Agent具有固定结构,却能满足大部分的推理任务。它相当于提供了一款符合大众口味的基础套餐。在点餐的时候,我们可以选择这个基础套餐,也可以在此基础上添加、替换和剔除一些配菜来满足个性化的需求,这就是Middleware赋予的定制能力。

LangChain和Deep Agents的关系就像是基础套餐和升级套餐的关系。LangChain利用create_agent函数构建的Agent只具有基础的功能,任务定制的功能都需要通过注册Middleware来提供。企业级Agent来往往具有一些公共的功能需求,如任务规划、用于上下文管理的文件系统、Sub-Agent生成和长期记忆等功能。如果任何一个功能都要求用户通过注册Middleware来实现的话,无疑也会增加用户的使用门槛。于是Deep Agents对套餐进行了升级,在通过create_deep_agent函数创建Agent的时候,根据提供的配置自动注册了对应的Middleware。

为了探究create_deep_agent函数为创建的Agent注册了怎样的Middleware,我们编写了如下的演示程序:

fromdeepagentsimportcreate_deep_agentfromdeepagents.middlewareimportSubAgent,AsyncSubAgentfromlangchain.toolsimporttoolfromlangchain_openaiimportChatOpenAIfromPILimportImageimportiofromdotenvimportload_dotenv load_dotenv()@toolasyncdeffoo():"""test tool foo"""@toolasyncdefbar():"""test tool bar"""inline_subagent:SubAgent={"name":"inline-sub-agent","description":"A test inline sub-agent","system_prompt":"System prompt for inline sub-agent","model":ChatOpenAI(name="gpt-5.2-chat"),}async_subagent:AsyncSubAgent={"name":"async-sub-agent","description":"A test async sub-agent","graph_id":"graph-001",}agent=create_deep_agent(model=ChatOpenAI(name="gpt-5.2-chat"),memory=["/memories/AGENTS.md"],skills=["/skills/"],tools=[foo,bar],interrupt_on={"foo":True},subagents=[inline_subagent,async_subagent],)Image.open(io.BytesIO(agent.get_graph().draw_mermaid_png())).show()

在上面的程序中,我们通过create_deep_agent函数创建了一个Agent,并为它指定了模型、记忆、Skill、工具、中断规则和Sub-Agent(同步和异步)等配置。最终我们得到的状态图如下所示:

在上面这张图中,我们看到了五个Middleware。但是Deep Agents涉及的Middleware远不止这些,因为只有重写了before_agent/abefore_agentbefore_model/abefore_modelafter_model/aafter_model方法的Middleware才会转换成状态图的节点,而且SubAgentMiddlewareAsyncSubAgentMiddleware生成的Sub-Agent也会有自己的Middleware。总的来说,整个Deep Agents就建立在如下这几个Middleware之上,了解了它们你就了解了Deep Agents的全部。

  • FileSystemMiddleware: 提供一个抽象的文件系统。让Agent拥有读写本地文件的能力(如read_filewrite_file),用于存放中间结果或处理超长内容,防止上下文溢出;
  • TodoListMiddleware: 利用提供的系统提示词指示LLM将复杂的任务拆分为子任务列表(Todo-List),并以此为蓝本逐步实施。它同时提供了write_todos工具实时记录每个子任务的完成状态;
  • SkillsMiddleware: 允许Agent动态加载预定义的专业能力(Skills),通过注入系统提示词让Agent快速获得特定领域的专业知识;
  • HumanInTheLoopMiddleware: 实现了人机交互,在Agent调用关键/敏感工具前(如支付、删除文件)暂停并请求人类批准、修改或拒绝;
  • PatchToolCallsMiddleware:用于在模型输出不符合规范或需要动态调整时,对工具调用的参数进行实时补丁或格式修正,提高调用成功率;
  • _DeepAgentsSummarizationMiddleware:记忆瘦身器。自动对冗长的对话历史进行摘要压缩。它在信息进入模型前执行,仅保留关键摘要和最新消息,从而节省Token并维持长期对话的连贯性;
  • MemoryMiddleware:记忆持久化与注入器。它负责将用户偏好、业务规则或跨会话的关键事实提取出来,并以系统提示词的形式注入到Agent的大脑中;
  • SubAgentMiddleware: 分身指挥官。支持Agent生成具有独立上下文的Sub-Agent来分担任务,实现复杂工作的委派与隔离;
  • AsyncSubAgentMiddleware: 异步分身。在SubAgent基础上增加了异步执行能力,允许Main-Agent在Sub-Agent处理耗时任务时继续执行其他操作或同时管理多个子任务;
http://www.jsqmd.com/news/774114/

相关文章:

  • 开源ChatGPT API管理界面部署与定制指南
  • 别再让SysTick打架了!STM32CubeMX配置FreeRTOS时,给HAL库换个时基源的保姆级教程
  • 倒计时90天!SITS2026新规强制要求AISMM评估质量追溯机制,3类组织正紧急补签质量承诺书
  • TypeScript 对列,实现消息队列(FIFO显示+定时清理)
  • Git Restore命令介绍(撤销工作区修改、恢复多个文件、取消暂存:--staged、同时恢复暂存区和工作区:--worktree、-SW、从指定commit恢复文件--source)
  • 怎么在 docker-compose 中自定义网络名称和 IP?
  • java学习笔记(1)
  • 20260507笔记
  • SMP系统架构解析与多核优化实战
  • 将Claude Code编程助手无缝对接至Taotoken服务的详细配置步骤
  • AI模型选型避坑指南:五大核心维度横向对比
  • 本地AI对话搜索引擎aii:构建私有知识库与AI助手记忆体
  • GaussDB索引实战:从‘商品销售表’案例看5种索引的正确用法与性能对比
  • VRM Blender插件:解锁虚拟角色创作的专业解决方案
  • AMD SCU35 FPGA评估套件开发指南与应用解析
  • Git Merge命令介绍(把指定分支的提交历史合并到当前分支)经典合并、Fast-Forward快进合并FF Merge、三方合并、merge commit、squash merge、合并冲突
  • 2026年高品质的香水喷头/电化铝香水喷头定制加工厂家推荐 - 行业平台推荐
  • 思路总结--华大(Stereo-seq)的空间通讯分析
  • Attio:用关系型数据库思维重塑CRM与团队协作
  • Quixel Mixer本地材质库管理全攻略:从下载、整理到备份,告别资源混乱
  • Bonsai Memory:为AI智能体构建分层记忆索引,实现Token消耗降低81%
  • 性价比高的6s与目视化管理咨询企业
  • 基于MCP协议构建企业级AI协作引擎:连接Claude与Gemini的33个生产力工具
  • 海明码+加密签名(软考专项)学习记录+速记+真题
  • SystemVerilog里disable fork的‘误伤’有多严重?一个实际仿真案例带你避坑
  • Git Reset命令介绍(用于移动HEAD,并选择是否同步更新暂存区工作区)三种模式:--soft、--mixed(默认)、--hard;修改最近提交、合并多个提交、取消git add、回退版本回退
  • 创业者人格AI:大模型垂直化与提示词工程实战解析
  • 警惕!POS系统4大安全风险别踩雷
  • 不止于测距:用51单片机和HC-SR04超声波模块DIY一个简易倒车雷达/防撞预警系统
  • Taro编译h5端口点击返回Taro.navigateBack({delta: 1,})刷新当前页面问题