当前位置: 首页 > news >正文

13.将手写 Agent 主流程迁移为 LangGraph 最小闭环,并接回 FastAPI + session 外壳

目 录

  • 前 言
  • 开始动手
    • 项目结构重构
    • 数据State化
    • 函数Node化
    • 串起Node形成Graph
  • 收尾

前 言

咱们前面的代码是通过手写Agent工作流程,实现了一个论文RAG问答系统,但是在实际生产环境中不会用这种纯手写工作逻辑项目,更多的是使用现有框架比如LangGraph和LangChain,LangChain是一种高级封装后的框架,更适合需要借助智能体完成固定任务的非专业用户,而LangGraph是一种更细粒度的智能体开发框架,允许完全自定义图结构,适合定制更复杂的智能体,以满足个性化的任务需求。

打个比较形象的比方,相信很多人都喜欢摄影,专业摄影师会有各种长枪短炮,并且在摄影时会调整相机参数,比如曝光度、白平衡等等,然后看到有灵感的风景会考虑景深,和前后景的关系,最终拍出来一张美图。基于LangGraph的开发与这类似,整个过程细节可调的地方非常多,所以做出来的东西比较专业,定制化也比较高。相反,基于LangChain的智能体开发有点像是一个人,拿着那种开了美颜的傻瓜机在拍照,各种参数和接口都已经被提前设定好了,也可以拍出能看的照片,但是这种东西有上限。

开始动手

咱们手写Agent是写了三个函数choose_toolexecute_toolgenerate_final_answer,通过数据在三个函数间的流动实现了一个最小的智能体循环:

用户问题 → 思考 → 调工具 → 看结果 → 再思考 → 再决定下一步 → 最终回答

当进入到LangGraph后咱们对数据的概念需要发生一点变化,在这个框架中数据称为State,对数据进行操作函数称为Node,不同节点间通过Edge连接构成流,这个框架命中带Graph,可能是因为这个工作流结构和图论中的图一样。

为了更好的理解LangGraph,咱们还是在原有的代码上做迁移,但是最好还是新建一个项目,Python版本选择3.11,随后安装咱们前面用到的依赖,并且还要把LangGraph等依赖安装上:

pip install-U langgraph langchain langchain-openai pip install-U fastapi uvicorn openai python-dotenv pypdf numpy pydantic pip install-U faiss-cpu

项目结构重构

咱们的项目需要重构,可以按照下面的目录重新组织:

LangChain-for-A-Paper-Rag-Agent/ ├─ app/ │ ├─ __init__.py │ ├─ config.py │ ├─ logger_config.py │ ├─ llm_utils.py │ ├─ data_loader.py │ ├─ rag_system.py │ ├─ tools.py │ ├─ session_manager.py │ ├─ main.py │ └─ graph/ │ ├─ __init__.py │ ├─ state.py │ ├─ nodes.py │ └─ builder.py ├─ data/ ├─ .env └─ requirements.txt

数据State化

智能体对数据的操作原理上是:Graph中的每个节点只负责读state,改state,再把结果交给下一个节点。所以我们首先在app/graph/目录下创建state.py,用于定义在图中流的state:

fromtypingimportAnyfromtyping_extensionsimportTypedDictclassAgentState(TypedDict,total=False):# 当前会话信息session_id:str# 当前用户问题query:str# 历史对话chat_history:list[dict[str,str]]# 路由决策结果# 例如: {"tool": "rag", "input": "what is ..."}decision:dict[str,Any]# 工具执行结果# 例如:# {# "tool_name": "rag",# "tool_input": "...",# "tool_output": "..."# }tool_result:dict[str,Any]# 最终返回给用户的答案final_answer:str# 预留错误字段,后面做异常兜底会用到error:str

函数Node化

在LangGraph中函数称为Node,我们需要咱们最早在agent.py中定义的三个函数进行改造,让他们变成可以接受数据state的node,首先需要在app/graph/目录下新建node.py,然后定义两个工厂函数和一个节点:

关于为什么用工厂函数后面会详细解释。

importjsonfromtypingimportAnyfromapp.graph.stateimportAgentStatefromapp.llm_utilsimportclientfromapp.configimportCHAT_MODELfromapp.logger_configimportsetup_logger logger=setup_logger()defbuild_choose_tool_node(tools:list[dict[str,Any]]):defchoose_tool_node(state:AgentState)->AgentState:query=state["query"]tool_desc="\n".join([f"{t['name']}:{t['description']}"fortintools])prompt=f""" You are an AI agent. Available tools:{tool_desc}User question:{query}Return JSON: {{"tool": "...", "input": "..."}} """content=""try:response=client.chat.completions.create(model=CHAT_MODEL,messages=[{"role":"user","content":prompt}])content=response.choices[0].message.content decision=json.loads(content)exceptException:logger.warning(f"Tool decision parse failed:{content}")decision={"tool":"llm","input":query}return{"decision":decision}returnchoose_tool_nodedefbuild_execute_tool_node(tools:list[dict[str,Any]],rag=None):defexecute_tool_node(state:AgentState)->AgentState:decision=state["decision"]chat_history=state.get("chat_history",[])tool_name=decision["tool"]tool_input=decision["input"]fortintools:ift["name"]==tool_name:iftool_name=="rag":result=t["func"](tool_input,rag,chat_history=chat_history)eliftool_name=="llm":result=t["func"](tool_input,chat_history=chat_history)else:result=t["func"](tool_input)return{"tool_result":{"tool_name":tool_name,"tool_input":tool_input,"tool_output":result}}return{"tool_result":{"tool_name":"none","tool_input":tool_input,"tool_output":"No valid tool found."}}returnexecute_tool_nodedefgenerate_answer_node(state:AgentState)->AgentState:query=state["query"]tool_result=state["tool_result"]prompt=f""" You are an AI assistant. The user asked:{query}A tool was used: Tool name:{tool_result['tool_name']}Tool input:{tool_result['tool_input']}Tool output:{tool_result['tool_output']}Now provide a final helpful answer to the user. """response=client.chat.completions.create(model=CHAT_MODEL,messages=[{"role":"user","content":prompt}])final_answer=response.choices[0].message.contentreturn{"final_answer":final_answer}

串起Node形成Graph

到这一步咱们就到了LangGraph的核心操作,将各个node串起形成工作流,前面咱们说过咱们在创建节点的时候用到了工厂函数,在这一节我也想解释原因,不够首先咱们还是先在app/graph/目录下新建一个builder.py文件:

fromlanggraph.graphimportStateGraph,START,ENDfromapp.graph.stateimportAgentStatefromapp.graph.nodesimport(build_choose_tool_node,build_execute_tool_node,generate_answer_node,)defbuild_agent_graph(tools,rag=None):graph_builder=StateGraph(AgentState)# 1. 注册节点graph_builder.add_node("choose_tool",build_choose_tool_node(tools))graph_builder.add_node("execute_tool",build_execute_tool_node(tools,rag=rag))graph_builder.add_node("generate_answer",generate_answer_node)# 2. 连接流程graph_builder.add_edge(START,"choose_tool")graph_builder.add_edge("choose_tool","execute_tool")graph_builder.add_edge("execute_tool","generate_answer")graph_builder.add_edge("generate_answer",END)# 3. 编译 graphreturngraph_builder.compile()

相信看到这里,你已经看明白了LangGraph的逻辑,这个框架将数据定义state,将函数定义为node,通过添加edge实现业务逻辑间的工作流。可能打一个不太恰当的比方,通过LangGraph创建的智能体他身上像是绑定了一堆state数据,你给它定义了node和edge,它就会按照你定义的工作顺序去拿node修改自身绑定的state,最后返回给你操作结果。

关于工厂函数这里我解释一下(我也是踩了坑了):选择工具node和执行node不同于咱们的生成回答node,生成回答node只需要给她传入state就可以得到响应的结果,但是前两个node你发现他们在创建的时候是需要一些外部依赖的,所以咱们需要定义工厂函数,将外部依赖传入,再生成出响应的node,所以这里用到了工厂函数。一句话概括:一些node的生成需要外部依赖,所以咱们需要用工厂函数加工再生成node。

收尾

最后就是启动咱们的项目了,在app目标下新建main.py文件,然后在原有的代码基础上增加一步创建图的操作graph = build_agent_graph(TOOLS, rag=rag),就可以启动新的系统了,这样便实现了手写Agent到LangGraph的迁移:

fromfastapiimportFastAPI,HTTPExceptionfrompydanticimportBaseModelfromapp.configimportDATA_DIRfromapp.data_loaderimportload_pdfs,process_documentsfromapp.rag_systemimportRAGSystemfromapp.toolsimportTOOLSfromapp.session_managerimportSessionManagerfromapp.graph.builderimportbuild_agent_graphfromapp.logger_configimportsetup_logger logger=setup_logger()app=FastAPI()session_manager=SessionManager(max_turns=3)rag=Nonegraph=NoneclassQueryRequest(BaseModel):session_id:strquestion:str@app.on_event("startup")defstartup_event():globalrag,graph logger.info("Loading RAG system...")docs=load_pdfs(DATA_DIR)logger.info(f"docs数量:{len(docs)}")chunks=process_documents(docs)logger.info(f"chunks数量:{len(chunks)}")rag=RAGSystem(chunks)rag.build_index()graph=build_agent_graph(TOOLS,rag=rag)logger.info("RAG + LangGraph ready!")@app.post("/ask")defask_question(req:QueryRequest):try:history=session_manager.get_history(req.session_id)state={"session_id":req.session_id,"query":req.question,"chat_history":history,}result=graph.invoke(state)answer=result["final_answer"]session_manager.append_turn(req.session_id,req.question,answer)return{"session_id":req.session_id,"question":req.question,"answer":answer}exceptExceptionase:logger.exception("Error occurred in /ask")raiseHTTPException(status_code=500,detail=str(e))@app.post("/clear/{session_id}")defclear_session(session_id:str):session_manager.clear_session(session_id)return{"session_id":session_id,"message":"session cleared"}

如果这篇文章对你有帮助,可以点个赞~
完整代码地址:https://github.com/1186141415/LangChain-for-A-Paper-Rag-Agent

http://www.jsqmd.com/news/625707/

相关文章:

  • 浙江义乌:多家企业依托启山智软“线上商城4.0” 助推大中型企业商城系统建设
  • 《花见小路》与结对编程
  • [PaddleOCR]文本图像矫正模块:从原理到实战的完整指南
  • 自动写文章:我们如何与文字高效协作
  • 告别手动点按!用Python脚本自动化你的Trace32调试工作流
  • 英雄联盟回放文件播放难题的终极解决方案:ROFL播放器深度解析
  • FPGA上板实测:UltraScale+ 40G/50G以太网IP核的完整配置流程与一个奇怪的复位BUG
  • 模型预测控制:从数学到车轮的暴力破解
  • ModuleNotFoundError: No module named langchain_core.pydantic_v1
  • Matlab/Cplex代码功能说明:基于消纳责任权重的两级电力市场优化运行模型
  • crossoverJie把
  • 别再只调参数了!深入OpenCV_contrib模块:手把手编译并实战ESPCN超分与CLAHE增强
  • 充电宝选取建议全流程教程
  • 【AI原生DevSecOps落地指南】:SITS2026首席架构师亲授5大不可跳过的实践拐点
  • 构建毫秒级响应、TB级吞吐、零人工干预的数据Pipeline:揭秘某千亿参数模型背后的12个原子化算子设计
  • 打字不如说话,说话不如截图——AI 代码助手的多模态输入实践晌
  • 终极指南:如何用FanControl实现Windows系统风扇精准控制
  • 收藏必备!小白程序员快速入门2026 AI技术栈:从AI Agents到大模型全景图解
  • 基于Python的PC微信自动化探索:uiautomation+OpenCV+EasyOCR都
  • Windows驱动存储管理终极方案:DriverStore Explorer深度应用指南
  • Redis持久化:从AOF到RDB,如何实现数据不丢失?坊
  • Dell r730xd服务器阵列卡实战:系统盘RAID 1配置详解与避坑指南
  • 千问3.5-2B C++项目代码重构建议:提升性能与可维护性
  • Google收紧分发与权限,全球监管聚焦数字生命周期
  • 前端八股3---ref和reactive
  • 清音刻墨惊艳案例:交响乐指挥解说视频中术语与乐段精准同步
  • 【奇点密档·RAG架构白皮书】:基于2026大会实测数据的向量库选型决策树(Milvus/Weaviate/Qdrant终极对比)
  • Redis持久化:从AOF到RDB,如何实现数据不丢失?烈
  • 直播食安爆雷不断!2026新规落地,维权终于有了硬保障
  • FLUX.1-dev实战教程:像素幻梦中自定义采样器(Sampler)切换与效果差异