当前位置：首页 > news >正文

【第三周】RAG与Agent实战19：StrOutputParser字符串输出解析器

news 2026/7/1 23:22:56

在上一节中，学会了用|符号将组件串联起来。但是，当你尝试构建一个多步推理的链（比如：先让 AI 起个名字，再让 AI 根据这个名字写首诗）时，你可能会遇到一个令人头大的报错：

ValueError: Invalid input type <class 'langchain_core.messages.ai.AIMessage'>. Must be a PromptValue, str, or list of BaseMessages.

为什么明明组件都是Runnable，连在一起却报错了？今天我们就来揭秘这个“类型陷阱”，并介绍 LangChain 中的关键组件 ——StrOutputParser。

🚫 问题复现：为什么`model | model`会报错？

让我们先看一段看似合理但实际会崩溃的代码。假设我们想让模型做两件事：

第一步：根据姓氏和性别起个名字。
第二步：根据这个名字，写一句祝福语。

fromlangchain_core.promptsimportPromptTemplatefromlangchain_community.chat_models.tongyiimportChatTongyi model=ChatTongyi(model="qwen-plus")prompt=PromptTemplate.from_template("我的邻居姓：{lastname}, 刚生了{gender}，请起名，仅告诉我名字无需其他内容")# ❌ 错误写法：直接将两个模型串联chain=prompt|model|model res=chain.invoke({"lastname":"王","gender":"男"})print(res.content)

💥 报错分析

运行上述代码，你会得到类似这样的错误：
ValueError: Invalid input type <class 'langchain_core.messages.ai.AIMessage'>...

原因解析：

第一个model的输出：ChatModel 的invoke方法返回的是一个AIMessage对象（包含 content, response_metadata 等属性）。
第二个model的输入：ChatModel 的invoke方法不接受AIMessage对象作为直接输入！它只接受：
- str(字符串)
- PromptValue(提示词值对象)
- List[BaseMessage](消息列表)

结论：第一个模型的输出类型（AIMessage）与第二个模型的输入要求（str/PromptValue）不匹配。就像你想把方形积木塞进圆形的孔里，当然会报错。

🛠️ 解决方案：StrOutputParser

为了解决类型不匹配的问题，我们需要在两个模型中间加一个“转换器”。这个转换器负责把AIMessage对象“剥壳”，提取出里面的纯文本字符串 (str)。

这就是StrOutputParser的作用。

✅ 什么是 StrOutputParser？

功能：它是 LangChain 内置的最简单的输出解析器。它的唯一工作就是接收AIMessage，返回message.content（即纯字符串）。
身份：它也是Runnable的子类，所以可以完美地加入链中。
地位：它是连接“模型输出”和“需要字符串输入的下游组件”之间的桥梁。

🔄 修正后的代码

fromlangchain_core.output_parsersimportStrOutputParserfromlangchain_community.chat_models.tongyiimportChatTongyifromlangchain_core.promptsimportPromptTemplate# 1. 实例化解析器parser=StrOutputParser()model=ChatTongyi(model="qwen-plus")prompt=PromptTemplate.from_template("我的邻居姓：{lastname}, 刚生了{gender}，请起名，仅告诉我名字无需其他内容")# ✅ 正确写法：在两个模型之间加入 parser# 数据流向：# Dict -> Prompt -> AIMessage -> [Parser] -> String -> Model -> AIMessagechain=prompt|model|parser|model res=chain.invoke({"lastname":"王","gender":"男"})print("🎉 最终结果：")print(res.content)

⚙️ 内部流转过程详解

当我们调用chain.invoke(...)时，数据经历了以下变身：

Input:{"lastname": "王", "gender": "男"}
↓(PromptTemplate 处理)
Step 1 Output:AIMessage(content="王浩然")<--这里是对象
↓(StrOutputParser 处理)
Parser Output:"王浩然"<--变成了字符串！
↓(第二个 Model 接收字符串)
Step 2 Output:AIMessage(content="祝王浩然小朋友健康快乐成长！")

正是因为有了parser这一步“类型转换”，第二个模型才能顺利接收到它想要的字符串输入。

🧐 进阶思考：为什么模型不直接返回字符串？

你可能会问：“LangChain 为什么要设计得这么麻烦？让模型直接返回字符串不就省事了吗？”

这是一个很好的架构设计问题。AIMessage对象不仅仅包含文本，它还包含：

元数据：Token 消耗量、延迟时间、模型版本。
结构化信息：在某些高级用法中，可能包含工具调用请求（Tool Calls）。
角色标识：明确标记这是 AI 说的话，区分于 Human 或 System。

保留这些元数据对于调试、计费和构建复杂的 Agent 系统至关重要。StrOutputParser给了开发者选择权：如果你只需要文本，就加上它；如果你需要完整信息，就不加。

🚀 总结

本节课我们解决了链式调用中的核心痛点：

类型 mismatch 问题：理解了ChatModel输出AIMessage但不能直接作为下一个ChatModel输入的原因。
StrOutputParser 的作用：学会了使用它作为“适配器”，将AIMessage转换为str。
多步推理链构建：掌握了Prompt | Model | Parser | Model的标准范式，这是构建 Agent 自主规划、多轮反思等高级功能的基础。

现在，你的链条已经可以无限延长了！只要记得在需要“纯文本”的地方，插上StrOutputParser这个插头即可。

查看全文

http://www.jsqmd.com/news/489573/