当前位置：首页 > news >正文

22. LangChain LCEL，用 | 串联AI的魔法语言

news 2026/7/13 7:19:36

在 LangChain 生态中，LCEL（LangChain Expression Language）是一种新的编程范式。它用一个简单的|，改变了 AI 应用的构建方式。曾经需要编写大量胶水代码才能串联起来的提示词、模型和输出解析器，现在只需要一行代码就能完成：

chain = prompt | model | parser

1. LCEL 核心原理：| 运算符的秘密
LCEL 的核心设计哲学就是 "数据流优先"。所有组件都遵循统一的接口，数据从左向右沿着链条自动流动，无需开发者手动处理中间状态。

链式组合：LCEL 使用|（竖线）运算符串联 Prompt、模型与输出解析器形成 AI 流水线，数据严格按照从左到右的顺序传递。

底层实现：| 运算符本质上是 Python 中__or__方法的语法糖。

Runnable 基类：LangChain 中所有可执行组件都继承自Runnable基类，该基类重载了__or__方法，这就是为什么所有组件都能使用|进行链式组合的根本原因。

2. 三步构建你的第一条 AI 链

下面，让我们从最简单的例子开始，用 LCEL 构建一个笑话生成器。这个例子将展示 LCEL 最核心的用法：串联提示词、模型和字符串输出解析器。

import os
from dotenv import load_dotenv
from langchain.chat_models import init_chat_model
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import StrOutputParser# 加载环境变量（包含API密钥、模型名称等）
load_dotenv()# 初始化模型（使用config_prefix支持多模型配置）
prefix = "QWEN"
model = init_chat_model(model_provider="openai",configurable_fields=["model", "api_key", "base_url"],config_prefix=prefix,temperature=0.5,max_tokens=500
)# 模型配置（从环境变量中读取）
config = {"configurable": {f"{prefix}_model": os.getenv(f"{prefix}_MODEL"),f"{prefix}_api_key": os.getenv(f"{prefix}_API_KEY"),f"{prefix}_base_url": os.getenv(f"{prefix}_BASE_URL")}
}# 创建提示词模板
prompt = ChatPromptTemplate.from_messages([{"role": "system", "content": "你是一个笑话大王"},{"role": "user", "content": "{new_input}"}]
)# 用LCEL构建完整链条
chain = prompt | model | StrOutputParser()# 执行链条，传入原始输入
result = chain.invoke({"new_input": "讲一个笑话"}, config=config)
print(result)

3. 进阶用法：什么可以入链？
LCEL 的强大之处在于它的包容性。几乎任何逻辑都可以被包装成 Runnable 组件，然后无缝接入流水线。但有一个核心规则必须牢记：

入链的内容必须是 Runnable 的子类，字典的值也必须符合这个规则。

下面是不同数据类型的处理方式对照表：

数据类型处理方式对应 Runnable子类核心作用
静态值包装为lambda _: 静态值 RunnableLambda 生成固定值
函数/lambda表达式直接使用（自动转换） RunnableLambda 执行自定义逻辑
动态值使用RunnablePassthrough() RunnablePassthrough 原样传递数据
字典直接使用，值也要符合规范 RunnableParallel 并行执行多分支
让我们用一个例子来演示这些规则。我们将构建一个能生成结构化 JSON 数据的 AI 链，这在实际应用中非常常见。

RunnablePassthrough()：当你直接传入字符串"请描述一下张三..."时，RunnablePassthrough()会将这个字符串原样传递给new_input变量。

lambda _: parser.get_format_instructions()：这里的下划线_表示我们不关心上游输入，因为格式指令是固定的。这个 lambda 会被自动转换为RunnableLambda。

字典入链：整个字典会被转换为RunnableParallel对象，它会并行执行所有键对应的 Runnable，然后将结果合并为一个新的字典传递给下一个组件（这里是 prompt）。

import os
from dotenv import load_dotenv
from langchain.chat_models import init_chat_model
import asyncio
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import JsonOutputParser
from langchain_core.runnables import RunnablePassthroughload_dotenv()
prefix = "QWEN"
model = init_chat_model(model_provider="openai",configurable_fields=["model", "api_key", "base_url"],config_prefix=prefix,temperature=0.5,max_tokens=500
)
config = {"configurable": {f"{prefix}_model": os.getenv(f"{prefix}_MODEL"),f"{prefix}_api_key": os.getenv(f"{prefix}_API_KEY"),f"{prefix}_base_url": os.getenv(f"{prefix}_BASE_URL")}
}prompt = ChatPromptTemplate.from_messages([{"role": "system", "content": "你是一位有10年经验的资深软件工程师。{format_instructions}"},{"role": "user", "content": "{new_input}"}]
)parser = JsonOutputParser()
chain = ({"new_input": RunnablePassthrough(),"format_instructions": lambda _: parser.get_format_instructions()}| prompt| model| parser
)
result = chain.invoke("请描述一下张三这个人，包括姓名、年龄、职业和兴趣爱好。", config=config)
print(result)

4. 函数入链：无缝集成自定义逻辑

LCEL 最强大的特性之一就是可以轻松将任意 Python 函数接入流水线。函数会被自动转换为RunnableLambda，无需任何额外的包装代码。

让我们扩展上一个例子，添加一个函数将生成的 JSON 数据自动保存到本地文件。

import json
import os
from dotenv import load_dotenv
from langchain.chat_models import init_chat_model
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import JsonOutputParser
from langchain_core.runnables import RunnablePassthroughload_dotenv()prefix = "QWEN"
model = init_chat_model(model_provider="openai",configurable_fields=["model", "api_key", "base_url"],config_prefix=prefix
)config = {"configurable": {f"{prefix}_model": os.getenv(f"{prefix}_MODEL"),f"{prefix}_api_key": os.getenv(f"{prefix}_API_KEY"),f"{prefix}_base_url": os.getenv(f"{prefix}_BASE_URL")}
}# 自定义函数：保存JSON数据到文件
def save_json(data, filename="output.json"):try:with open(filename, "w", encoding="utf-8") as f:json.dump(data, f, ensure_ascii=False, indent=4)print(f"JSON数据已成功保存到 {filename}")except Exception as e:print(f"保存JSON文件时出错: {e}")return data  # 重要：返回数据以便继续传递给下一个组件
 
parser = JsonOutputParser()
prompt = ChatPromptTemplate.from_messages([{"role": "system", "content": "你是一位有10年经验的资深软件工程师。{format_instructions}"},{"role": "user", "content": "{new_input}"}]
)# 将自定义函数直接加入链条
chain = ({"new_input": RunnablePassthrough(),"format_instructions": lambda _: parser.get_format_instructions()}| prompt| model| parser| save_json  # 函数直接入链
         )result = chain.invoke("请描述一下张三这个人，包括姓名、年龄、职业和兴趣爱好。", config=config)
print(result)

运行这段代码后，你会在当前目录下看到一个output.json文件，内容如下：

{"姓名": "张三","年龄": 30,"职业": "软件工程师","兴趣爱好": ["阅读技术书籍","徒步旅行","围棋"]
}

重要提示：自定义函数必须返回数据，这样数据才能继续传递给链条中的下一个组件。如果函数没有返回值（返回None），那么链条的后续组件将收到None作为输入。

查看全文

http://www.jsqmd.com/news/879331/

Gofile极速下载器：3倍下载速度的完整指南

混合特征选择与XGBoost在物联网DDoS检测中的高效实践

2026年AI论文平台实测排行，哪款真正适合毕业定稿？

深度解析sguard_limit：ACE-Guard内核级资源限制器的架构设计与性能优化

终极指南：3分钟为Figma装上中文界面，设计师效率翻倍的秘密武器

IPXWrapper完整教程：让经典游戏在现代Windows系统重获联机能力

从岭回归到Lasso：正则化原理、稀疏性与ADMM算法实践

抖音音频下载终极指南：3分钟搞定无损音乐批量提取

终极GitHub加速指南：3分钟告别龟速下载的完整教程

拓扑数据分析实战：从点云到机器学习特征提取

UAC‑0057 组织 Oyster 系列工具链攻击机理与防御研究

AI Fluency 驱动 MSP 网络安全竞争力提升机制与实践

Label Studio：一站式数据标注与AI模型训练完整指南

智慧灌溉系统数据优化：基于聚类与机器人传感的降本增效实践

机器学习泛化理论：从AIC/BIC到集中不等式的模型选择与误差分析

抖音批量下载器：5分钟掌握高效音乐视频下载技巧，提升创作效率95%

长期使用 Taotoken Token Plan 套餐的成本控制效果观察

为开源Agent工具OpenClaw配置Taotoken，扩展其模型支持范围

Windows Defender移除工具终极指南：3步彻底禁用安全组件，性能飙升30%

拓扑数据分析与机器学习预测燃料电池电极性能

解放双手的明日方舟自动化助手：Arknights-Mower 全方位使用指南

Nodejs后端服务集成Taotoken多模型API的实践路径

为什么92%的团队在DeepSeek边缘部署时失败？——NPU算力调度、TensorRT-LLM适配、冷启动延迟三大隐性瓶颈深度拆解

面向 40 岁以上人群的社交平台定向钓鱼攻击机理与防御研究

AllData数据中台架构解析与部署实战：企业级数据治理平台技术深度指南

从传统到智能：3步解锁Audacity的AI音频处理革命

基于加速度计与机器学习的动物行为识别：从特征工程到模型部署

从0到1构建企业级脑筋急转弯生成系统：融合知识图谱校验+幽默度评分模型+人工审核SOP（GitHub开源代码已获1.2k Star）

告别驱动精灵！手把手教你用设备管理器手动修复声卡驱动（以英特尔智音技术为例）

PIHMC-MIX：混合机器学习势与路径积分，高效模拟核量子效应

4. 函数入链：无缝集成自定义逻辑

相关文章：