当前位置: 首页 > news >正文

22. LangChain LCEL,用 | 串联AI的魔法语言

LangChain 生态中,LCEL(LangChain Expression Language)是一种新的编程范式。它用一个简单的|,改变了 AI 应用的构建方式。曾经需要编写大量胶水代码才能串联起来的提示词、模型和输出解析器,现在只需要一行代码就能完成:

chain = prompt | model | parser

1. LCEL 核心原理:| 运算符的秘密
LCEL 的核心设计哲学就是 "数据流优先"。所有组件都遵循统一的接口,数据从左向右沿着链条自动流动,无需开发者手动处理中间状态。

链式组合:LCEL 使用|(竖线)运算符串联 Prompt、模型与输出解析器形成 AI 流水线,数据严格按照从左到右的顺序传递。

底层实现:| 运算符本质上是 Python 中__or__方法的语法糖。

Runnable 基类:LangChain 中所有可执行组件都继承自Runnable基类,该基类重载了__or__方法,这就是为什么所有组件都能使用|进行链式组合的根本原因。

image

 2. 三步构建你的第一条 AI 链

下面,让我们从最简单的例子开始,用 LCEL 构建一个笑话生成器。这个例子将展示 LCEL 最核心的用法:串联提示词、模型和字符串输出解析器。

import os
from dotenv import load_dotenv
from langchain.chat_models import init_chat_model
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import StrOutputParser# 加载环境变量(包含API密钥、模型名称等)
load_dotenv()# 初始化模型(使用config_prefix支持多模型配置)
prefix = "QWEN"
model = init_chat_model(model_provider="openai",configurable_fields=["model", "api_key", "base_url"],config_prefix=prefix,temperature=0.5,max_tokens=500
)# 模型配置(从环境变量中读取)
config = {"configurable": {f"{prefix}_model": os.getenv(f"{prefix}_MODEL"),f"{prefix}_api_key": os.getenv(f"{prefix}_API_KEY"),f"{prefix}_base_url": os.getenv(f"{prefix}_BASE_URL")}
}# 创建提示词模板
prompt = ChatPromptTemplate.from_messages([{"role": "system", "content": "你是一个笑话大王"},{"role": "user", "content": "{new_input}"}]
)# 用LCEL构建完整链条
chain = prompt | model | StrOutputParser()# 执行链条,传入原始输入
result = chain.invoke({"new_input": "讲一个笑话"}, config=config)
print(result)

3. 进阶用法:什么可以入链?
LCEL 的强大之处在于它的包容性。几乎任何逻辑都可以被包装成 Runnable 组件,然后无缝接入流水线。但有一个核心规则必须牢记:

入链的内容必须是 Runnable 的子类,字典的值也必须符合这个规则。

下面是不同数据类型的处理方式对照表:

数据类型 处理方式 对应 Runnable子类 核心作用
静态值 包装为lambda _: 静态值 RunnableLambda 生成固定值
函数/lambda表达式 直接使用(自动转换) RunnableLambda 执行自定义逻辑
动态值 使用RunnablePassthrough() RunnablePassthrough 原样传递数据
字典 直接使用,值也要符合规范 RunnableParallel 并行执行多分支
让我们用一个例子来演示这些规则。我们将构建一个能生成结构化 JSON 数据的 AI 链,这在实际应用中非常常见。

RunnablePassthrough():当你直接传入字符串"请描述一下张三..."时,RunnablePassthrough()会将这个字符串原样传递给new_input变量。

lambda _: parser.get_format_instructions():这里的下划线_表示我们不关心上游输入,因为格式指令是固定的。这个 lambda 会被自动转换为RunnableLambda。

字典入链:整个字典会被转换为RunnableParallel对象,它会并行执行所有键对应的 Runnable,然后将结果合并为一个新的字典传递给下一个组件(这里是 prompt)。

import os
from dotenv import load_dotenv
from langchain.chat_models import init_chat_model
import asyncio
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import JsonOutputParser
from langchain_core.runnables import RunnablePassthroughload_dotenv()
prefix = "QWEN"
model = init_chat_model(model_provider="openai",configurable_fields=["model", "api_key", "base_url"],config_prefix=prefix,temperature=0.5,max_tokens=500
)
config = {"configurable": {f"{prefix}_model": os.getenv(f"{prefix}_MODEL"),f"{prefix}_api_key": os.getenv(f"{prefix}_API_KEY"),f"{prefix}_base_url": os.getenv(f"{prefix}_BASE_URL")}
}prompt = ChatPromptTemplate.from_messages([{"role": "system", "content": "你是一位有10年经验的资深软件工程师。{format_instructions}"},{"role": "user", "content": "{new_input}"}]
)parser = JsonOutputParser()
chain = ({"new_input": RunnablePassthrough(),"format_instructions": lambda _: parser.get_format_instructions()}| prompt| model| parser
)
result = chain.invoke("请描述一下张三这个人,包括姓名、年龄、职业和兴趣爱好。", config=config)
print(result)

4. 函数入链:无缝集成自定义逻辑

LCEL 最强大的特性之一就是可以轻松将任意 Python 函数接入流水线。函数会被自动转换为RunnableLambda,无需任何额外的包装代码。

让我们扩展上一个例子,添加一个函数将生成的 JSON 数据自动保存到本地文件。

import json
import os
from dotenv import load_dotenv
from langchain.chat_models import init_chat_model
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import JsonOutputParser
from langchain_core.runnables import RunnablePassthroughload_dotenv()prefix = "QWEN"
model = init_chat_model(model_provider="openai",configurable_fields=["model", "api_key", "base_url"],config_prefix=prefix
)config = {"configurable": {f"{prefix}_model": os.getenv(f"{prefix}_MODEL"),f"{prefix}_api_key": os.getenv(f"{prefix}_API_KEY"),f"{prefix}_base_url": os.getenv(f"{prefix}_BASE_URL")}
}# 自定义函数:保存JSON数据到文件
def save_json(data, filename="output.json"):try:with open(filename, "w", encoding="utf-8") as f:json.dump(data, f, ensure_ascii=False, indent=4)print(f"JSON数据已成功保存到 {filename}")except Exception as e:print(f"保存JSON文件时出错: {e}")return data  # 重要:返回数据以便继续传递给下一个组件
 
parser = JsonOutputParser()
prompt = ChatPromptTemplate.from_messages([{"role": "system", "content": "你是一位有10年经验的资深软件工程师。{format_instructions}"},{"role": "user", "content": "{new_input}"}]
)# 将自定义函数直接加入链条
chain = ({"new_input": RunnablePassthrough(),"format_instructions": lambda _: parser.get_format_instructions()}| prompt| model| parser| save_json  # 函数直接入链
         )result = chain.invoke("请描述一下张三这个人,包括姓名、年龄、职业和兴趣爱好。", config=config)
print(result)

运行这段代码后,你会在当前目录下看到一个output.json文件,内容如下:

{"姓名": "张三","年龄": 30,"职业": "软件工程师","兴趣爱好": ["阅读技术书籍","徒步旅行","围棋"]
}

重要提示:自定义函数必须返回数据,这样数据才能继续传递给链条中的下一个组件。如果函数没有返回值(返回None),那么链条的后续组件将收到None作为输入。

 

http://www.jsqmd.com/news/879331/

相关文章:

  • Gofile极速下载器:3倍下载速度的完整指南
  • 混合特征选择与XGBoost在物联网DDoS检测中的高效实践
  • 2026年AI论文平台实测排行,哪款真正适合毕业定稿?
  • 深度解析sguard_limit:ACE-Guard内核级资源限制器的架构设计与性能优化
  • 终极指南:3分钟为Figma装上中文界面,设计师效率翻倍的秘密武器
  • IPXWrapper完整教程:让经典游戏在现代Windows系统重获联机能力
  • 从岭回归到Lasso:正则化原理、稀疏性与ADMM算法实践
  • 抖音音频下载终极指南:3分钟搞定无损音乐批量提取
  • 终极GitHub加速指南:3分钟告别龟速下载的完整教程
  • 拓扑数据分析实战:从点云到机器学习特征提取
  • UAC‑0057 组织 Oyster 系列工具链攻击机理与防御研究
  • AI Fluency 驱动 MSP 网络安全竞争力提升机制与实践
  • Label Studio:一站式数据标注与AI模型训练完整指南
  • 智慧灌溉系统数据优化:基于聚类与机器人传感的降本增效实践
  • 机器学习泛化理论:从AIC/BIC到集中不等式的模型选择与误差分析
  • 抖音批量下载器:5分钟掌握高效音乐视频下载技巧,提升创作效率95%
  • 长期使用 Taotoken Token Plan 套餐的成本控制效果观察
  • 为开源Agent工具OpenClaw配置Taotoken,扩展其模型支持范围
  • Windows Defender移除工具终极指南:3步彻底禁用安全组件,性能飙升30%
  • 拓扑数据分析与机器学习预测燃料电池电极性能
  • 解放双手的明日方舟自动化助手:Arknights-Mower 全方位使用指南
  • Nodejs后端服务集成Taotoken多模型API的实践路径
  • 为什么92%的团队在DeepSeek边缘部署时失败?——NPU算力调度、TensorRT-LLM适配、冷启动延迟三大隐性瓶颈深度拆解
  • 面向 40 岁以上人群的社交平台定向钓鱼攻击机理与防御研究
  • AllData数据中台架构解析与部署实战:企业级数据治理平台技术深度指南
  • 从传统到智能:3步解锁Audacity的AI音频处理革命
  • 基于加速度计与机器学习的动物行为识别:从特征工程到模型部署
  • 从0到1构建企业级脑筋急转弯生成系统:融合知识图谱校验+幽默度评分模型+人工审核SOP(GitHub开源代码已获1.2k Star)
  • 告别驱动精灵!手把手教你用设备管理器手动修复声卡驱动(以英特尔智音技术为例)
  • PIHMC-MIX:混合机器学习势与路径积分,高效模拟核量子效应