当前位置: 首页 > news >正文

LeetCode 删除无效的括号:python 题解诓

这个代码的核心功能是:基于输入词的长度动态选择反义词示例,并调用大模型生成反义词,体现了 “动态少样本提示(Dynamic Few-Shot Prompting)” 与 “上下文长度感知的示例选择” 的能力。

from langchain.prompts import FewShotPromptTemplate, PromptTemplate

from langchain.prompts.example_selector import LengthBasedExampleSelector

from langchain_core.output_parsers import StrOutputParser

from langchain_openai import ChatOpenAI

import os

from dotenv import load_dotenv

# 定义反义词任务的示例数据集(few-shot examples)

# 每个示例包含一个输入词(input)和对应的反义词(output)

examples = [

{"input": "开心", "output": "伤心"},

{"input": "高", "output": "矮"},

{"input": "精力充沛", "output": "没精打采"},

{"input": "粗", "output": "细"},

]

# 定义单个示例的格式模板

# 使用 {input} 和 {output} 作为占位符,用于后续填充具体值

example_prompt = PromptTemplate(

input_variables=["input", "output"], # 声明模板中使用的变量名

template="Input: {input}\nOutput: {output}", # 示例的文本格式

)

# 创建一个基于长度的示例选择器(LengthBasedExampleSelector)

# 作用:根据输入提示的总长度动态选择最合适的示例数量,避免超出模型上下文限制

example_selector = LengthBasedExampleSelector(

examples=examples, # 提供所有候选示例

example_prompt=example_prompt, # 用于格式化每个示例的模板

max_length=25, # 设定整个 prompt(含前缀、示例、后缀)的最大 token 长度(此处为字符数近似)

# 注意:LengthBasedExampleSelector 默认使用 len(text) 计算长度(非精确 token 数),适用于简单场景

)

# 构建动态少样本提示模板(FewShotPromptTemplate)

# 它会根据输入内容的长度,自动从 examples 中选择合适数量的示例插入到 prompt 中

dynamic_prompt = FewShotPromptTemplate(

example_selector=example_selector, # 使用上面定义的动态选择器(而非固定示例列表)

example_prompt=example_prompt, # 单个示例的格式

prefix="给出每个输入的反义词", # 提示的开头部分(任务指令)

suffix="Input: {adjective}\nOutput:", # 提示的结尾部分,包含待预测的输入占位符

input_variables=["adjective"], # 声明最终用户输入的变量名(与 suffix 中的 {adjective} 对应)

)

# === 测试 1:输入较短,应选择多个示例 ===

print("【测试1】输入较短,选择多个示例:")

print(dynamic_prompt.format(adjective="big"))

print('------------')

# === 测试 2:输入很长,应只选择少量或一个示例以控制总长度 ===

long_string = "big and huge and massive and large and gigantic and tall and much much much much much bigger than everything else"

print("【测试2】输入很长,仅选择一个示例:")

print(dynamic_prompt.format(adjective=long_string))

print('------------')

# === 测试 3:动态添加新示例 ===

# 向示例选择器中新增一个示例("胖" -> "瘦")

new_example = {"input": "胖", "output": "瘦"}

dynamic_prompt.example_selector.add_example(new_example)

print("【测试3】添加新示例后,查询'热情':")

print(dynamic_prompt.format(adjective="热情"))

print('------------')

# === 配置并调用 DeepSeek 大语言模型 ===

llm = ChatOpenAI(

api_key=os.getenv("DEEPSEEK_API_KEY"),

base_url=os.getenv("DEEP_URL"), # Deepseek 的 API 基础地址

model="deepseek-v3:671b", # Deepseek 对话模型(可选:deepseek-chat-pro 等高级模型)

temperature=0.7, # 温度参数(0-1,越低越稳定)

max_tokens=1024 # 最大生成 tokens

)

# 创建字符串输出解析器,用于将模型返回的 AIMessage 转换为纯文本

output_parser = StrOutputParser()

# 构建处理链(Chain):prompt → LLM → output parser

# 使用 LangChain 的管道操作符 `|` 连接各组件

chain = dynamic_prompt | llm | output_parser

# 调用链,传入输入变量 {"adjective": "热情"}

# 注意:chain.invoke() 内部已包含 llm 调用和 output_parser 解析,无需再手动调用 output_parser

message = chain.invoke({"adjective": "热情"})

# ?? 注意:上一行 `chain.invoke()` 已经返回了字符串(因为最后是 StrOutputParser)

# 所以下面这行是多余的,甚至会导致错误(因为 message 已是 str,不能再次 invoke)

# result = output_parser.invoke(message) # ? 错误:message 是 str,不是 AIMessage

# 正确做法:直接使用 message 作为结果

result = message

print('###############')

print("【模型输出】")

print(result)

输出结果:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

【测试1】输入较短,选择多个示例:

给出每个输入的反义词

Input: 开心

Output: 伤心

Input: 高

Output: 矮

Input: 精力充沛

Output: 没精打采

Input: 粗

Output: 细

Input: big

Output:

------------

【测试2】输入很长,仅选择一个示例:

给出每个输入的反义词

Input: 开心

Output: 伤心

Input: big and huge and massive and large and gigantic and tall and much much much much much bigger than everything else

Output:

------------

【测试3】添加新示例后,查询'热情':

给出每个输入的反义词

Input: 开心

Output: 伤心

Input: 高

Output: 矮

Input: 精力充沛

Output: 没精打采

Input: 粗

Output: 细

Input: 胖

Output: 瘦

Input: 热情

Output:

------------

###############

【模型输出】

冷淡

核心要点总结

这段代码是基于 LangChain 框架对接 DeepSeek 大模型,实现「动态少样本(Few-Shot)反义词生成」的完整案例,核心解决「固定示例易超出模型上下文长度」的问题,通过动态示例选择器适配不同长度输入,同时结合 LangChain 链式调用简化模型调用流程,先明确整体定位,再拆解核心重点:

一、整体流程概览(核心逻辑链)

代码遵循 LangChain 「示例准备 → 动态提示构建 → 模型调用 → 结果解析」的少样本学习经典流程,整体可概括为:

1. 定义反义词任务的固定示例数据集,为模型提供参考案例

2. 配置基于长度的示例选择器,根据输入文本长度动态筛选示例数量

3. 构建动态少样本提示模板,自动适配输入长度生成合规 Prompt

4. 初始化 DeepSeek 模型客户端,配置核心调用参数

5. 构建「提示模板 → 大模型 → 输出解析」的链式调用流程

6. 调用链条完成反义词生成,并输出纯文本结果

二、核心重点拆解(必掌握)

1. 少样本提示(Few-Shot Prompt)核心组件

这是实现「模型参考示例生成结果」的基础,也是 LangChain 提示工程的核心用法:

- 示例数据集(examples):以键值对形式存储「输入-输出」示例,为模型提供任务参考(如"开心"→"伤心");

- 单示例模板(example_prompt):定义单个示例的文本格式(Input/Output 固定样式),统一示例展示形式;

- 动态少样本模板(FewShotPromptTemplate):整合示例选择器、单示例模板、前缀/后缀,生成最终发给模型的完整 Prompt;

- prefix:任务指令("给出每个输入的反义词"),明确模型要执行的任务;

- suffix:待填充的用户输入占位符,承接动态输入内容。

2. 动态示例选择器(LengthBasedExampleSelector)

这是代码的核心亮点,解决「固定示例数量易超上下文长度」的问题:

核心作用:根据输入文本的长度,自动计算并选择合适数量的示例(输入越长,选的示例越少),避免 Prompt 总长度超出模型上下文限制;

关键参数:

- examples:候选示例列表;

- example_prompt:示例格式化模板(用于计算单示例长度);

- max_length:Prompt 允许的最大长度(此处为字符数近似值)。

3. LangChain 链式调用(| 操作符)

简化多组件协作流程,是 LangChain 核心设计理念:

- 链条构成:dynamic_prompt(生成 Prompt) | llm(调用模型) | output_parser(解析结果);

- 核心优势:无需手动分步调用(先格式化 Prompt、再调用模型、最后解析结果),一行代码完成全流程;

- 调用方式:chain.invoke({"adjective": "热情"}) 传入输入变量,直接返回解析后的纯文本结果。

4. 输出解析器(StrOutputParser)

解决「模型返回 AIMessage 对象→提取纯文本」的问题:

核心作用:将 LangChain 模型返回的 AIMessage 类型(含 content/metadata 等字段)转换为纯字符串,简化结果使用;

关键注意点:链式调用中已包含解析步骤,无需手动再次调用 output_parser.invoke()(否则会报错)。右哨孔壹

http://www.jsqmd.com/news/610422/

相关文章:

  • Fast-GitHub终极指南:3分钟彻底解决国内访问GitHub缓慢问题
  • 转向补偿模块
  • 2026年防腐衬塑管厂家怎么选?标杆名录及采购全指南 - 优质品牌商家
  • Windows下OpenClaw安装避坑:Qwen3-32B镜像对接与权限配置详解
  • 让 pgAdmin 和 PostgreSQL 运行在同一个 Docker 网络中。
  • EPLAN P8 2023电缆导出实战:3分钟搞定BOM表与模块IO配置(附脚本文件)
  • DLSSTweaks完全掌握指南:从基础配置到场景化应用
  • Electron实战:解决微信登录页二维码不显示的5个关键配置(附完整代码)
  • 定义即定价,定价即风险 | 词元(Token)定名背后的冷思考
  • 你还在手写CRUD?.NET 9低代码平台已支持SQL Server → Entity Framework Core → Blazor WASM全自动逆向生成(含动态权限注入引擎)
  • 从饱和长度到设计规则:用ADS Batch仿真快速定位串扰风险区域
  • Spring AI Alibaba 分布式智能体实战:基于 A2A 协议的架构演进与落地
  • 国产信创库fio破坏主备库以及备份故障处理--惜分飞阉
  • MedOpenClaw:给GPT-5.4更多工具反而变差,TUM+牛津+帝国理工揭开工具使用悖论
  • 专业数据恢复师工具箱揭秘:UFS Explorer Pro的5个高级功能实战解析
  • iOS UI美化技巧:如何用CAGradientLayer给视图和边框添加炫酷渐变色(避坑指南)
  • [具身智能-299]:对于工业上连续变化的时序电压信号,如果使用AI来进行特征的识别和分类,使用哪些库?有哪些可能的模型和解决方案?
  • AI 驱动的 UML 图表支持全景指南
  • 3步掌控百度网盘CLI:从无界面管理到自动化工作流
  • 深入解析javac编译错误:程序包XXX不存在的排查与修复指南
  • 为什么你的Polars 2.0 pipeline在生产环境突然变慢300%?:揭秘Arrow 15.0兼容性断裂点与降级熔断策略
  • 本地AI竞技场:Gemma-3-12b-it与Qwen在OpenClaw任务中的对比
  • Trae 国际版下载地址
  • Python原生AOT编译插件2026版上线(仅限CPython 3.14+认证环境,过期即失效)
  • 【自然语言处理 NLP】7.1.2 表示工程与推理监控
  • 基于反激变换器的矿用本质安全型电源设计:两级保护、过压过流功能及MATLAB仿真文件
  • 保姆级教程:用Diffusers在低显存GPU上跑通Z-Image-Turbo(附完整代码)
  • Twitter运营完整流程:从0到引流获客全流程拆解(2026)
  • Git常用命令速查手册,微硕WST8205A双N沟MOSFET,汽车阅读灯静音负载开关。
  • 2026好用的企业知识库汇总:11款工具实测与建议