当前位置: 首页 > news >正文

Prompt Engineering在AI Agent中的高级技巧:从Chain-of-Thought到Tree-of-Thought

Prompt Engineering在AI Agent中的高级技巧:从Chain-of-Thought到Tree-of-Thought

引言:提示词工程是Agent的"操作系统"

在大语言模型驱动的AI Agent体系中,提示词工程(Prompt Engineeringï¼‰ä¸ä» æ˜¯"è¾“å ¥ä¼˜åŒ–"的技术,更是定义Agent行为模式、推理能力和决策质量的底层机制。如果说大模型是Agent的"大脑",那么提示词就是"操作系统"â€”â€”å®ƒå†³å®šäº†å¤§è„‘å¦‚ä½•æ„ŸçŸ¥çŽ¯å¢ƒã€å¦‚ä½•è°ƒç”¨å·¥å ·ã€å¦‚ä½•è¿›è¡ŒæŽ¨ç†ã€å¦‚ä½•è¾“å‡ºç»“æžœã€‚ä»Žæ—©æœŸçš„Zero-Shot/Few-Shot提示,到Chain-of-Thought(CoT),再到Tree-of-Thought(ToT)和Graph-of-Thought(GoTï¼‰ï¼Œæç¤ºè¯å·¥ç¨‹æŠ€æœ¯åœ¨çŸ­çŸ­ä¸¤å¹´å† ç»åŽ†äº†å¿«é€Ÿè¿­ä»£ã€‚æœ¬æ–‡å°†ä»ŽåŽŸç†åˆ°å®žè·µï¼Œæ·±å ¥å‰–æžè¿™äº›é«˜çº§æŠ€å·§åœ¨AI Agentä¸­çš„å ·ä½“åº”ç”¨ã€‚

一、Chain-of-Thought:让模型"出声思考"

1.1 CoT的原理与价值

Chain-of-Thoughtï¼ˆæ€ç»´é“¾ï¼‰æç¤ºæŠ€æœ¯çš„æ ¸å¿ƒæ´žè§æ˜¯ï¼šå¤§è¯­è¨€æ¨¡åž‹åœ¨ç”Ÿæˆæœ€ç»ˆç­”æ¡ˆå‰ï¼Œå¦‚æžœå ˆè¾“å‡ºä¸­é—´æŽ¨ç†æ­¥éª¤ï¼Œå ¶æŽ¨ç†å‡†ç¡®çŽ‡ä¼šæ˜¾è‘—æå‡ã€‚è¿™ä¸€çŽ°è±¡åœ¨Google Research 2022年的论文《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》中得到系统验证。

从认知科学角度看,CoT模拟了人类的"出声思考"(Think Aloudï¼‰ç­–ç•¥ã€‚å½“é¢å¯¹å¤æ‚é—®é¢˜æ—¶ï¼Œäººç±»é€šè¿‡å°†æ€è€ƒè¿‡ç¨‹å¤–åŒ–æ¥å‡å°‘è®¤çŸ¥è´Ÿè·ã€å‘çŽ°é€»è¾‘æ¼æ´žã€‚å¤§æ¨¡åž‹åŒæ ·å—ç›ŠäºŽè¿™ç§"思考过程外化"——将隐式的推理转化为显式的文本序列,使每个推理步骤都受到后续Token生成过程的约束和修正。

1.2 CoT在Agent中的基础实现

在AI Agent场景中,CoTä¸ä» æ˜¯æé«˜å›žç­”è´¨é‡çš„æŠ€å·§ï¼Œæ›´æ˜¯å®žçŽ°å·¥å ·è°ƒç”¨ã€å¤šæ­¥éª¤å†³ç­–çš„åŸºç¡€ã€‚ä»¥ä¸‹æ˜¯ä¸€ä¸ªReActé£Žæ ¼çš„CoT实现:

# 基础CoT提示模板 COT_PROMPT = """ä½ æ˜¯ä¸€ä¸ªæ™ºèƒ½åŠ©æ‰‹ï¼Œè¯·æŒ‰ç §ä»¥ä¸‹æ­¥éª¤è§£å†³é—®é¢˜ï¼š 问题:{question} 请逐步思考并回答: Step 1ï¼šç†è§£é—®é¢˜çš„æ ¸å¿ƒè¦æ±‚ Step 2:分析已知条件和可能的解决方法 Step 3ï¼šæ‰§è¡Œå ·ä½“çš„æŽ¨ç†æˆ–è®¡ç®— Step 4:验证结果的正确性 Step 5:给出最终答案 思考过程:""" # 在LangChain中使用 from langchain.prompts import PromptTemplate from langchain_openai import ChatOpenAI cot_prompt = PromptTemplate.from_template(COT_PROMPT) llm = ChatOpenAI(model="gpt-4") chain = cot_prompt | llm result = chain.invoke({"question": "一个矩形花园,长是宽的两倍,周长是60米,面积是多少?"})

1.3 Few-Shot CoT:用示例引导推理模式

对于复杂任务,纯文本的CoT指令可能不够,需要通过示例(Few-Shot)来引导模型掌握特定的推理模式:

FEW_SHOT_COT_PROMPT = """ä»¥ä¸‹æ˜¯ä¸€äº›æŽ¨ç†ç¤ºä¾‹ï¼Œè¯·æŒ‰ç §ç›¸åŒçš„æ¨¡å¼å›žç­”é—®é¢˜ï¼š 示例1: 问题:小明有3个苹果,给了小红1个,又买了2ä¸ªï¼ŒçŽ°åœ¨æœ‰å‡ ä¸ªï¼Ÿ 思考:小明开始有3个苹果。给了小红1个后,剩下3-1=2个。又买了2个,现在有2+2=4个。 答案:4 示例2: 问题:一个水箱,进水阀每分钟进5升,出水阀每分钟出3升,水箱原有10å‡æ°´ï¼Œå¤šä¹ èƒ½è£ æ»¡50升? æ€è€ƒï¼šæ¯åˆ†é’Ÿå‡€å¢žåŠ 5-3=2升。需要从10å‡å¢žåŠ åˆ°50å‡ï¼Œéœ€è¦å¢žåŠ 40升。40÷2=20分钟。 答案:20分钟 现在请回答: 问题:{question} 思考:""" # 在Agent中的应用 from langchain.agents import create_react_agent from langchain.tools import tool @tool def calculate(expression: str) -> str: """执行数学计算""" try: return str(eval(expression)) except: return "计算错误" tools = [calculate] # ReAct Agent天然使用CoTé£Žæ ¼ agent = create_react_agent(llm, tools, FEW_SHOT_COT_PROMPT)

1.4 Auto-CoT:自动化的示例生成

手动编写Few-Shot示例耗时且难以覆盖所有场景。Auto-CoT技术通过聚类算法自动从问题库中选取代表性问题,并使用Zero-Shot-CoT生成对应的推理链,构建自动化的示例集:

from sklearn.cluster import KMeans import numpy as np def auto_cot(question_pool, llm, k=5): """ 自动为问题库生成CoT示例 """ # Step 1: å¯¹é—®é¢˜ç¼–ç ï¼ˆå¯ä½¿ç”¨åµŒå ¥æ¨¡åž‹ï¼‰ embeddings = get_embeddings(question_pool) # 获取问题向量表示 # Step 2: K-Means聚类,选择代表性问题 kmeans = KMeans(n_clusters=k, random_state=42) clusters = kmeans.fit_predict(embeddings) # Step 3: 从每个聚类中选择最接近中心的问题 representatives = []
http://www.jsqmd.com/news/1116979/

相关文章:

  • GPT工程能力全景图谱:场景映射、标准化工作流与落地实战指南
  • RoPE 与 ALiBi:位置编码的两种革命性范式
  • 3步实战:如何让《艾尔登法环》在高端硬件上释放全部潜能
  • 佳能G6080报错5b00维修历程,开始把打印机抱到维修店,维修师傅说修好大概180元,我觉得实在太贵了就没有必要维修了,买一台新的算了,准备买新的时候朋友推荐用佳能V6.200佳能清零软件,最终修好
  • 第17章:Dify 分层架构与 DDD 设计深度解析
  • Mac视频预览终极解决方案:让Finder直接播放MKV、AVI等所有格式视频
  • 华硕笔记本性能调优终极指南:如何用GHelper取代臃肿的Armoury Crate
  • 解决Turbo Intruder插件兼容性问题:升级Burp Suite实战指南
  • 中国顶尖AI大模型的四大硬核判断标准
  • gsplat安装与使用指南:高效实现3D高斯溅射渲染
  • OpenClaw移动端安装部署实战:local-first架构实测与Cursor云端方案全对比
  • 零基础 Vibe Coding 教程 MCP 服务介绍 50
  • 高并发实战:C#工控机实现100+设备Modbus TCP并发采集,性能优化到毫秒级响应
  • 户外LED广告牌防雷设计:接地方案与SPD安装
  • 第16章:【基础篇综合实战】搭建企业级智能客服系统
  • 壁炉科普|冬季壁炉偶尔倒烟、冒烟?原因和一次性解决方法
  • SpringBoot全局XSS防御实战:5分钟集成过滤器实现请求参数净化
  • 第 12 篇|项目整合与打包发布 —— 从 Demo 到可安装 APK 的完整收官指南
  • 一个周末完成数月工作量!借助 AI 反击网站垃圾注册攻击,成本低效果好
  • AI抗衰药物研发公司「无尽方舟」获数千万元种子轮融资,跨物种AI平台优势凸显
  • RTSPtoWeb终极指南:3分钟实现摄像头视频网页直播的完整方案
  • 迭代法求从根到叶的二进制数之和
  • XSS攻击深度解析:从原理到企业级防御实战
  • STM32与Si4732打造高保真数字收音机设计指南
  • 一线观察:GEO厂商的真实适配边界
  • Python+Pytest-BDD构建UI与API融合自动化测试框架实战
  • Dify 1.15人工介入功能详解:构建可控AI工作流实战
  • RTSPtoWeb架构解析:纯Go实现RTSP到Web流媒体的高性能转换方案
  • 当AI进入金融交易核心工作流,安全与高效协作如何并重?
  • AI Agent的自我进化:元认知与反思机制的实现