当前位置：首页 > news >正文

【大模型】提示词工程

news 2026/7/28 10:27:12

1. 什么是提示词？

提示词也叫指令/提问词，是用户发给大模型（LLM）的文本内容，包含问题、要求、上下文、格式约束等。

简单理解：你写给AI的“指令话术” ，用来告诉AI要做什么、怎么做、输出什么样的内容。

常见形式

普通问答：`帮我解释一下什么是RAG`
任务指令：`把下面这段文字总结成3句话`
带上下文：`结合以下资料回答问题：[参考文本]，问题：xxx`

2. 什么是提示词工程？

提示词工程是一套设计、优化、调试提示词的方法论与技巧，目标是：让大模型精准理解需求、按指定规则输出、提升回答质量、减少幻觉。它不是编程，而是语言层面的调优手段，是使用大模型最基础、最高效的优化方式。

3. 提示词工程的五大原则

清晰的指令。编写清晰指令小技巧：

（1）详细的描述【】
（2）让模型充当某个角色【】
（3）使用分隔符标明输入的不同部分【***】
（4）提示示例【****】
（5）制定输出长度【】
文本参考：基于文本文档，辅助大模型问答，降低模型“幻觉”问题。
复杂任务拆分简单子任务。字面意思，可参考如下案例：

示例: 请按照以下步骤，请为我们的新产品‘智能办公杯’（一款能显示水温、自动保温的杯子）制定一个市场推广方案：

第一步：市场与竞品分析“请分析智能水杯市场的目标用户主要有哪些群体？并简要列出目前市场上2-3款主要竞品及其核心优劣势。 ”

第二步：用户画像与价值主张“基于以上分析，请为我们的‘智能办公杯’描绘一个核心用户画像（包括demographics 和使用场景）。并提炼出针对该用户群的3个核心价值主张（例如：精准控温提升饮水体验、久坐提醒培养健康习惯等）。 ”

第三步：制定推广策略“现在，请为‘智能办公杯’设计一个为期一个季度的推广策略。要求包含：渠道选择：针对第二步的用户画像，列出最合适的3个线上和线下推广渠道并说明理由。核心信息：确定推广中要传递的核心信息。

第四步：预算与风险评估“最后，请为上述推广策略草拟一个简单的预算分配框架（如市场费用、渠道费用等大致占比），并识别2个潜在的主要风险及应对思路。 ”
给模型"思考"的时间（思维链：COT）

思维链提问：

在例子中展示一步步的推理过程，模型会模仿这种"慢思考"，把解题的中间步骤写出来(先算剩下几个，再算买来后总共几个)。从而得出正确答案。

1、给模型思考时间。让模型think step by step(一步步思考)

2、让大模型在输出答案时，不是直接给出结果，而是显式写出推理过程.
借助外部工具

大模型并不是万能的，比如一些实时问题等等大模型不能很好的回答，所以需要一些外部工具来帮助处理。如果把大模型当成一个大脑，使用外部工具的调用，就好比给大脑装上了一具身体，拓宽大模型能力边界，让它不仅仅只是“思考” ，还可以帮助我们“做事” 。

1、联网搜索工具

解决：模型不知道实时信息的问题。

例子：调用搜索引擎 API，获取最新新闻、论文、股市信息。

2、代码执行工具

解决：需要精确计算或数据处理时，模型自身“算得不准” 的问题。

例子：调用 Python 解释器运行数学计算、绘图、数据分析。

3、数据库 / 知识库工具

解决：模型记忆有限，无法覆盖企业内部数据或特定领域知识。

例子：知识图谱、向量数据库（如 Milvus、 FAISS）来存储和检索信息。

4.、外部 API 调用

解决：专业需求，比如天气查询、航班查询、地图导航、医疗工具调用。

例子：根据北京未来15天的气温，调用数据分析插件分析气温变化情况。

4. 提示词工程应用手段

（1）Zero-Shot（零样本）

定义：仅依靠自然语言指令描述任务，不提供任何示例样本，让模型直接完成目标任务。
特点：
（1）高效：无需准备示例，适合快速测试。 
（2）灵活：利用模型广博知识。
（3）适合简单规则类、通用型任务。

示例

将以下文本改为疑问句：今天气温很高。

（2）Few-Shot（少样本）

定义：在指令中附带少量参考样例（1~N 组输入 + 输出），让模型模仿样例格式与逻辑完成任务，One-Shot 是其特例（仅 1 个样例）。
特点：
（1）精准：示例减少歧义，提升一致性。 
（2）对格式、特殊规则、小众任务适配性更强，效果优于零样本；无需大规模数据集，成本低。

示例

示例1：
输入：苹果 → 分类：水果
输入：白菜 → 分类：蔬菜
请对以下内容分类：香蕉

（3）思维链 (CoT，Chain-of-Thought)

定义：引导模型分步拆解推理过程，通过展示中间推理步骤来解决复杂问题。常用来解决数学计算、逻辑推理、复杂问答等难题。
特点：大幅提升复杂推理准确率，核心话术：请一步步思考并给出答案。
分类：
（1）Zero-shot-CoT (零样本思维链)： 
（2）Few-shot-CoT (少样本思维链)

Zero-shot-CoT (零样本思维链)

定义：仅依靠自然语言指令描述任务，不提供任何示例样本，让模型直接完成目标任务。
特点：使用最简单、上手快，无需准备标注样例；适合简单规则类、通用型任务。

Few-shot-CoT (少样本思维链)

定义：在指令中附带少量参考样例（1~N 组输入 + 输出），让模型模仿样例格式与逻辑完成任务，One-Shot 是其特例（仅 1 个样例）。
特点：对格式、特殊规则、小众任务适配性更强，效果远优于零样本；无需大规模数据集，成本低。

（4）链式提示

定义：把复杂大任务拆分为多个连续子任务，通过多轮提示词层层递进、依次执行，前一轮输出作为后一轮输入，形成任务链路。
特点：拆解复杂流程，降低模型单次处理压力；适合长流程、多步骤组合型任务（如文案撰写 + 润色 + 格式整理）。
使用逻辑：任务 A 输出 → 传入任务 B → 传入任务 C → 最终结果。

（5）自我一致性

定义：基于思维链衍生的优化策略，让模型多次生成不同推理路径，从多个输出结果中投票、筛选出出现频次最高的答案。
特点：解决模型单次推理出错、答案不稳定问题；数学题、逻辑题效果提升明显。
核心逻辑：多路径推理 → 结果聚合投票 → 输出最优解。

（6）ReAct

定义：融合 ** 推理（Reasoning）与行动（Act）** 的提示范式，让模型一边思考分析，一边主动调用外部工具 / 接口 / 知识库，交替完成 “思考 - 行动 - 观察 - 再思考” 循环。
特点：打通大模型与外部能力，是智能体、工具调用、联网检索、知识库查询的核心提示方案；广泛用于 RAG、Agent 场景。
运行逻辑：思考任务→决定调用工具→执行动作获取信息→结合信息继续推理→得出答案。

5. 对比表

方式	核心作用	适用场景	关键说明
Zero-Shot	纯指令执行	简单通用任务、快速试用	无任何示例，仅靠指令完成任务
Few-Shot	模仿样例格式 / 规则	定制格式、小众任务、中等难度任务	附带少量输入输出样例，供模型模仿
Zero-shot-CoT	引导分步推理	常规逻辑题、数学计算题	无推理样例，仅添加「一步步思考」引导语
Few-shot-CoT	参照样例分步推理	高难度推理、复杂计算题	提供多组带推理过程的示例，模仿思考逻辑
链式提示	拆分长流程任务	多步骤组合型复杂业务	任务拆解为多环节，前后轮输入输出串联
自我一致性	提升答案稳定性	推理类易出错场景	多轮生成推理结果，投票选出最优答案
ReAct	推理 + 调用外部工具	Agent、工具调用、检索问答、RAG	思考与工具动作交替执行，联动外部资源