1. 什么是提示词?
提示词也叫指令/提问词,是用户发给大模型(LLM)的文本内容,包含问题、要求、上下文、格式约束等。
简单理解:你写给AI的“指令话术” ,用来告诉AI要做什么、怎么做、输出什么样的内容。
常见形式
- 普通问答:`帮我解释一下什么是RAG`
- 任务指令:`把下面这段文字总结成3句话`
- 带上下文:`结合以下资料回答问题:[参考文本],问题:xxx`
2. 什么是提示词工程?
提示词工程是一套设计、优化、调试提示词的方法论与技巧,目标是: 让大模型精准理解需求、按指定规则输出、提升回答质量、减少幻觉。 它不是编程,而是语言层面的调优手段,是使用大模型最基础、最高效的优化方式。
3. 提示词工程的五大原则
-
清晰的指令。编写清晰指令小技巧:
(1)详细的描述 【】
(2)让模型充当某个角色 【】
(3)使用分隔符标明输入的不同部分 【***】
(4)提示示例 【****】
(5)制定输出长度 【】 -
文本参考:基于文本文档,辅助大模型问答,降低模型“幻觉”问题。
-
复杂任务拆分简单子任务。 字面意思,可参考如下案例:
示例: 请按照以下步骤,请为我们的新产品‘智能办公杯’(一款能显示水温、自动保温的杯子)制定一个市场推广方案:
第一步:市场与竞品分析“请分析智能水杯市场的目标用户主要有哪些群体?并简要列出目前市场上2-3款主要竞品及其核心优劣势。 ”
第二步:用户画像与价值主张“基于以上分析,请为我们的‘智能办公杯’描绘一个核心用户画像(包括demographics 和使用场景)。并提炼出针对该用户群的3个核心价值主张(例如:精准控温提升饮水体验、久坐提醒培养健康习惯等)。 ”
第三步:制定推广策略“现在,请为‘智能办公杯’设计一个为期一个季度的推广策略。要求包含: 渠道选择:针对第二步的用户画像,列出最合适的3个线上和线下推广渠道并说明理由。 核心信息:确定推广中要传递的核心信息。
第四步:预算与风险评估“最后,请为上述推广策略草拟一个简单的预算分配框架(如市场费用、渠道费用等大致占比),并识别2个潜在的主要风险及应对思路。 ”
-
给模型"思考"的时间 (思维链:COT)
思维链提问:
在例子中展示一步步的推理过程,模型会模仿这种"慢思考",把解题的中间步骤写出来(先算剩下几个,再算买来后总共几个)。从而得出正确答案。
1、给模型思考时间。让模型think step by step(一步步思考)
2、让大模型在输出答案时,不是直接给出结果,而是显式写出推理过程.
-
借助外部工具
大模型并不是万能的,比如一些实时问题等等大模型不能很好的回答,所以需要一些外部工具来帮助处理。如果把大模型当成一个大脑,使用外部工具的调用,就好比给大脑装上了一具身体,拓宽大模型能力边界,让它不仅仅只是“思考” ,还可以帮助我们“做事” 。
1、联网搜索工具
解决:模型不知道实时信息的问题。
例子:调用搜索引擎 API,获取最新新闻、论文、股市信息。
2、代码执行工具
解决:需要精确计算或数据处理时,模型自身“算得不准” 的问题。
例子:调用 Python 解释器运行数学计算、绘图、数据分析。
3、数据库 / 知识库工具
解决:模型记忆有限,无法覆盖企业内部数据或特定领域知识。
例子:知识图谱、向量数据库(如 Milvus、 FAISS)来存储和检索信息。
4.、外部 API 调用
解决:专业需求,比如天气查询、航班查询、地图导航、医疗工具调用。
例子:根据北京未来15天的气温,调用数据分析插件分析气温变化情况。
4. 提示词工程应用手段
(1)Zero-Shot(零样本)
定义:仅依靠自然语言指令描述任务,不提供任何示例样本,让模型直接完成目标任务。
特点:
(1)高效:无需准备示例,适合快速测试。
(2)灵活:利用模型广博知识。
(3)适合简单规则类、通用型任务。
- 示例
将以下文本改为疑问句:今天气温很高。
(2)Few-Shot(少样本)
定义:在指令中附带少量参考样例(1~N 组输入 + 输出),让模型模仿样例格式与逻辑完成任务,One-Shot 是其特例(仅 1 个样例)。
特点:
(1)精准:示例减少歧义,提升一致性。
(2)对格式、特殊规则、小众任务适配性更强,效果优于零样本;无需大规模数据集,成本低。
- 示例
示例1:
输入:苹果 → 分类:水果
输入:白菜 → 分类:蔬菜
请对以下内容分类:香蕉
(3)思维链 (CoT,Chain-of-Thought)
定义:引导模型分步拆解推理过程,通过展示中间推理步骤来解决复杂问题。常用来解决数学计算、逻辑推理、复杂问答等难题。
特点:大幅提升复杂推理准确率,核心话术:请一步步思考并给出答案。
分类:
(1)Zero-shot-CoT (零样本思维链):
(2)Few-shot-CoT (少样本思维链)
- Zero-shot-CoT (零样本思维链)
定义:仅依靠自然语言指令描述任务,不提供任何示例样本,让模型直接完成目标任务。
特点:使用最简单、上手快,无需准备标注样例;适合简单规则类、通用型任务。
- Few-shot-CoT (少样本思维链)
定义:在指令中附带少量参考样例(1~N 组输入 + 输出),让模型模仿样例格式与逻辑完成任务,One-Shot 是其特例(仅 1 个样例)。
特点:对格式、特殊规则、小众任务适配性更强,效果远优于零样本;无需大规模数据集,成本低。
(4)链式提示
定义:把复杂大任务拆分为多个连续子任务,通过多轮提示词层层递进、依次执行,前一轮输出作为后一轮输入,形成任务链路。
特点:拆解复杂流程,降低模型单次处理压力;适合长流程、多步骤组合型任务(如文案撰写 + 润色 + 格式整理)。
使用逻辑:任务 A 输出 → 传入任务 B → 传入任务 C → 最终结果。
(5)自我一致性
定义:基于思维链衍生的优化策略,让模型多次生成不同推理路径,从多个输出结果中投票、筛选出出现频次最高的答案。
特点:解决模型单次推理出错、答案不稳定问题;数学题、逻辑题效果提升明显。
核心逻辑:多路径推理 → 结果聚合投票 → 输出最优解。
(6)ReAct
定义:融合 ** 推理(Reasoning)与行动(Act)** 的提示范式,让模型一边思考分析,一边主动调用外部工具 / 接口 / 知识库,交替完成 “思考 - 行动 - 观察 - 再思考” 循环。
特点:打通大模型与外部能力,是智能体、工具调用、联网检索、知识库查询的核心提示方案;广泛用于 RAG、Agent 场景。
运行逻辑:思考任务→决定调用工具→执行动作获取信息→结合信息继续推理→得出答案。
5. 对比表
| 方式 | 核心作用 | 适用场景 | 关键说明 |
|---|---|---|---|
| Zero-Shot | 纯指令执行 | 简单通用任务、快速试用 | 无任何示例,仅靠指令完成任务 |
| Few-Shot | 模仿样例格式 / 规则 | 定制格式、小众任务、中等难度任务 | 附带少量输入输出样例,供模型模仿 |
| Zero-shot-CoT | 引导分步推理 | 常规逻辑题、数学计算题 | 无推理样例,仅添加「一步步思考」引导语 |
| Few-shot-CoT | 参照样例分步推理 | 高难度推理、复杂计算题 | 提供多组带推理过程的示例,模仿思考逻辑 |
| 链式提示 | 拆分长流程任务 | 多步骤组合型复杂业务 | 任务拆解为多环节,前后轮输入输出串联 |
| 自我一致性 | 提升答案稳定性 | 推理类易出错场景 | 多轮生成推理结果,投票选出最优答案 |
| ReAct | 推理 + 调用外部工具 | Agent、工具调用、检索问答、RAG | 思考与工具动作交替执行,联动外部资源 |
