当前位置: 首页 > news >正文

【大模型】提示词工程

1. 什么是提示词?

提示词也叫指令/提问词,是用户发给大模型(LLM)的文本内容,包含问题、要求、上下文、格式约束等。

简单理解:你写给AI的“指令话术” ,用来告诉AI要做什么、怎么做、输出什么样的内容。

常见形式

  1. 普通问答:`帮我解释一下什么是RAG`
  2. 任务指令:`把下面这段文字总结成3句话`
  3. 带上下文:`结合以下资料回答问题:[参考文本],问题:xxx`

2. 什么是提示词工程?

提示词工程是一套设计、优化、调试提示词的方法论与技巧,目标是: 让大模型精准理解需求、按指定规则输出、提升回答质量、减少幻觉。 它不是编程,而是语言层面的调优手段,是使用大模型最基础、最高效的优化方式。

3. 提示词工程的五大原则

  1. 清晰的指令。编写清晰指令小技巧:

    (1)详细的描述 【
    (2)让模型充当某个角色 【

    (3)使用分隔符标明输入的不同部分 【***
    (4)提示示例 【****】
    (5)制定输出长度 【

  2. 文本参考:基于文本文档,辅助大模型问答,降低模型“幻觉”问题。

  3. 复杂任务拆分简单子任务。 字面意思,可参考如下案例:

    示例: 请按照以下步骤,请为我们的新产品‘智能办公杯’(一款能显示水温、自动保温的杯子)制定一个市场推广方案:

    第一步:市场与竞品分析“请分析智能水杯市场的目标用户主要有哪些群体?并简要列出目前市场上2-3款主要竞品及其核心优劣势。 ”

    第二步:用户画像与价值主张“基于以上分析,请为我们的‘智能办公杯’描绘一个核心用户画像(包括demographics 和使用场景)。并提炼出针对该用户群的3个核心价值主张(例如:精准控温提升饮水体验、久坐提醒培养健康习惯等)。 ”

    第三步:制定推广策略“现在,请为‘智能办公杯’设计一个为期一个季度的推广策略。要求包含: 渠道选择:针对第二步的用户画像,列出最合适的3个线上和线下推广渠道并说明理由。 核心信息:确定推广中要传递的核心信息。

    第四步:预算与风险评估“最后,请为上述推广策略草拟一个简单的预算分配框架(如市场费用、渠道费用等大致占比),并识别2个潜在的主要风险及应对思路。 ”

  4. 给模型"思考"的时间 (思维链:COT)

    思维链提问:

    在例子中展示一步步的推理过程,模型会模仿这种"慢思考",把解题的中间步骤写出来(先算剩下几个,再算买来后总共几个)。从而得出正确答案。

    1、给模型思考时间。让模型think step by step(一步步思考)

    2、让大模型在输出答案时,不是直接给出结果,而是显式写出推理过程.

  5. 借助外部工具

    大模型并不是万能的,比如一些实时问题等等大模型不能很好的回答,所以需要一些外部工具来帮助处理。如果把大模型当成一个大脑,使用外部工具的调用,就好比给大脑装上了一具身体,拓宽大模型能力边界,让它不仅仅只是“思考” ,还可以帮助我们“做事” 。

    1、联网搜索工具

    解决:模型不知道实时信息的问题。

    例子:调用搜索引擎 API,获取最新新闻、论文、股市信息。

    2、代码执行工具

    解决:需要精确计算或数据处理时,模型自身“算得不准” 的问题。

    例子:调用 Python 解释器运行数学计算、绘图、数据分析。

    3、数据库 / 知识库工具

    解决:模型记忆有限,无法覆盖企业内部数据或特定领域知识。

    例子:知识图谱、向量数据库(如 Milvus、 FAISS)来存储和检索信息。

    4.、外部 API 调用

    解决:专业需求,比如天气查询、航班查询、地图导航、医疗工具调用。

    例子:根据北京未来15天的气温,调用数据分析插件分析气温变化情况。

4. 提示词工程应用手段

(1)Zero-Shot(零样本)

定义:仅依靠自然语言指令描述任务,不提供任何示例样本,让模型直接完成目标任务。
特点:
(1)高效:无需准备示例,适合快速测试。 
(2)灵活:利用模型广博知识。
(3)适合简单规则类、通用型任务。
  • 示例
将以下文本改为疑问句:今天气温很高。

(2)Few-Shot(少样本)

定义:在指令中附带少量参考样例(1~N 组输入 + 输出),让模型模仿样例格式与逻辑完成任务,One-Shot 是其特例(仅 1 个样例)。
特点:
(1)精准:示例减少歧义,提升一致性。 
(2)对格式、特殊规则、小众任务适配性更强,效果优于零样本;无需大规模数据集,成本低。
  • 示例
示例1:
输入:苹果 → 分类:水果
输入:白菜 → 分类:蔬菜
请对以下内容分类:香蕉

(3)思维链 (CoT,Chain-of-Thought)

定义:引导模型分步拆解推理过程,通过展示中间推理步骤来解决复杂问题。常用来解决数学计算、逻辑推理、复杂问答等难题。
特点:大幅提升复杂推理准确率,核心话术:请一步步思考并给出答案。
分类:
(1)Zero-shot-CoT (零样本思维链): 
(2)Few-shot-CoT (少样本思维链) 
  • Zero-shot-CoT (零样本思维链)
定义:仅依靠自然语言指令描述任务,不提供任何示例样本,让模型直接完成目标任务。
特点:使用最简单、上手快,无需准备标注样例;适合简单规则类、通用型任务。
  • Few-shot-CoT (少样本思维链)
定义:在指令中附带少量参考样例(1~N 组输入 + 输出),让模型模仿样例格式与逻辑完成任务,One-Shot 是其特例(仅 1 个样例)。
特点:对格式、特殊规则、小众任务适配性更强,效果远优于零样本;无需大规模数据集,成本低。

(4)链式提示

定义:把复杂大任务拆分为多个连续子任务,通过多轮提示词层层递进、依次执行,前一轮输出作为后一轮输入,形成任务链路。
特点:拆解复杂流程,降低模型单次处理压力;适合长流程、多步骤组合型任务(如文案撰写 + 润色 + 格式整理)。
使用逻辑:任务 A 输出 → 传入任务 B → 传入任务 C → 最终结果。

(5)自我一致性

定义:基于思维链衍生的优化策略,让模型多次生成不同推理路径,从多个输出结果中投票、筛选出出现频次最高的答案。
特点:解决模型单次推理出错、答案不稳定问题;数学题、逻辑题效果提升明显。
核心逻辑:多路径推理 → 结果聚合投票 → 输出最优解。

(6)ReAct

定义:融合 ** 推理(Reasoning)与行动(Act)** 的提示范式,让模型一边思考分析,一边主动调用外部工具 / 接口 / 知识库,交替完成 “思考 - 行动 - 观察 - 再思考” 循环。
特点:打通大模型与外部能力,是智能体、工具调用、联网检索、知识库查询的核心提示方案;广泛用于 RAG、Agent 场景。
运行逻辑:思考任务→决定调用工具→执行动作获取信息→结合信息继续推理→得出答案。

5. 对比表

方式 核心作用 适用场景 关键说明
Zero-Shot 纯指令执行 简单通用任务、快速试用 无任何示例,仅靠指令完成任务
Few-Shot 模仿样例格式 / 规则 定制格式、小众任务、中等难度任务 附带少量输入输出样例,供模型模仿
Zero-shot-CoT 引导分步推理 常规逻辑题、数学计算题 无推理样例,仅添加「一步步思考」引导语
Few-shot-CoT 参照样例分步推理 高难度推理、复杂计算题 提供多组带推理过程的示例,模仿思考逻辑
链式提示 拆分长流程任务 多步骤组合型复杂业务 任务拆解为多环节,前后轮输入输出串联
自我一致性 提升答案稳定性 推理类易出错场景 多轮生成推理结果,投票选出最优答案
ReAct 推理 + 调用外部工具 Agent、工具调用、检索问答、RAG 思考与工具动作交替执行,联动外部资源
http://www.jsqmd.com/news/905592/

相关文章:

  • AI记忆系统:从明星背书到代码真相,如何构建可靠检索增强生成(RAG)应用
  • 实用指南:如何用DroneSecurity快速检测和解析无人机通信信号
  • STM32H743驱动W25Q128JV踩坑实录:从正点原子例程到芯片手册的完整调试指南
  • 2026年变压器与高低压柜厂家推荐排行榜:配电柜/箱变/并网柜/光伏低压变/施耐德品牌实力深度解析 - 品牌企业推荐师(官方)
  • 从“裸板”到“成品”:Altium Designer Variant实战,教你为不同项目定制专属装配图与BOM
  • 如何用Hourglass倒计时器精准掌控你的Windows时间管理
  • MSP430比较器B避坑指南:DriverLib配置电阻测量与触摸按键的5个常见问题
  • vcpkg的安装
  • 2026年杭州企业如何甄选杭州头部实力GEO系统源码服务商? - 品牌报告
  • 可重构机器人无限形态合成:FNN与ANFIS驱动地面清洁全覆盖
  • 判断力:AI必须补上的核心能力
  • BEAPER Nano:模块化教育机器人平台,让初学者专注编程学习
  • 从ISE的SmartGuide到Vivado增量编译:老FPGA工程师的迁移笔记与效率工具对比
  • 别再写vect[a:b]了!Verilog动态截取的正确姿势:+:和-:语法保姆级教程
  • 2026 年 6 月四级备考效率低资料乱?高分神器这样选 - 讲清楚了
  • Arduino自动变速箱:从闭环控制到机电一体化的实践指南
  • 英雄联盟智能助手Seraphine:免费开源战绩查询与BP辅助工具终极指南
  • 2026 年 6 月企业在线考试系统别乱选!内行实测避坑 - 讲清楚了
  • 华为OD机试真题 新系统 【小学生班长选举】
  • Arduino入门实战:电位器控制LED闪烁频率,掌握模拟信号采集与PWM控制
  • OpenCV实战:用Python和HoughCircles函数快速检测图像中的圆形(附完整代码)
  • SAP-ABAP:条件判断与循环控制语句(7篇)第七篇:性能优化:条件与循环代码的常见性能瓶颈与优化方案
  • 从‘过冲’到‘丝滑’:手把手教你用映射自适应律优化滑模控制(VSC/SMC),保护你的执行器
  • 告别硬邦邦!Qt实战:用QItemDelegate在QTableView里实现双击才显示的QComboBox
  • qmcdump:QQ音乐加密音频格式转换实战完整指南
  • 【Android】小米浏览器国际版-可打开任意网站-无限制上网
  • 别再手动改配置文件了!用Oracle Net Configuration Assistant搞定监听和远程连接(保姆级图文)
  • 告别内存焦虑:在STM32F429上把SDRAM当内部RAM用的完整流程(含FreeRTOS内存池配置)
  • MKL24Z32VFM4选型指南:Kinetis KL2系列MCU对比与低功耗应用选型建议
  • 从医疗诊断到游戏AI:手把手教你用Python玩转UCI数据集的5个跨界实战