当前位置：首页 > news >正文

我按结构化方法重写了 7 个常用 Prompt，LLM 输出准确率从 47% 跳到了 83%

news 2026/6/20 7:41:52

我按结构化方法重写了 7 个常用 Prompt，LLM 输出准确率从 47% 跳到了 83%

上周我统计了团队过去 30 天发给 GPT-4 的 237 条 Prompt，发现 68% 缺少关键信息、41% 没有输出格式约束、23% 干脆就是一句大白话。让同事按结构化模板重写后，同样的任务，准确率从 47% 跳到了 83%。

这篇文章把我验证过的 7 个高频场景的结构化 Prompt 模板分享出来，每个都带"改前 vs 改后"对比。如果你是天天用 LLM 写代码、写文档、做翻译的开发者，这 7 个模板可以直接套用。

为什么"随便写"不行

很多人觉得 Prompt Engineering 就是"把话说清楚"，但 LLM 和我们想的不一样。举个例子：

改前："帮我写一个 Python 函数，读取 CSV 文件并计算平均值" → LLM 输出：一个只处理单列的简单函数，没有错误处理，遇到空值直接崩

改后： """ Role: 你是一个严谨的 Python 后端工程师。 Task: 编写一个函数，读取 CSV 文件，计算指定数值列的平均值。 Context: 文件可能有空值、非数值行、编码问题（UTF-8/GBK）。 Constraints: 1. 自动跳过空值和非法行 2. 自动检测编码（先试 UTF-8，失败则用 GBK） 3. 返回 (平均值, 有效行数, 跳过行数) Output: 完整可运行的 Python 函数，带 docstring 和类型标注。 """ → LLM 输出：完整的函数，含 try/except、编码检测、空值跳过、返回元组

核心差异：结构化 Prompt 把 Role → Task → Context → Constraints → Output 五要素写清楚后，准确率提升了 36 个百分点。

7 个高频场景模板

1. 代码生成（准确率 47% → 85%）

## Role 你是一个 [语言/框架] 高级工程师，熟悉 [相关领域]。 ## Task [一句话描述要做什么] ## Context [当前项目背景、已有代码、数据库结构] ## Constraints - 必须处理 [边界情况1]、[边界情况2] - 遵循 [代码规范/设计模式] - 禁止使用 [废弃API/不安全方法] ## Output 完整可运行代码 + 单元测试 + 使用示例

2. Bug 修复（准确率 52% → 89%）

## Error [完整的错误信息 + 堆栈跟踪] ## Code ```[语言] [出问题的完整代码]

Expected

[期望的正确行为]

What I’ve Tried

[你已经尝试过的解决方案，避免 LLM 重复无效路径]

关键在"What I've Tried"——不加这句话，LLM 大概率会给出你已经试过且失败的方案。 ### 3. SQL 查询生成（准确率 41% → 78%） ```markdown ## Schema ```sql CREATE TABLE orders ( id INT PRIMARY KEY, user_id INT, amount DECIMAL(10,2), status VARCHAR(20), created_at TIMESTAMP );

Question

[自然语言问题]

Rules

只使用标准 SQL，不用窗口函数（MySQL 5.7 兼容）
大表查询必须带索引提示和 LIMIT

### 4. 技术文档写作 ```markdown ## Audience [初级开发者 / 架构师 / 产品经理] ## Topic [主题] ## Structure 1. 问题背景（2-3 句） 2. 核心概念（带代码示例） 3. 实战步骤（3-5 步） 4. 常见坑（至少 2 个） ## Tone [正式技术文档 / 博客风格 / 教程风格]

5. 代码 Review

## Role 资深代码审查员，关注安全、性能、可维护性。 ## Code ```[语言] [待审查代码]

Check

安全漏洞（SQL 注入、XSS、密钥泄露）
性能问题（N+1 查询、不必要的循环）
可读性（命名、函数长度、注释质量）
错误处理（是否有遗漏的异常路径）

Output

按严重程度排序的问题列表，每个问题附修复建议和修复后代码。

### 6. 多语言翻译（保持术语一致性） ```markdown ## Glossary | 英文 | 中文 | 备注 | |------|------|------| | Agent | 智能体 | 不用"代理" | | Token | Token | 不翻译 | | Prompt | 提示词 | 不用"指令" | ## Text [待翻译文本] ## Rules - 术语严格按 Glossary - 保持原文的代码块、链接不变 - 中文输出，技术术语可保留英文

7. 数据分析（准确率 55% → 82%）

## Data [数据描述或前 5 行示例] ## Goal [分析目标] ## Constraints - 优先用 pandas，复杂统计可用 scipy - 每个分析步骤输出中间结果 - 最后输出 3-5 条可执行的业务建议 ## Output 代码 + 关键数值 + 业务建议，Markdown 格式