当前位置: 首页 > news >正文

谷歌新发现:让LLM“听懂“问题的实用技巧

来自Google Research的最新研究发现了一个令人惊讶的现象:在非推理场景下,简单地将输入提示重复一遍,就能显著提升大语言模型的性能表现。这个技巧适用于Gemini、GPT、Claude、Deepseek等主流模型,而且不会增加输出长度或响应延迟。

🔍 为什么重复提示有效?

技术原理

大语言模型通常作为因果语言模型训练,这意味着过去的token不能关注未来的token。这种单向注意力机制导致查询中token的顺序会影响预测性能。

比如,"先给选项再给问题"和"先给问题再给选项"两种格式,模型的表现可能大不相同。

提示重复的巧妙之处:

  • 将输入从将输入从<QUERY>变为<QUERY>;<QUERY>
  • 让每个提示token都能关注到其他所有提示token
  • 打破了单向注意力的限制

可视化理解

想象你在和朋友对话:

  • 正常情况:你说一句话,朋友只能根据前半句理解后半句
  • 重复提示:你把同样的话重复一遍,朋友现在能听到完整的两遍,理解自然更深入

📊 实验结果

测试范围

  • 7个主流模型:Gemini 2.0 Flash、GPT-4o、Claude 3.7 Sonnet等
  • 7个基准测试:ARC、OpenBookQA、GSM8K、MMLU-Pro、MATH等
  • 70个模型-测试组合:提示重复在其中47个组合中显著优于基线

关键数据

测试类型改进幅度典型例子
多项选择题(选项优先)显著提升OpenBookQA准确率提升10-20%
多项选择题(问题优先)适度提升ARC测试稳定改善
自定义任务巨大提升NameIndex任务从21.33%→97.33%

效率表现

  • ✅ 输出长度:保持不变
  • ✅ 响应延迟:基本不变(仅预填充阶段略微增加)
  • ✅ 部署难度:零成本,直接替换现有提示

🛠️ 使用方法

基础版本

# 原始提示 prompt = "中国的首都是哪里?" # 提示重复版本 prompt_repeated = "中国的首都是哪里?中国的首都是哪里?"

详细重复版

<原始查询> 让我重复一下: <原始查询>

三倍重复版

<原始查询> 让我重复一下: <原始查询> 让我再重复一次: <原始查询>

核心洞察:有时候,让模型"多听一遍"比让它"多想一步"更有效。

对于实际应用者来说,这是一个立即可用的技巧。下次你发现模型没"听懂"问题时,不妨试试把问题重复一遍——你可能会惊讶于效果的提升。

Prompt Repetition Improves Non-Reasoning LLMs https://arxiv.org/pdf/2512.14982

这里给大家精心整理了一份全面的AI大模型学习资源包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享

👇👇扫码免费领取全部内容👇👇

1. 成长路线图&学习规划

要学习一门新的技术,作为新手一定要先学习成长路线图方向不对,努力白费

这里,我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。可以说是最科学最系统的学习成长路线。

2. 大模型经典PDF书籍

书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础(书籍含电子版PDF)

3. 大模型视频教程

对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识

4. 2026行业报告

行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

5. 大模型项目实战

学以致用,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。

6. 大模型面试题

面试不仅是技术的较量,更需要充分的准备。

在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。

7. 资料领取:全套内容免费抱走,学 AI 不用再找第二份

不管你是 0 基础想入门 AI 大模型,还是有基础想冲刺大厂、了解行业趋势,这份资料都能满足你!
现在只需按照提示操作,就能免费领取:

👇👇扫码免费领取全部内容👇👇

http://www.jsqmd.com/news/553188/

相关文章:

  • Fun-ASR-MLT-Nano-2512实战:快速搭建多语言语音识别Web服务
  • C++的std--ranges内存效率
  • C++的std--source_location:C++20中的源码位置信息
  • Comsol模拟混凝土中水分传递 低气压下水分转移引起的水泥浆龄期微观结构变化 低气压(AP)...
  • 告别传统安卓UI开发:用Accompanist库打造现代化Compose应用
  • Qwen3-ForcedAligner应用解析:智能语音合成评估与质检实战
  • 终极使用指南:5分钟掌握RVC语音转换神器
  • 面试官问OkHttp连接复用,别再只答Keep-Alive了!聊聊Http2连接合并(coalescing)那些事
  • 为什么你的局域网速度慢?可能是集线器和交换机的区别没搞懂
  • 联想携手一汽:破汽车智造算力困局,迈向AI工厂新时代
  • Leather Dress Collection 快速部署与Visio流程图绘制应用
  • Swin2SR模型可解释性:理解超分决策过程
  • 颠覆式AI象棋助手:让深度学习成为你的棋局分析大师
  • OptiScaler效能倍增指南:跨平台上采样技术实战调优
  • 2026年质量好的石灰/新型建材合成石灰/工业级生石灰原料/工业废水石灰粉厂家推荐参考 - 品牌宣传支持者
  • 实验室数字化转型困境与SENAITE LIMS开源解决方案:从技术架构到合规实践
  • 智能硬件适配引擎:让黑苹果EFI配置从技术难题到即插即用的革新方案
  • HunyuanVideo-Foley保姆级教程:WebUI主题定制与快捷操作模板保存
  • Ostrakon-VL-8B效果对比:在相同RTX 4090D上推理速度比Qwen3-VL快2.3倍
  • 小白挖漏洞必备的两个平台!有技术就能挖,没有上限,光靠挖洞月入1w+的都大有人在!_漏洞挖掘提交网站。
  • RMBG-2.0效果展示:与U2Net、RemBG v1.4对比的发丝分割精度实测
  • 2026年评价高的酸原料/过氧化氢酸原料厂家专业度参考(精选) - 品牌宣传支持者
  • 为什么你的Python 3.14 JIT没提速?——89%开发者忽略的trace缓存污染与profile-guided重编译机制
  • 2026正规制氮机品牌推荐:VPSA真空变压吸附式工业制氧机、中型工业制氧机、大型工业制氧站、小型工业制氧机、深冷空分制氧机选择指南 - 优质品牌商家
  • Qwen3-Reranker部署教程:国产化信创环境(麒麟OS+海光CPU)适配方案
  • 从RFC2544到真实业务:你的网络延迟和丢包率到底多少才算“合格”?
  • 零代码部署GEMMA-3像素工作站:复古界面下的多模态AI体验
  • DenseNet vs. ResNet 实战对比:参数更少、错误率更低?用CIFAR-10数据告诉你答案
  • 小白也能懂:通义千问1.5-1.8B本地部署全流程,附Chainlit界面演示
  • 解决抖音直播数据实时采集难题的全栈方案:DouyinLiveWebFetcher实战指南