当前位置: 首页 > news >正文

LongLLMLingua 核心原理:对比困惑度实现提示词压缩

LongLLMLingua 核心原理:问题感知的粗+细两级压缩

LongLLMLingua 是微软专门为长上下文RAG场景优化的提示词压缩技术,它在原始LLMLingua"由粗到细"压缩架构的基础上,加入了革命性的问题感知能力——压缩时不再只看语言本身的信息量,而是同时衡量"这个内容对回答用户问题有多重要"。

这就是为什么它能做到:压缩4倍的同时,准确率反而比原始长prompt提高21.4%(在NaturalQuestions基准上)。

一、原始LLMLingua的粗+细压缩基础

原始LLMLingua已经采用了"先砍大块,再修细节"的两级压缩策略,LongLLMLingua完全继承了这个架构:

1. 粗粒度压缩(第一级)

  • 目标:快速砍掉完全无关的大段内容
  • 做法:把prompt分成段落/句子/文档块,用小模型(如Llama-2-7B)计算每个块的困惑度(PPL)
  • 逻辑:困惑度越低 → 模型越容易预测 → 内容越冗余 → 可以优先删除
  • 效果:通常能先砍掉50%-70%的完全无关内容

2. 细粒度压缩(第二级)

http://www.jsqmd.com/news/885970/

相关文章:

  • 航空发动机叶片三维扫描-诺斯顿
  • Flory-Huggins参数与机器学习结合:聚合物耐化学性预测模型构建与应用
  • 告别MQTT.fx!用STM32+ESP8266直连新版OneNET,手把手教你从零配置JSON数据上传
  • ZMJS,把 JavaScript 解释器放进 SAP ABAP 应用服务器之后,很多扩展思路会变得不一样
  • 39 - Go 信号捕获与处理:优雅退出、进程控制
  • 告别AWCC臃肿:AlienFX Tools终极轻量级控制方案深度评测
  • 谈美---朱光潜前20页
  • 15个靶场如何构建渗透测试能力成长路径
  • 【Linux:文件】Linux 动静态库详解:动态链接与动态库加载深度解析
  • 如何突破百度网盘下载限制:Python解析工具完整指南
  • Ubuntu经常安装软件
  • 【安全加固】Claude Code v2.1.149 发布:堵截 PowerShell 越权路径漏洞,账单明细精准透视
  • Redis三大缓存异常问题
  • 机器学习势函数在辐射损伤模拟中的性能评估与优化策略
  • 白嫖$100直充券,3款Search MCP让你的AI Agent更聪明!
  • 为什么这个免费工具能快速修复你的重要视频文件:完整实战指南
  • 相贯曲线自动焊接轨迹规划与轨迹控制技术【附代码】
  • 2026 太原装修公司十佳榜单重磅发布!口碑实力双优,装修选对不踩坑 - 资讯快报
  • 5分钟学会BlenderKit:让你在Blender里拥有一个永不枯竭的创意资源库
  • 2026广州增城注册公司怎么选?本地老创业者实测5家靠谱财税,避坑不踩雷 - 资讯快报
  • [Dify实战] 从 Docker Compose 起步,怎么先搭出一个可验证的 Dify 本地环境?
  • 小白友好:OpenClaw Windows 一键部署教程(含安装包)
  • 【常规维护】Claude Code v2.1.150 发布:聚焦内部基础设施演进
  • 调试手记:通过正点原子飞控源码理解PID串级调参与内外环频率匹配问题
  • 2026年北京朝阳搬家公司多维度精选推荐四家正规公司 - 余小铁
  • 2026广州高企认定机构哪家靠谱?主流代办服务商场景适配测评清单 - 资讯快报
  • DMA Buffer Cache同步的批处理优化及高通平台的实践
  • 电磁流量计十大品牌排名 - 水质仪表品牌排行榜
  • 网盘限速终结者:LinkSwift直链下载助手终极指南
  • CVE编号申请实战指南:从漏洞验证到协同披露