当前位置：首页 > news >正文

LongLLMLingua 核心原理：对比困惑度实现提示词压缩

news 2026/7/14 9:05:43

LongLLMLingua 核心原理：问题感知的粗+细两级压缩

LongLLMLingua 是微软专门为长上下文RAG场景优化的提示词压缩技术，它在原始LLMLingua"由粗到细"压缩架构的基础上，加入了革命性的问题感知能力——压缩时不再只看语言本身的信息量，而是同时衡量"这个内容对回答用户问题有多重要"。

这就是为什么它能做到：压缩4倍的同时，准确率反而比原始长prompt提高21.4%（在NaturalQuestions基准上）。

一、原始LLMLingua的粗+细压缩基础

原始LLMLingua已经采用了"先砍大块，再修细节"的两级压缩策略，LongLLMLingua完全继承了这个架构：

1. 粗粒度压缩（第一级）

目标：快速砍掉完全无关的大段内容
做法：把prompt分成段落/句子/文档块，用小模型（如Llama-2-7B）计算每个块的困惑度（PPL）
逻辑：困惑度越低 → 模型越容易预测 → 内容越冗余 → 可以优先删除
效果：通常能先砍掉50%-70%的完全无关内容

2. 细粒度压缩（第二级）

http://www.jsqmd.com/news/885970/

相关文章：

航空发动机叶片三维扫描-诺斯顿

Flory-Huggins参数与机器学习结合：聚合物耐化学性预测模型构建与应用

告别MQTT.fx！用STM32+ESP8266直连新版OneNET，手把手教你从零配置JSON数据上传

ZMJS，把 JavaScript 解释器放进 SAP ABAP 应用服务器之后，很多扩展思路会变得不一样

39 - Go 信号捕获与处理：优雅退出、进程控制

告别AWCC臃肿：AlienFX Tools终极轻量级控制方案深度评测

谈美---朱光潜前20页

15个靶场如何构建渗透测试能力成长路径

【Linux：文件】Linux 动静态库详解：动态链接与动态库加载深度解析

如何突破百度网盘下载限制：Python解析工具完整指南

Ubuntu经常安装软件

【安全加固】Claude Code v2.1.149 发布：堵截 PowerShell 越权路径漏洞，账单明细精准透视

Redis三大缓存异常问题

机器学习势函数在辐射损伤模拟中的性能评估与优化策略

白嫖$100直充券，3款Search MCP让你的AI Agent更聪明！

为什么这个免费工具能快速修复你的重要视频文件：完整实战指南

相贯曲线自动焊接轨迹规划与轨迹控制技术【附代码】

2026 太原装修公司十佳榜单重磅发布！口碑实力双优，装修选对不踩坑 - 资讯快报

5分钟学会BlenderKit：让你在Blender里拥有一个永不枯竭的创意资源库

2026广州增城注册公司怎么选？本地老创业者实测5家靠谱财税，避坑不踩雷 - 资讯快报

[Dify实战] 从 Docker Compose 起步，怎么先搭出一个可验证的 Dify 本地环境？

小白友好：OpenClaw Windows 一键部署教程（含安装包）

【常规维护】Claude Code v2.1.150 发布：聚焦内部基础设施演进

调试手记：通过正点原子飞控源码理解PID串级调参与内外环频率匹配问题

2026年北京朝阳搬家公司多维度精选推荐四家正规公司 - 余小铁

2026广州高企认定机构哪家靠谱？主流代办服务商场景适配测评清单 - 资讯快报

DMA Buffer Cache同步的批处理优化及高通平台的实践

电磁流量计十大品牌排名 - 水质仪表品牌排行榜

网盘限速终结者：LinkSwift直链下载助手终极指南

CVE编号申请实战指南：从漏洞验证到协同披露