当前位置：首页 > news >正文

LongLLMLingua2：GPT-4级压缩速度提升6倍

news 2026/7/13 22:07:05

一句话总结四大核心模块

粗粒度（问题感知 PPL）：让"问题"接在文档后，问题困惑度越低 → 文档越关键 → 留下来。
细粒度（对比 PPL）：看到问题前后 PPL 下降越多 → token 越关键 → 保留。
动态压缩比 + 重排：关键文档少压、放首尾；冷门文档狠压。
子序列恢复：用 LCS 把答案中的人名/术语回贴到原文，避免"切碎"。

提示词压缩技术： LongLLMLingua2 实际计算过程

LongLLMLingua2 最大的突破是彻底抛弃了"困惑度"这套复杂的计算方式，把提示词压缩变成了一个简单的"二分类问题"：给每个token打个分，0分直接删，1分必须留。

它的速度比LongLLMLingua1快3-6倍，效果更好，是现在工业界的绝对首选。

一、先搞懂：LongLLMLingua2 是怎么"学会"压缩的？

收集了几十万条不同任务的"问题+上下文+答案"数据
把这些数据喂给GPT-4，让GPT-4标注：“在这段上下文里，哪些token是回答这个问题必须保留的？”
用这些GPT-4标注的数据，训练了一个很小的<

http://www.jsqmd.com/news/886121/

相关文章：

终极指南：5步轻松配置BetterJoy让Switch手柄在PC上完美运行 [特殊字符]

如何设计高效的AI Agent提示工程

Flowable监听器分配部门经理：手把手教你集成公司组织架构，实现真正动态审批流

钦州梅雨季来临，房屋漏水抓紧修！2026最新房屋漏水维修公司TOP5调研盘点！卫生间免砸砖防水、楼顶外墙、阳光房+地下室渗漏解决方案解析 - 防水百科

番茄小说下载器：一图看懂三大核心能力与零门槛使用指南

如何5分钟内将位图转换为无限放大的矢量图：vectorizer深度解析

5种方式让Gcovr成为你的C/C++代码覆盖率分析神器

JMeter-Rabbit-AMQP插件：消息队列性能测试的完整指南

简道云进销存方案深度解读：零代码如何覆盖订单-仓库全链路？

Burp Suite渗透工作流设计：30款插件的阶段化实战应用

图像矢量化完整指南：3分钟将普通图片升级为无限放大矢量图

淘宝任务自动化：如何用智能脚本每天节省25分钟

如何快速掌握猫抓浏览器扩展：网页媒体资源嗅探与下载的完整指南

FIFA 23生涯模式修改器终极指南：免费开源工具打造梦幻球队

java基础-多线程（1）

索尼相机隐藏功能完全解锁：PMCA-RE逆向工程工具终极指南

Yalmip调试秘籍：用好verbose、debug和warning，快速定位模型报错与性能瓶颈

什么是AI_Agent_Harness？从概念到实战全面解

SBTI 人格测试

当进销存系统进入“自己造”时代：2026年零代码如何重塑中小企业数字化格局

2026深圳搬家价格全解析贵重物品保险费用明细指南 - 从来都是英雄出少年

深圳梅雨季来临，房屋漏水抓紧修！2026最新房屋漏水维修公司TOP5调研盘点！卫生间免砸砖防水、楼顶外墙、阳光房+地下室渗漏解决方案解析 - 防水百科

极域电子教室破解指南：3步快速解除控制限制的完整教程

Windows 本地运行轻量级代码仓库 gogs

跨平台资源下载神器：3分钟掌握智能拦截与批量下载技巧

Universal-Updater性能优化技巧：3DS内存受限环境下的高效编程

什么是Agent？一篇讲清楚

珠海梅雨季来临，房屋漏水抓紧修！2026最新房屋漏水维修公司TOP5调研盘点！卫生间免砸砖防水、楼顶外墙、阳光房+地下室渗漏解决方案解析 - 防水百科

基于PIC18F4525的智能温湿度监控系统设计与实现