当前位置: 首页 > news >正文

LongLLMLingua2:GPT-4级压缩速度提升6倍

一句话总结四大核心模块

  1. 粗粒度(问题感知 PPL):让"问题"接在文档后,问题困惑度越低 → 文档越关键 → 留下来。
  2. 细粒度(对比 PPL):看到问题前后 PPL 下降越多 → token 越关键 → 保留。
  3. 动态压缩比 + 重排:关键文档少压、放首尾;冷门文档狠压。
  4. 子序列恢复:用 LCS 把答案中的人名/术语回贴到原文,避免"切碎"。

提示词压缩技术: LongLLMLingua2 实际计算过程

LongLLMLingua2 最大的突破是彻底抛弃了"困惑度"这套复杂的计算方式,把提示词压缩变成了一个简单的"二分类问题":给每个token打个分,0分直接删,1分必须留

它的速度比LongLLMLingua1快3-6倍,效果更好,是现在工业界的绝对首选。


一、先搞懂:LongLLMLingua2 是怎么"学会"压缩的?

  1. 收集了几十万条不同任务的"问题+上下文+答案"数据
  2. 把这些数据喂给GPT-4,让GPT-4标注:“在这段上下文里,哪些token是回答这个问题必须保留的?”
  3. 用这些GPT-4标注的数据,训练了一个很小的<
http://www.jsqmd.com/news/886121/

相关文章:

  • 终极指南:5步轻松配置BetterJoy让Switch手柄在PC上完美运行 [特殊字符]
  • 如何设计高效的AI Agent提示工程
  • sql1(DDL+DML)
  • Flowable监听器分配部门经理:手把手教你集成公司组织架构,实现真正动态审批流
  • 钦州梅雨季来临,房屋漏水抓紧修!2026最新房屋漏水维修公司TOP5调研盘点!卫生间免砸砖防水、楼顶外墙、阳光房+地下室渗漏解决方案解析 - 防水百科
  • 番茄小说下载器:一图看懂三大核心能力与零门槛使用指南
  • 如何5分钟内将位图转换为无限放大的矢量图:vectorizer深度解析
  • 5种方式让Gcovr成为你的C/C++代码覆盖率分析神器
  • JMeter-Rabbit-AMQP插件:消息队列性能测试的完整指南
  • 简道云进销存方案深度解读:零代码如何覆盖订单-仓库全链路?
  • Burp Suite渗透工作流设计:30款插件的阶段化实战应用
  • 图像矢量化完整指南:3分钟将普通图片升级为无限放大矢量图
  • 淘宝任务自动化:如何用智能脚本每天节省25分钟
  • 如何快速掌握猫抓浏览器扩展:网页媒体资源嗅探与下载的完整指南
  • FIFA 23生涯模式修改器终极指南:免费开源工具打造梦幻球队
  • java基础-多线程(1)
  • 索尼相机隐藏功能完全解锁:PMCA-RE逆向工程工具终极指南
  • Yalmip调试秘籍:用好verbose、debug和warning,快速定位模型报错与性能瓶颈
  • 什么是AI_Agent_Harness?从概念到实战全面解
  • SBTI 人格测试
  • 当进销存系统进入“自己造”时代:2026年零代码如何重塑中小企业数字化格局
  • 2026深圳搬家价格全解析 贵重物品保险费用明细指南 - 从来都是英雄出少年
  • 深圳梅雨季来临,房屋漏水抓紧修!2026最新房屋漏水维修公司TOP5调研盘点!卫生间免砸砖防水、楼顶外墙、阳光房+地下室渗漏解决方案解析 - 防水百科
  • 极域电子教室破解指南:3步快速解除控制限制的完整教程
  • Windows 本地运行轻量级 代码仓库 gogs
  • 跨平台资源下载神器:3分钟掌握智能拦截与批量下载技巧
  • Universal-Updater性能优化技巧:3DS内存受限环境下的高效编程
  • 什么是Agent?一篇讲清楚
  • 珠海梅雨季来临,房屋漏水抓紧修!2026最新房屋漏水维修公司TOP5调研盘点!卫生间免砸砖防水、楼顶外墙、阳光房+地下室渗漏解决方案解析 - 防水百科
  • 基于PIC18F4525的智能温湿度监控系统设计与实现