当前位置：首页 > news >正文

ICLR 2026 |32倍压缩率下性能反超25个点！破解长文本压缩「翻车」难题

news 2026/7/6 0:08:38

真正的高质量压缩不是简单的“删减”——让每一比特都承载多样化的信息价值，为大模型走向轻量化、实用化迈出关键一步。

为什么现有上下文压缩方法在高压缩率下集体“翻车”？当模型把32K长文本压到1K，为何性能断崖式下跌？

长文本压缩中容易保留大量“高度相似却重复”的内容，陷入“信息内卷”：看似保留了相关片段，实则堆砌了语义雷同的冗余token，反而误导模型生成错误答案。

来自阿里巴巴未来生活实验室的研究团队发现，这背后是压缩目标的根本错位：现有方法只关注“相关性”，却忽略了“多样性”。当多个高度相似的token同时被保留，它们非但不能叠加信息量，反而会相互干扰（相关不等于正确），让模型在高度相似的冗余信息中迷失方向。

为破解这一困局，研究团队提出一个颠覆性观点：高质量的压缩，需要同时优化“与查询的相关性”和“信息单元间的多样性”。基于此，他们推出创新框架COMI（COarse-to-fine context compression via Marginal Information Gain），通过“边际信息增益”指标与粗到细压缩策略，在32倍高压缩率下仍能精准保留多样化的关键证据链，论文已中稿ICLR 2026。

压缩的“智能标尺”：边际信息增益（MIG）

研究团队发现，现有压缩方法存在盲区：过度依赖相关性导致冗余堆积，而忽略了token间语义相似性引发“信息内卷”。为此，他们使用边际信息增益（MIG）指标，将压缩决策从“单维度相关性”升级为“相关性-冗余性”双维度权衡：

MIG = 本单元与查询的相关性 - 与其他单元的最大相似度

这一指标如同为每个token配备“信息价值计分卡”：既奖励与问题高度相关的片段，又惩罚与已选内容高度重复的片段。

粗到细自适应压缩，让每比特都“物有所值”

有了智能标尺，如何实现精准压缩？COMI采用两阶段策略，像经验丰富的编辑一样“先谋篇布局，再精雕细琢”：

第一阶段：粗粒度组重分配——动态调配“压缩预算”

将长文本划分为等长片段后，COMI不再“一刀切”地均匀压缩，而是基于组间MIG动态调整各段压缩率：信息密度高、冗余度低的片段（如包含关键证据的段落）获得更宽松的压缩率；而信息稀疏或高度重复的区域则被大幅压缩。这种自适应分配确保有限的压缩预算精准投向“高价值信息区”。

第二阶段：细粒度token融合——加权融合避免“信息稀释”

在每个片段内部，COMI根据token级MIG进行加权融合：高MIG token（相关且独特）在融合中占主导权重，低MIG token（冗余重复）被自然稀释。这一机制有效避免了传统平均池化导致的“关键细节被平滑掉”的问题，使压缩后的表示既紧凑又富含多样化信息。

整个框架在NaturalQuestions、HotpotQA等5个数据集上仅需单次训练，即可执行问答、摘要等多种长上下文任务。

实践出真知：高压缩率下的优越性能与深刻洞察

下游任务表现卓越

在32倍压缩约束下，COMI以Qwen2-7B为基座，在NaturalQuestions上实现49.15的Exact Match（EM）分数，比次优基线高出近25个点。即使面对32K超长文本（NarrativeQA），COMI仍能稳定保留推理链关键节点，证明其在极端压缩场景下的鲁棒性。

压缩不是“删减”，而是“提纯”

COMI甚至能提升原生支持256K上下文的Qwen3-4B性能。在NaturalQuestions上，32倍压缩后的COMI达到28.89的F1分数，远超直接输入完整上下文的16.90。这证明高质量压缩不仅是“减负”，更是通过消除冗余干扰实现“信息提纯”，让模型更聚焦于核心证据。

效率与效果兼得

在32倍压缩下，COMI实现端到端推理速度2倍以上提升，且压缩阶段仅引入轻量级开销（NarrativeQA任务中压缩耗时2.76秒，生成仅0.50秒），为工业级部署铺平道路。

总结

COMI工作为长上下文高效推理提供了新范式：

它通过边际信息增益这一简洁而深刻的指标，将压缩目标从“保留相关片段”升级为“保留相关且多样化的信息”，从根本上破解了高压缩率下的性能瓶颈。粗到细的自适应策略则确保了压缩过程既符合全局信息分布，又保留局部语义细节。

这项研究证明，真正的高质量压缩不是简单的“删减”——让每一比特都承载多样化的信息价值，为大模型走向轻量化、实用化迈出关键一步。

论文标题：COMI: Coarse-to-fine Context Compression via Marginal Information Gain

论文链接：https://arxiv.org/abs/2602.01719

代码链接：https://github.com/Twilightaaa/COMI

http://www.jsqmd.com/news/408039/

相关文章：

小白/程序员必看：收藏这份 Claude Agent Skills 入门指南，轻松掌握大模型进阶技能

物理学家，危！Anthropic联创：AI觉醒，2-3年写出菲尔兹级论文

内容分享--转移性三阴性乳腺癌中肿瘤微环境的时空组成预测免疫检查点抑制剂的治疗反应

2026 年固态继电器制造企业权威推荐榜单：可控硅、调压控制器、电力调整器、功率调整器源头厂家精选 - 深度智识库

基于Java的智慧养老：代办陪诊全服务系统

Robot Framework 入门指南：高效学习接口自动化测试

2026年混动汽车保养公司权威推荐：双离合变速箱维修、变速箱故障维修、变速箱油更换、变速箱电脑板维修选择指南 - 优质品牌商家

NocoBase 开源协议和定价调整

微信公众号文章爬取与检索：构建高效Python爬虫的完整指南

Java智构：粉丝生活式社区全服务系统

2026年预糊化淀粉厂家厂家权威推荐榜：污水处理药剂供应商、污水处理药剂供应商、污水处理药剂十大生产厂家选择指南 - 优质品牌商家

别再被口头承诺坑了！微信立减金回收看这篇就够 - 可可收

汽车电子的“热管理师”：铝基板在新能源汽车中的应用

双面板电源地设计错误！发热、死机、干扰大

Java赋能：高效对接云洋聚合跑腿方案

Python 实现企业微信外部群主动消息发送

Java打造智慧养老：一站式陪护代办系统

2026青岛心理咨询机构排名：专业机构推荐与服务解析 - 品牌排行榜

一打样就贴不上、焊不牢、认不出-双面板封装与丝印排查！

2026年污水处理药剂厂家推荐厂家最新推荐：聚丙烯酰胺生产公司、预糊化淀粉十大生产厂家、预糊化淀粉十大生产厂家选择指南 - 优质品牌商家

好写作AI | 从选题到答辩：好写作AI陪伴你的整个毕业论文季！

铝基板耐压与安规布线规则设置

项目经理如何管理比自己能力强的人?

互联网产品经理目前好就业吗?深度剖析!

GSV1221,GSV2221，GSV2231产品选型#ACP---应用对比

双面板易翻车8类错误，教你快速排查

ICLR 2026 | 喂给大模型“元数据”就能加速预训练？别只盯着 URL 了！

身份认证与会话管理

基于Java打造同城多元跑腿服务系统

双面板过孔错误大排查！总结问题