当前位置: 首页 > news >正文

From Local to Global: Revisiting Structured Pruning Paradigms for Large Language Models

文章总结与翻译

一、主要内容

本文聚焦大型语言模型(LLMs)的结构化剪枝技术,针对主流局部剪枝范式任务无关、下游性能提升有限的问题,重新审视全局结构化剪枝并提出GISP(Global Iterative Structured Pruning)方法。

核心背景

  • 结构化剪枝因能生成硬件友好的紧凑架构,成为LLMs高效部署的关键技术,但现有局部剪枝(如Wanda、SparseGPT)通过层-wise重构优化,忽视任务目标,难以利用任务特定校准信号。
  • 全局剪枝虽能关联模型级损失,但传统单步全局剪枝在高稀疏度下稳定性差、易导致困惑度崩溃。

GISP方法核心设计

  1. 全局迭代剪枝:采用逐步剪枝策略(线性调度器控制每步剪枝比例),避免单步大量权重移除,在高稀疏度(40%-50%)下稳定模型性能,无需中间微调。
  2. 结构级重要性评估:基于一阶损失信息,通过块归一化聚合注意力头和MLP通道的重要性,自然实现非均匀剪枝。
  3. 任务特定适配:支持自定义任务目标,实例化两种损失函数——语言建模的困惑度损失、决策类任务的边际损失(Preserve正确/错误答案的损失差距)。
  4. “一次剪枝,多端部署”:迭代轨迹形成嵌套子网络,单次剪枝可生成不同稀疏度的模型,摊销计算成本。
http://www.jsqmd.com/news/1128947/

相关文章:

  • 2026 AI 开发者生存指南(7):10 个 AI 开发者必备的开源项目导航
  • Anthropic 宣布 7 月 8 日起 Claude 用户需人脸实名认证,AI 匿名时代终结
  • Codex怎么删除会话?Codex怎么删除历史聊天?解决Codex启动卡顿问题教程
  • 终极免费Switch模拟器指南:如何在PC上完美运行任天堂游戏
  • cmake知识
  • Python之strudelpy包语法、参数和实际应用案例
  • 浏览器用户画像大屏搭建:从静态布局到交互联动(附完整代码)
  • Linux中Mamba的有效安装
  • GetQzonehistory:一键导出QQ空间历史说说的智能工具
  • 锂离子电池过压保护与BQ2920设计要点解析
  • Pot Desktop:跨平台划词翻译软件完整使用指南 - 5分钟实现高效多语言工作流
  • Audacity终极指南:免费开源音频编辑软件的专业解决方案
  • 终极指南:如何在5分钟内安装Deforum扩展并创建Stable Diffusion动画
  • C语言 冒泡排序
  • STM32F439ZG与MC6470 IMU的运动控制开发指南
  • cursor半价邀请链接
  • Slint GridLayout 详解:从基础到实战的网格布局指南
  • Python之anydo-api包语法、参数和实际应用案例
  • 20万以内的领克07GT是否值得购买呢咋们来聊聊领克07GT这台车
  • 第四届链博会首次设立 AI 专区,676 家企业参展——AI 不再只是前沿科技了
  • Codex App 26.616 新功能教程:Record Replay 录制与回放使用指南
  • 千问文档怎么导出?AI 导出鸭一站式搞定多格式导出难题
  • 题解:洛谷 AT_abc463_a [ABC463A] 16:9
  • (论文速读)REF-DDPM:一种新的基于DDPM的不平衡滚动轴承故障诊断数据增强方法
  • 【研发类-前端开发Skills】angular-ui-patterns 技能
  • 西安军工拉力机优质品牌怎么选?力学测试合规不能马虎
  • 企业级FastAPI后端模板搭建(五)初始化数据
  • FinalBurn Neo完整指南:打造完美街机游戏模拟体验的终极教程
  • AI 导出鸭实操教程:怎么把 Grok 生成的表格导出,零基础快速搞定表格转存
  • 2026 AI 开发者生存指南(8):AI 视频、音乐、图像生成工具链——从文本生成到商业化应用