当前位置: 首页 > news >正文

【量化】w8a8及per-channel等概念辨析

在看FlashAttention的一个issue时,问了大模型推荐了这篇文章,解决了我长期以来对量化方面存在的几个疑问的点。

  1. w8a8,w4a8这么多的量化手段到底是什么意思?
    W指权重,A指激活值。权重就是模型训练好后固定下来的,可以理解成大模型的记忆,也即神经网络的配置。A是在实际推理过程中的激活值。W4A8就是指权重用int4量化,激活值用W8A8量化。二者的区别在于,权重是静态的,在模型训练好后就不变了。激活值是动态的,是碎输入值的变化而变化的。因此采用W更小的方式会更加节省权重存放的显存占用,使用更小的A可以加速推理计算和节省推理中占用的现存,当前受硬件和模型效果的约束,A一般不会压缩到8以下。
  2. per-channel, per-tensor, per-token的区别
    上述指的是我们的量化的范围,有一个基本的尝试就是量化并不是直接压缩数据,这样会从高精度浮点空间下降到低精度整型空间。因此还需要一个scale变量来进行缩放,以实现仍然在浮点空间存放。scale的存在决定了如果scale的范围更大,用一个scale表示的误差就会更大。一方面会受到某个局部值的影响;另一方面范围越大越可能出现溢出等问题,造成精度损失。但范围越小,需要的scale变量越多,计算开销越大。
    因此需要平衡好合适的计算范围,以实现满足计算要求的同时尽量降低计算开销。per-tensor就是对整个tensor进行一次量化。而per-channel将其分割成多个channel(维度),对每个维度进行独立的量化,就可以实现更好的量化效果。per-token将范围进一步缩小到单个token,量化效果更好,开销更大。
http://www.jsqmd.com/news/244373/

相关文章:

  • 维护类型可分为设备维护、软件维护和数据维护三大类,每类具有不同的目标与执行方式
  • This blueprint (self) is not a WebSocketClient, therefore ‘ Target ‘ must have a connection.
  • **可理解性**:指系统结构、功能、接口等被开发人员或维护人员理解的难易程度
  • 净化门防撞装置不必都加,但选对技术能让日常使用省心一半
  • 深度学习毕设项目推荐-基于python-CNN深度学习对苹果是否腐烂识别
  • 运维岗位越干越心慌?网络安全凭合规刚需 + 技能复用优势,为何职业安全感远超运维?
  • 信息系统的局限性主要体现在其对数据质量和管理规范的高度依赖
  • 信息系统评价的分类**广义评价**:涵盖信息系统从规划、开发、实施到运行维护的全生命周期
  • 马里兰大学与杜比:AI看懂视频运动规律
  • CTF 竞赛常用必备工具,赶紧收藏起来!
  • 让AI像导演一样规划视频:杜克大学团队让视频生成告别“随机发挥“
  • 【网络安全】Windows 版 Nmap 端口扫描工具:完整安装教程 + 命令全集!
  • 网安转行必学:Kali Linux 渗透测试系统入门指南(常用命令详解)
  • 无人机电机模块选型与技术要点
  • 人工智能早间新闻速递 — 2026年1月14日
  • 缺口 480 万!这个领域未来 10 年吃香,零基础小白快上车
  • 淘宝评论API:差评预警系统,及时处理!
  • 二分——Schedule Management
  • 测试域名挖掘 = 漏洞提款机?SRC 挖洞攻略,零基础看这篇就够
  • 深度学习毕设项目:基于深度学习对苹果是否腐烂识别基于python-CNN深度学习对苹果是否腐烂识别
  • 【课程设计/毕业设计】基于python-CNN深度学习对苹果是否腐烂识别基于python-CNN对苹果是否腐烂识别
  • PMSM谐波抑制算法:基于DQ轴谐波提取器的永磁同步电机仿真探索
  • 深度学习毕设项目推荐-基于python_CNN深度学习卷积神经网络训练识别橘子是否新鲜
  • 学霸同款2026 TOP8 AI论文平台:专科生毕业论文写作全测评
  • 用 LabVIEW 实现三菱 FX 系列以太网 MC 协议通讯
  • 系统转换方式 *并行转换**- 新旧系统同时运行一段时间,确保新系统稳定可靠,适用于对数据准确性要求高的场景
  • 计算机深度学习毕设实战-基于python对苹果是否腐烂识别基于python-CNN深度学习对苹果是否腐烂识别
  • 基于Java的精品课程网站 计算机毕业设计选题 计算机毕设项目 前后端分离【源码-文档报告-代码讲解】
  • 从免费到精准:论文重复率的 “双报告” 解决方案,尽在 paperzz 论文查重
  • 【计算机毕业设计案例】基于人工智能python-CNN训练识别蔬菜是否新鲜基于python-CNN卷神经网络训练识别蔬菜是否新鲜