当前位置: 首页 > news >正文

打破手机跑大模型壁垒,面壁智能联合清华开源端侧新品BitCPM-CANN


面壁智能近日联合清华大学、OpenBMB开源社区,正式发布并开源了在低比特大模型训练方向的最新突破成果——BitCPM-CANN。该成果在华为昇腾平台上原生完成,标志着端侧AI大模型在轻量化与工程落地方面迈出了关键一步。

释放六倍显存红利打破硬件限制

本次开源的BitCPM-CANN包含0.5B、1B、3B、8B四个模型尺寸,与同尺寸全精度家族模型进行逐项对照评测,表现十分优异。相比传统BF16 精度,该模型在推理阶段能够释放约 6 倍的显存红利,让大模型运行的硬件门槛大幅降低。

对于手机产业而言, 6 倍的显存红利意味着原本对配置要求极高的8B参数级别大模型,如今也可以轻松流畅地运行在主流旗舰手机之上。这种对内存空间的极致释放,将直接加速端侧AI技术在移动设备上的普及与商用落地。

高能力保留率证实工程可复现性

在精简模型体积的同时,BitCPM-CANN依然保持了极高的性能水准,其模型能力保留率成功维持在90%至97.2%之间。其中,三个主要尺寸模型的能力保留率均达到了95.7%—97.2%,即使是体积最小的0.5B模型,其保留率也超过了90%。

这一亮眼的评测结果,系统性地证明了低比特训练技术路线具备极强的可扩展性与工程可复现性。面壁智能基于相关主干搭建了完整的低比特训练底座,涵盖环境适配、32K长序列支持及融合算子等完整工程体系,为后续面向昇腾的低比特训练工作筑牢了公共基础设施。

http://www.jsqmd.com/news/937731/

相关文章:

  • Ollama 本地跑开源模型:开发者最小上手命令与环境备忘
  • Windows环境下CP/M BIOS定制:从环境搭建到源码修改实战
  • AI搜索时代,品牌内容监测工具的科学选型方法论:从行业需求透视搜极星的设计逻辑
  • Windows ADB Fastboot驱动一键安装工具:告别复杂配置,轻松连接安卓设备
  • 2026论文全流程终极榜单:10款降AIGC软件, 合规修正一路顺畅
  • G-Helper:华硕笔记本轻量化控制工具的技术解析与实践指南
  • Windows风扇控制终极指南:Fan Control完全配置与优化教程
  • 计量室工业仪表IP分配记录
  • Windows HEIC缩略图终极解决方案:5分钟让iPhone照片在资源管理器完美预览
  • 使用 TypeScript 递归条件类型实现深只读(DeepReadonly)
  • 【字节跳动】「第四篇」山西大同太行算力中心全套设备及能耗安保弱电完整详单
  • Lab of Things:构建标准化物联网研究平台的核心架构与实践
  • 2026年适配知网降AIGC平台横评:亲测8款工具,把AIGC率稳控在安全线内
  • 如何永久保存微信聊天记录?WeChatMsg免费开源解决方案终极指南
  • 彻底告别风扇噪音:Fan Control完全指南教你精准掌控Windows风扇控制
  • AI工具链统一纳管实战手册(从零构建可信模型注册中心)
  • 从实验室到应用:差分鬼成像(DGI)如何用更少采样次数,搞定低光照下的目标识别?
  • 如何将微信对话转化为个人数字资产:WeChatMsg数据自主管理指南
  • AI正在淘汰的,不是程序员而是还在用旧方法工作的人(附行动指南)
  • 终极免费MP4视频修复工具:如何从损坏文件中拯救珍贵记忆
  • TypeScript 中实现 TrimLeft、TrimRight 等字符串操作类型
  • 2026 企业软件开发新风向: AI+原生代码平台快速迭代
  • SAM在医疗图像上总翻车?看SurgicalSAM如何用‘原型学习’巧妙解决领域鸿沟
  • 【真实经验分享】PDB未按预期时间执行自动统计信息收集问题分析
  • 微信聊天记录永久保存终极指南:WeChatMsg开源工具完全教程
  • AI Agent:不是预测器,而是决胜市场的“决策操作系统”!提升信息处理、决策一致性,降低人为误差!
  • 基于Arduino与光敏电阻的智能感应装置:从传感器到执行器的IoT实践
  • AI时代的品牌罗盘:2026年国内三大GEO监测工具深度横评与选型指南
  • 【触想智能】工业安卓平板电脑在物流运输行业的应用特点与发展趋势
  • 终极B站广告跳过指南:小电视空降助手完整使用教程