当前位置: 首页 > news >正文

智谱新模型也用DeepSeek的MLA,苹果M5就能跑

这是一个30B总参数、仅3B激活参数的混合专家(MoE)架构模型,官方给它的定位是“本地编程与智能体助手”。

智谱AI上市后,再发新成果。

开源轻量级大语言模型GLM-4.7-Flash,直接替代前代GLM-4.5-Flash,API免费开放调用。

这是一个30B总参数、仅3B激活参数的混合专家(MoE)架构模型,官方给它的定位是“本地编程与智能体助手”。

在SWE-bench Verified代码修复测试中,GLM-4.7-Flash拿下59.2分,“人类最后的考试”等评测中也显著超越同规模的Qwen3-30B和GPT-OSS-20B。

作为去年12月发布的旗舰模型GLM-4.7的轻量化版本,GLM-4.7-Flash继承了GLM-4系列在编码和推理上的核心能力,同时针对效率做了专门优化。

除了编程,官方还推荐将这个模型用于创意写作、翻译、长上下文任务,甚至角色扮演场景。

30B参数只激活3B,MLA架构首次上线

GLM-4.7-Flash沿用了该系列的”混合思考模型”的设计。

总参数量300亿,但实际推理时仅激活约30亿参数,使模型在保持能力的同时大幅降低计算开销。

上下文窗口支持到200K,既可以云端API调用,也支持本地部署。

目前官方还没有给出技术报告,更多细节还要从配置文件自己挖掘。

有开发者注意到一个重要细节:GLM团队这次首次采用了MLA(Multi-head Latent Attention)架构。这一架构此前由DeepSeek-v2率先使用并验证有效,如今智谱也跟进了。

从具体结构来看,GLM-4.7-Flash的深度与GLM-4.5 Air和Qwen3-30B-A3B接近,但专家数量有所不同——它采用64个专家而非128个,激活时只调用5个(算上共享专家)。

目前发布不到12小时,HuggingFace、vLLM等主流平台就提供了day0支持。

官方也在第一时间提供了对华为昇腾NPU的支持。

本地部署方面,经开发者实测在32GB统一内存、M5芯片的苹果笔记本上能跑到43 token/s的速度。

官方API平台上基础版GLM-4.7-Flash完全免费(限1个并发),高速版GLM-4.7-FlashX价格也相当白菜。

对比同类模型,在上下文长度支持和输出token价格上有优势,但目前延迟和吞吐量还有待优化。

HuggingFace:https://huggingface.co/zai-org/GLM-4.7-Flash

http://www.jsqmd.com/news/275403/

相关文章:

  • 快讯|萝博派对(RoboParty)Roboto_Origin项目全栈上线:1.2m人形机器人硬件结构、BOM清单、3m/s运动控制算法完全开源;灵心巧手与Xbotics推出线上实习项目,打造人才生态
  • 阿里云ECS部署hadoop+MapReduce+Spark实践
  • GBase 8s MTK工具,让数据库迁移更简单
  • 无需PLC控制,威纶通触摸屏直接实现与台达变频器通信控制
  • 【课程设计/毕业设计】机器学习基于python-cnn深度学习识别水果是否成熟
  • GBase 8c数据库故障定位解析
  • 巴菲特的市场周期理解
  • 探索健康管理虚拟仿真实训室的创新教学应用
  • GBase 8c数据库操作系统故障定位介绍
  • 境外服务器测速脚本
  • 【Effective Modern C++】第二章 auto:6. 当auto推导的类型不符合要求时,使用显式类型初始化习惯用法
  • 智慧旅游虚拟仿真实训:场景化与交互式学习
  • 【毕业设计】(源码+文档+远程调试,全bao定制等)基于python-cnn深度学习识别水果是否成熟
  • GBase 8c数据库磁盘故障定位解析
  • 5.AiServices工具类
  • 谁需要迪士尼验厂与FAMA
  • 莫凡电视的核心优势——聚焦全国地方台全量覆盖
  • 企业微信外部群主动推送消息全攻略
  • 紫外荧光精准测硫,后处理系统开发利器:MEXA-1170SX硫黄分析装置项目实战全解
  • 企业微信API:如何合规实现外部群主动消息推送?
  • odoo-094 self.env 主要属性和方法
  • Vue3-14 watch监视对象及对象属性
  • 活字格低代码:破解企业数据孤岛难题,加速数字化转型进程
  • 深度学习计算机毕设之卷神经网络基于python-cnn深度学习识别水果是否成熟
  • 亲测好用!专科生毕业论文必备TOP8 AI论文工具
  • AI风险模型揭秘:“香港巴菲特”谢清海1/4资产投入黄金的量化验证——硬资产如何重构财富安全边界
  • 黄金价格2026:世界黄金协会多因子模型揭示四大核心驱动力的贝叶斯预测
  • 分享|大数据挖掘建模平台教学方向及科研方向
  • 初中水平的安徽农民:张祥前统一场论从哲学公设到技术应用的完整体系
  • 食品检测仪器的技术演进与应用价值深度解析