当前位置: 首页 > news >正文

腾讯混元3.0:编程能力提升40%,SWE-bench得分74.4%接近GLM-4.7

腾讯混元3.0来了:前OpenAI研究员操刀,编程能力一口气提升40%

腾讯的大模型更新来了。混元3.0(Hy3)近日以"Hy3 preview"名义在OpenRouter平台免费上线。这次最直接的变化是编程能力——SWE-bench测试中,混元3.0得分74.4%,前代混元2.0只有53.0%,提升超过40%。

背后值得关注的人:姚顺雨,前OpenAI研究员,被腾讯挖角后主导了混元3.0的研发。

工具地址:腾讯混元官网

一、模型基本参数

项目规格模型名称混元3.0(Hy3)架构类型MoE(混合专家模型)推理级别三个推理级别上下文长度262K推理速度23 Token/s模态文本型(当前上线版本)访问方式OpenRouter免费体验(Hy3 preview)

需要说明的是:前代混元2.0是多模态模型,但这次混元3.0目前上线的是文本型版本,多模态能力暂未上线。

二、架构解析:MoE + 三级推理

混元3.0采用MoE(Mixture of Experts,混合专家)架构。核心逻辑:模型内部有多个"专家模块",每次推理只激活其中一部分,而不是跑遍所有参数。这样在保持大参数规模的同时,控制实际计算量。

三个推理级别可以根据任务复杂度灵活切换:

快速级别:适合简单问答,响应速度优先

标准级别:平衡速度与质量,适合大多数场景

深度推理级别:适合复杂编程、逻辑推理,高质量但更慢

262K上下文意味着可以在单次对话中处理约20万字——分析完整代码仓库、阅读长篇法律合同、处理长文档等都适用。

三、性能表现:编程能力基准

模型SWE-bench得分说明混元2.0(Hy2)53.0%前代旗舰混元3.0(Hy3)74.4%提升超40%GLM-4.7接近74.4%智谱AI旗舰GLM-5高于74.4%智谱AI新一代Opus 4.6显著高于74.4%当前行业标杆

混元3.0已进入国内大模型第一梯队,与GLM-4.7处于同一水平线。距GLM-5有差距,距Opus 4.6有较大距离。需要注意的是:目前混元3.0官方技术报告和完整基准数据尚未公布,上述SWE-bench数据来自用户实测。

四、产品定位:闭源 + 腾讯全家桶

混元3.0的路线与DeepSeek形成鲜明对比:

DeepSeek:开源、低成本、私有部署,面向开发者

混元3.0:闭源、深度整合腾讯生态,面向不想折腾、希望开箱即用的用户

对于已深度使用腾讯产品的用户,无缝集成体验是实在优势。

文章来源:AITOP100

http://www.jsqmd.com/news/691094/

相关文章:

  • 2026年知名的佛山免钉不伤墙挂钩/防潮挂钩高口碑品牌推荐 - 品牌宣传支持者
  • 2026年评价高的电动隔膜阀/浙江电动调节阀/电动闸阀横向对比厂家推荐 - 行业平台推荐
  • 避开坑点:STM32H750用DMA传输数据,为什么总失败?检查你的变量是不是放错了RAM区
  • 2026年知名的浙江电动闸阀/电动闸阀/电动截止阀横向对比厂家推荐 - 品牌宣传支持者
  • CYBER-VISION新手教程:轻松部署,让AI实时解构你的视觉世界
  • 电脑远程控制手机软件推荐,异地也能用,scrcpy + MoleSDN 保姆教程
  • 2026优质!内窥镜手术动力实地厂家实力推荐情况,关节镜动力/电动骨刨削动力/内窥镜手术动力,内窥镜手术动力厂家哪个好 - 品牌推荐师
  • Java 微服务架构:从拆分到治理的完整踩坑记录
  • 别再瞎折腾了!Windows下用Conda装PyTorch GPU版,看这一篇就够了(附版本对照表)
  • 2026昌吉本地媒体服务梯队盘点:昌吉靠谱的广告公司、昌吉高立柱广告、昌吉三面翻广告、昌吉传媒公司、昌吉做媒体选择指南 - 优质品牌商家
  • 2026湛江工厂手工组装订单外放合作参考:佛山工厂手工组装订单外放、南宁工厂手工组装订单外放、广州工厂手工组装订单外放选择指南 - 优质品牌商家
  • 保姆级调试:手把手带你用IDEA断点追踪@NacosValue配置刷新的完整流程
  • RWKV7-1.5B-world双语对话教程:支持中英文社交媒体风格(emoji/缩写/口语化)
  • 2026年比较好的钢跳板外贸/钢跳板口碑好的厂家推荐 - 品牌宣传支持者
  • DevEco Studio:从使用处生成构造函数
  • 破壳记录(二)|头部、底部与登录模块:从业务组件到状态管理的工程化实践
  • 虚拟机中安装redhat9.3 服务器截图步骤
  • 上市公司夜间灯光是否加班数据(2012.1-2024.12)
  • 2026年热门的防踩翘钢跳板/脚手架钢跳板/镀锌钢跳板/钢跳板主流厂家对比评测 - 行业平台推荐
  • 123344555
  • 2026年口碑好的佛山重型支架/佛山L型支架厂家哪家好 - 品牌宣传支持者
  • 数据殖民主义与AI伦理红线:软件测试从业者的审视、挑战与行动
  • chandra多格式输出:JSON/Markdown/HTML协同工作流设计
  • Preact 开发者学 Angular:Angular 完全对照手册
  • C# MQTT高性能服务器端源码,助力你摆脱第三方限制,性能卓越,稳定运行三年
  • LFM2.5-VL-1.6B从零开始:RTX 4090 D上3GB显存高效运行多模态模型实操手册
  • 2026年口碑好的苏州码垛机械手/清洗机械手生产厂家推荐 - 品牌宣传支持者
  • 2026年杭州直播客服外包:杭州外包客服团队/杭州天猫客服外包/杭州客服外包推荐/杭州小程序客服/杭州小红书客服外包/选择指南 - 优质品牌商家
  • 茯苓怎么烘烤品相更好
  • 告别树莓派!用香橙派Zero2给Ender-3 V2刷Klipper固件保姆级教程(含避坑点)