当前位置：首页 > news >正文

腾讯混元3.0：编程能力提升40%，SWE-bench得分74.4%接近GLM-4.7

news 2026/6/18 8:08:11

腾讯混元3.0来了：前OpenAI研究员操刀，编程能力一口气提升40%

腾讯的大模型更新来了。混元3.0（Hy3）近日以"Hy3 preview"名义在OpenRouter平台免费上线。这次最直接的变化是编程能力——SWE-bench测试中，混元3.0得分74.4%，前代混元2.0只有53.0%，提升超过40%。

背后值得关注的人：姚顺雨，前OpenAI研究员，被腾讯挖角后主导了混元3.0的研发。

工具地址：腾讯混元官网

一、模型基本参数

项目规格模型名称混元3.0（Hy3）架构类型MoE（混合专家模型）推理级别三个推理级别上下文长度262K推理速度23 Token/s模态文本型（当前上线版本）访问方式OpenRouter免费体验（Hy3 preview）

需要说明的是：前代混元2.0是多模态模型，但这次混元3.0目前上线的是文本型版本，多模态能力暂未上线。

二、架构解析：MoE + 三级推理

混元3.0采用MoE（Mixture of Experts，混合专家）架构。核心逻辑：模型内部有多个"专家模块"，每次推理只激活其中一部分，而不是跑遍所有参数。这样在保持大参数规模的同时，控制实际计算量。

三个推理级别可以根据任务复杂度灵活切换：

•快速级别：适合简单问答，响应速度优先

•标准级别：平衡速度与质量，适合大多数场景

•深度推理级别：适合复杂编程、逻辑推理，高质量但更慢

262K上下文意味着可以在单次对话中处理约20万字——分析完整代码仓库、阅读长篇法律合同、处理长文档等都适用。

三、性能表现：编程能力基准

模型SWE-bench得分说明混元2.0（Hy2）53.0%前代旗舰混元3.0（Hy3）74.4%提升超40%GLM-4.7接近74.4%智谱AI旗舰GLM-5高于74.4%智谱AI新一代Opus 4.6显著高于74.4%当前行业标杆

混元3.0已进入国内大模型第一梯队，与GLM-4.7处于同一水平线。距GLM-5有差距，距Opus 4.6有较大距离。需要注意的是：目前混元3.0官方技术报告和完整基准数据尚未公布，上述SWE-bench数据来自用户实测。

四、产品定位：闭源 + 腾讯全家桶

混元3.0的路线与DeepSeek形成鲜明对比：

•DeepSeek：开源、低成本、私有部署，面向开发者

•混元3.0：闭源、深度整合腾讯生态，面向不想折腾、希望开箱即用的用户

对于已深度使用腾讯产品的用户，无缝集成体验是实在优势。

文章来源：AITOP100

查看全文

http://www.jsqmd.com/news/691094/

2026年知名的佛山免钉不伤墙挂钩/防潮挂钩高口碑品牌推荐 - 品牌宣传支持者

2026年评价高的电动隔膜阀/浙江电动调节阀/电动闸阀横向对比厂家推荐 - 行业平台推荐

避开坑点：STM32H750用DMA传输数据，为什么总失败？检查你的变量是不是放错了RAM区

2026年知名的浙江电动闸阀/电动闸阀/电动截止阀横向对比厂家推荐 - 品牌宣传支持者

CYBER-VISION新手教程：轻松部署，让AI实时解构你的视觉世界

2026优质！内窥镜手术动力实地厂家实力推荐情况，关节镜动力/电动骨刨削动力/内窥镜手术动力，内窥镜手术动力厂家哪个好 - 品牌推荐师

Java 微服务架构：从拆分到治理的完整踩坑记录

别再瞎折腾了！Windows下用Conda装PyTorch GPU版，看这一篇就够了（附版本对照表）

2026昌吉本地媒体服务梯队盘点：昌吉靠谱的广告公司、昌吉高立柱广告、昌吉三面翻广告、昌吉传媒公司、昌吉做媒体选择指南 - 优质品牌商家

2026湛江工厂手工组装订单外放合作参考：佛山工厂手工组装订单外放、南宁工厂手工组装订单外放、广州工厂手工组装订单外放选择指南 - 优质品牌商家

保姆级调试：手把手带你用IDEA断点追踪@NacosValue配置刷新的完整流程

RWKV7-1.5B-world双语对话教程：支持中英文社交媒体风格（emoji/缩写/口语化）

2026年比较好的钢跳板外贸/钢跳板口碑好的厂家推荐 - 品牌宣传支持者

DevEco Studio：从使用处生成构造函数

破壳记录（二）｜头部、底部与登录模块：从业务组件到状态管理的工程化实践

虚拟机中安装redhat9.3 服务器截图步骤

上市公司夜间灯光是否加班数据（2012.1-2024.12）

123344555

2026年口碑好的佛山重型支架/佛山L型支架厂家哪家好 - 品牌宣传支持者

数据殖民主义与AI伦理红线：软件测试从业者的审视、挑战与行动

chandra多格式输出：JSON/Markdown/HTML协同工作流设计

Preact 开发者学 Angular：Angular 完全对照手册

C# MQTT高性能服务器端源码，助力你摆脱第三方限制，性能卓越，稳定运行三年

LFM2.5-VL-1.6B从零开始：RTX 4090 D上3GB显存高效运行多模态模型实操手册

2026年口碑好的苏州码垛机械手/清洗机械手生产厂家推荐 - 品牌宣传支持者

2026年杭州直播客服外包：杭州外包客服团队/杭州天猫客服外包/杭州客服外包推荐/杭州小程序客服/杭州小红书客服外包/选择指南 - 优质品牌商家

茯苓怎么烘烤品相更好

告别树莓派！用香橙派Zero2给Ender-3 V2刷Klipper固件保姆级教程（含避坑点）

一、模型基本参数

二、架构解析：MoE + 三级推理

三、性能表现：编程能力基准

四、产品定位：闭源 + 腾讯全家桶

相关文章：