当前位置: 首页 > news >正文

美团开源万亿参数大模型 LongCat-2.0:国产算力与Agentic Coding的里程碑

6月30日,美团正式发布了新一代基础大模型 LongCat-2.0,并宣布将对外开源。作为业界首个全程在五万卡国产算力集群上完成预训练到推理全流程的万亿参数模型,LongCat-2.0 的问世不仅标志着“国模+国芯”全流程闭环的实质性突破,更为全球开发者在 Agentic Coding(智能体编程)领域提供了全新的基础设施。

国模国芯全栈协同:验证国产算力极限

LongCat-2.0 最大的硬核亮点在于其训练底座的“全国产化”。该模型总参数量高达 1.6T,预训练数据规模超过 30T tokens。面对万卡级训练中的硬件故障、通信异常等挑战,美团团队自2023年起与国产算力厂商协同攻坚,通过自研确定性算子、弹性扩缩卡和自动故障恢复等机制,将月均日故障率降低70%以上,训练 MFU(模型算力利用率)提升1.5倍,最终实现了稳态日吞吐超 1T tokens 的卓越表现。这证明了国产算力不仅能“训出”万亿模型,还能保障其在真实任务中的稳定运行。

架构创新:让算力用在“刀刃”上

在模型架构设计上,LongCat-2.0 采用 MoE(混合专家)架构,并围绕真实 Agentic Coding 任务进行了多项原创设计:

  • 零计算专家(Zero-Computation Expert):业界首创的 Token 级动态激活机制。在处理代码任务时,简单的 Token(如标点、常见助词)直接路由至零计算专家,不占用算力;而复杂推理 Token 则自动激活更多专家。这使得模型在 33B~56B 的动态激活范围内,大幅降低了推理成本。
  • LSA 稀疏注意力机制:原生支持 1M(百万级)超长上下文。通过智能筛选关键信息,将长文本计算量从平方级降至线性级,使得 Agent 能够一次性“看见”并精准定位整个中型微服务项目。
  • MOPD 多专家融合架构:融合了 Agent Experts(专攻工具调用与自主纠错)、Reasoning Experts(深耕数学与 STEM 推理)和 Interaction Experts(优化指令遵循),由门控网络根据任务类型动态调度,全面提升综合表现。
性能领跑:登顶全球开发者调用榜单

在正式开源前,LongCat-2.0 的预览版已通过 OpenRouter 平台面向全球开放。凭借在代码生成与自动化编程上的强劲实力,该模型迅速跻身全球大模型调用量前三。在 Hermes、Claude Code 等主流 Agent 框架中,其月调用量分列全球第一和第二,成为最受全球 Agent 开发者欢迎的模型之一。

在权威评测中,LongCat-2.0 同样表现优异。在考察深层工程能力的 SWE-bench Pro 中获得 59.5 分,超越了 Gemini 3.1 Pro、GPT-5.5 和 Claude Opus 4.6;在真实终端指令交互评测 Terminal-Bench 2.1 中取得 70.8 分,展现了在真实运维与开发环境中的稳定执行力。

全面开源:赋能全球开发者生态

为了回馈全球开发者社区,美团官方宣布,将于近期在多平台同步开源 LongCat-2.0 的 Infra 框架、推理引擎以及模型参数等核心技术。这一举措将极大降低企业级 AI Agent 的落地门槛,加速 Agentic Coding 在复杂办公场景与软件工程中的闭环应用。

http://www.jsqmd.com/news/1114507/

相关文章:

  • 软考机考压轴题加载失败真相:服务器端QoS限流阈值曝光,考生自主规避的4种预加载操作(仅限本期发放)
  • 本地搜索神器,秒出结果
  • 5分钟解锁macOS级触控体验:Windows三指拖拽终极指南
  • 2025终极指南:八大网盘直链下载助手完整使用教程
  • 影刀RPA新手教程:钉钉机器人消息推送完全指南——内部群通知、Webhook配置与消息格式
  • 一站式KMS激活解决方案:告别Windows和Office激活烦恼的终极指南
  • 从零部署Hermes Agent:构建能自我进化的AI智能体助手
  • 太流批了,报价系统,比付费好用
  • Parsec VDD技术深度解析:Windows虚拟显示器驱动架构与实战指南
  • AI数字人平台哪个好用?从上手难度到内容效率的一次完整梳理(2026)
  • Hide Mock Location深度解析:彻底隐藏Android模拟位置的终极解决方案
  • 原来长春市场竟有产品稳定的专业宝马原厂升级产品?
  • Supershell实战:构建跨平台全交互式C2与反弹Shell平台
  • 炉石传说脚本终极指南:5分钟快速上手指南
  • 【BUG已解决】error: externally-managed-environment 解决方案
  • R3nzSkin国服换肤工具:免费解锁LOL全皮肤终极指南
  • 【软考程序员黄金72小时启动计划】:零基础考生第1周必须完成的8件关键小事,错过=多考1年
  • YOLOv8为何仍是目标检测首选?从核心原理到实战部署全解析
  • 鸿蒙HarmonyOS菜单体验实战 —— bindMenu、bindContextMenu、Select 的正确打开方式
  • 5分钟快速掌握Sketchfab免费下载3D模型的终极指南
  • 搭建本地AI开发环境:LobsterAI与Qwen2.5-0.5B实战指南
  • Java地址智能解析终极指南:3分钟搞定混乱地址结构化处理
  • 全球芯片股集体回调,AI算力市场进入理性调整期
  • 【软考通关核心机密】:上午题VS下午题的5大本质差异与3步避坑指南
  • Minkowski距离:可调p值的距离度量与工业级应用指南
  • 天猫运营培训哪个最权威
  • 【CANdelaStudio-从入门到深入到实战】97 安全刷写流程的自动化验证——用Python攻破SeedKey的最后一公里
  • G-Helper终极教程:告别Armoury Crate臃肿,3分钟解锁华硕笔记本隐藏性能
  • Databricks+Phi-3-mini实现企业邮件智能分类
  • 软考最后72小时逆袭关键:上午题提速30%的秒杀技巧 vs 下午题稳拿60+分的结构化应答框架