当前位置：首页 > news >正文

美团LongCat-Flash-Thinking：5600亿参数推理引擎来了！

news 2026/7/6 17:37:17

美团LongCat-Flash-Thinking：5600亿参数推理引擎来了！

【免费下载链接】LongCat-Flash-Thinking项目地址: https://ai.gitcode.com/hf_mirrors/meituan-longcat/LongCat-Flash-Thinking

导语：美团正式发布5600亿参数大模型LongCat-Flash-Thinking，采用创新混合专家（MoE）架构，在数学推理、代码生成等复杂任务中展现出行业竞争力，标志着国内大模型技术在高效推理领域迈出重要一步。

行业现状：大语言模型正朝着"更大参数、更高效率"的方向快速演进。随着GPT-5、Gemini 2.5等国际巨头模型的迭代，参数规模已突破千亿级，但如何在保持性能的同时提升计算效率成为行业共同挑战。混合专家（Mixture-of-Experts, MoE）架构通过动态激活部分参数的方式，有效平衡了模型规模与计算成本，成为当前大模型技术的重要发展方向。据行业报告显示，2025年全球大模型市场规模预计突破2000亿美元，其中推理效率优化相关技术将成为核心竞争点。

产品/模型亮点：LongCat-Flash-Thinking作为美团DORA分布式强化学习框架的重要成果，呈现三大核心创新：

首先，动态高效的MoE架构。该模型总参数达5600亿，但通过智能激活机制，实际推理时仅需调用186亿至313亿参数（平均约270亿），在保证性能的同时显著降低计算资源消耗。这种"按需激活"的设计使模型在消费级硬件上也能实现高效推理。

其次，领域并行强化学习技术。创新性地将STEM（科学、技术、工程、数学）、代码开发和智能体任务进行解耦优化，分别训练领域专家模型后融合为 Pareto 最优模型。这一方法有效解决了传统混合域训练的不稳定性问题，使模型在数学推理（MATH500测试得分99.2）、代码生成（LiveCodeBench@4得分79.4）等专业领域达到行业领先水平。

第三，强化推理能力突破。特别强化了形式化推理和智能体推理两大关键能力：在形式化推理方面，通过专家迭代框架实现自动定理证明，MiniF2F测试Pass@32得分达81.6；在智能体推理方面，采用双路径推理方法提升工具使用效率，在τ²-Bench-Telecom等行业基准测试中得分83.1，展现出在零售、航空、电信等垂直领域的应用潜力。

行业影响：LongCat-Flash-Thinking的发布将加速大模型技术在产业端的落地进程。其高效推理特性降低了企业级应用的部署门槛，而领域专精能力则为垂直行业解决方案提供了技术支撑。美团作为生活服务领域的领军企业，此次布局不仅强化了自身技术壁垒，更为服务业智能化转型提供了新范式。值得注意的是，该模型在安全评估中表现突出，有害信息识别率93.7%、隐私保护得分98.8，为行业树立了负责任AI的典范。

结论/前瞻：LongCat-Flash-Thinking的推出，标志着国内大模型研发已从"参数竞赛"转向"效率与精度并重"的高质量发展阶段。随着动态计算、领域并行等技术的成熟，大模型将更广泛地渗透到实体经济中。未来，我们有理由期待美团将这一技术应用于智能客服、供应链优化、本地生活服务等场景，推动服务业数字化升级进入新阶段。同时，其开源策略也将促进学术界和产业界的协作创新，共同推动大模型技术的健康发展。

【免费下载链接】LongCat-Flash-Thinking项目地址: https://ai.gitcode.com/hf_mirrors/meituan-longcat/LongCat-Flash-Thinking

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

查看全文

http://www.jsqmd.com/news/222809/