当前位置: 首页 > news >正文

蚂蚁集团开源万亿参数大模型Ling-1T:刷新开源领域推理效率新高度

蚂蚁集团开源万亿参数大模型Ling-1T:刷新开源领域推理效率新高度

【免费下载链接】Ling-1T项目地址: https://ai.gitcode.com/hf_mirrors/inclusionAI/Ling-1T

2025年10月9日,蚂蚁集团正式对外发布旗下万亿参数规模的通用语言模型Ling-1T,该模型作为蚂蚁百灵大模型Ling 2.0系列的首款旗舰产品,标志着蚂蚁在通用人工智能领域实现重大突破。作为目前蚂蚁百灵团队推出的参数规模最大、综合能力最强的基础模型,Ling-1T在有限Token输出条件下的复杂推理能力测试中表现尤为突出,多项核心指标跃居当前开源模型榜首位置。

第三方权威测评数据显示,Ling-1T在代码生成、竞赛数学、专业数学推理及逻辑分析等多个高难度任务场景中均展现出行业领先水平。特别在竞赛数学领域的AIME 25(美国数学邀请赛25题)评测中,该模型以平均4000+Token的资源消耗实现70.42%的准确率,不仅超越Gemini-2.5-Pro(5000+Token/70.10%准确率)的性能表现,更开创了"低资源高精准"的推理范式,充分验证了其在推理精度与计算效率间的最优平衡能力。

技术架构层面,Ling-1T延续了Ling 2.0的核心架构设计,通过在20万亿tokens高质量语料库上完成预训练,成功将上下文窗口扩展至128K长度。研发团队创新性提出的"中训练+后训练"演进式思维链(Evo-CoT)技术,有效解决了传统模型在思考深度与推理效率间的固有矛盾。该技术通过动态调整推理路径的进化机制,使模型在复杂问题处理中能够自主优化思考流程,显著提升了高效推理与精准决策的协同能力。

值得关注的是,在万亿级模型研发过程中,团队观察到参数规模扩张与推理能力强化带来的"涌现效应"——模型展现出超越训练数据范畴的跨领域泛化能力。在智能体工具调用基准测试BFCL V3中,Ling-1T仅通过少量指令微调(未引入大规模操作轨迹数据)便实现约70%的调用准确率,印证了其强大的推理迁移能力。这种能力使其能够无缝衔接多模态任务:从将自然语言需求转化为可交互的可视化组件,到生成跨平台兼容的前端代码,再到根据特定风格创作多语种营销内容,均展现出通用智能体的核心特征。

尽管在技术突破方面成果显著,蚂蚁百灵团队仍客观指出当前版本的三大局限:其一,注意力机制仍采用GQA架构,在超长上下文处理时存在推理成本偏高问题;其二,智能体在多轮交互记忆与复杂工具组合使用方面有待增强;其三,特定场景下的指令遵循一致性与身份认知稳定性需进一步提升。针对这些问题,团队计划在下一代模型中引入混合注意力架构,并强化强化学习与安全对齐技术,持续优化模型的综合性能。

作为开源生态建设的重要举措,Ling-1T已同步开放模型权重与技术文档,开发者可通过以下官方渠道获取资源:

  • HuggingFace社区:https://huggingface.co/inclusionAI/Ling-1T
  • 国内ModelScope平台:https://modelscope.cn/models/inclusionAI/Ling-1T
  • 代码仓库地址:https://gitcode.com/hf_mirrors/inclusionAI/Ling-1T
  • 在线体验入口(国内用户):https://ling.tbox.cn/chat
  • 海外开发者平台:https://zenmux.ai/inclusionai/ling-1t

蚂蚁百灵团队表示,未来将持续聚焦通用人工智能的核心技术突破,通过开源协作加速AI技术的普惠应用。随着混合注意力架构的引入和智能体能力的强化,Ling系列模型有望在降低推理成本的同时,进一步拓展在企业级应用、科学计算、智能交互等领域的落地场景,为构建安全可控的通用人工智能生态体系贡献关键力量。

【免费下载链接】Ling-1T项目地址: https://ai.gitcode.com/hf_mirrors/inclusionAI/Ling-1T

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/85054/

相关文章:

  • CogVLM2-LLaMA3 19B震撼发布:多模态交互新纪元,开源模型性能媲美GPT-4V
  • 阿里重磅发布HunyuanCustom视频生成模型 多模态技术引领虚拟内容创作新革命
  • 仿写文章标题示例:当前人工智能领域最新发展趋势深度剖析
  • 基于微信小程序的云上考场毕设源码(源码+lw+部署文档+讲解等)
  • 突破现实场景限制:VLAC多模态模型重塑机器人任务执行范式
  • 基于微信小程序的商品展示计算机毕设(源码+lw+部署文档+讲解等)
  • 基于微信小程序的培训机构客户管理系统的设计计算机毕设(源码+lw+部署文档+讲解等)
  • 基于微信小程序的小说阅读器毕业设计源码(源码+lw+部署文档+讲解等)
  • 基于微信小程序的居住证申报系统计算机毕业设计(源码+lw+部署文档+讲解等)
  • 基于微信小程序的汽车保养系统毕业设计源码(源码+lw+部署文档+讲解等)
  • 2025-12-14:交替方向的最小路径代价Ⅱ。用go语言,给你一个 m 行 n 列的网格。进入格子 (i, j) 的花费为 (i+1)*(j+1)。另外每个格子还有一个等待代价矩阵 waitCost
  • 助农扶贫微信小程序
  • dify 1.11.1 版本发布:重要安全更新、性能优化与新特性解析
  • 基于微信小程序的4S店客户管理系统毕业设计源码(源码+lw+部署文档+讲解等)
  • CVPR 2024重磅发布:腾讯混元3D 2.1全链路开源,开创工业级3D生成新纪元
  • 虚拟手柄驱动配置:5分钟解决Windows游戏控制器兼容问题
  • CogAgent:革新GUI交互的视觉语言模型突破
  • Windows右键菜单管理终极指南:ContextMenuManager完全使用手册
  • 大模型应用:TTA文本驱动音频:MusicGen大模型参数调优+音频情绪可视化.23
  • 人工智能行业发展新趋势:技术突破与应用拓展并行
  • 百度网盘提取码智能获取工具:告别繁琐搜索的创新解决方案
  • 深入解析Android Fragment预加载机制:提升应用流畅度的关键
  • 英伟达发布AceReason-Nemotron-7B:强化学习驱动的数学与代码推理新突破
  • 深入剖析Glide三级缓存:从原理到面试实战
  • 虚拟手柄驱动终极指南:5分钟快速实现游戏控制器完美模拟
  • Stable Diffusion 3重磅登陆Diffusers:多模态AIGC新纪元开启
  • 【Spring】实现验证码功能
  • 7、深入探索Linux Shell的使用与优化
  • 腾讯开源Hunyuan3D-2mv:多视角驱动的3D资产生成新纪元
  • Java 版的 AutoGPT?基于 Semantic Kernel (Java SDK) 构建全自动任务规划 Agent