当前位置: 首页 > news >正文

蚂蚁集团开源万亿参数推理大模型Ring-1T-preview,刷新多项全球榜单纪录

蚂蚁集团开源万亿参数推理大模型Ring-1T-preview,刷新多项全球榜单纪录

【免费下载链接】Ring-1T-preview项目地址: https://ai.gitcode.com/hf_mirrors/inclusionAI/Ring-1T-preview

2025年9月30日,蚂蚁集团旗下百灵团队正式对外开源其重磅研发成果——自然语言推理大模型Ring-1T-preview。作为全球首个开源的万亿参数推理大模型,该模型隶属于蚂蚁Ling2.0家族项目,标志着国内企业在通用人工智能领域的技术突破已跻身全球第一梯队。

从技术架构来看,Ring-1T-preview采用了Ling-2.0混合专家(MoE)架构,参数规模达到999.71B,接近千亿量级。模型训练过程中,研发团队基于20万亿tokens的高质量多语言语料进行预训练,并创新性地采用"棒冰方法"(ICING)结合自研强化学习系统ASystem展开RLVR(基于价值的强化学习)训练。值得关注的是,该系统中的AReaL框架已提前完成开源,为学术界和产业界提供了可复用的强化学习研究工具。

在性能评测方面,Ring-1T-preview展现出令人瞩目的推理能力。在国际权威的AIME25数学竞赛测试中,模型以92.6分的成绩不仅超越所有已知开源模型,更领先于Google Gemini 2.5 Pro,与GPT-5(无工具使用状态下94.6分)的差距缩小至2分以内。代码能力测试中,模型在CodeForces平台取得94.69分的优异成绩,首次实现对GPT-5的超越。此外,在LiveCodeBench v6编程基准测试和ARC-AGI-v1通用人工智能评估中,Ring-1T-preview均位列开源模型榜首,充分验证了其在复杂推理任务上的综合实力。

为进一步验证模型的极限推理能力,研发团队特别选取IMO25(国际数学奥林匹克竞赛2025年试题)作为测试基准。结果显示,模型能够独立完成第三题的完整证明,并在其余题目中输出部分正确的解题步骤。在多智能体协作场景测试中,通过接入蚂蚁自研的AWorld多智能体框架,模型展现出处理复杂任务的系统思考能力,为后续在自动驾驶、智能决策等领域的应用奠定基础。

目前,Ring-1T-preview的完整代码与模型权重已在Hugging Face平台公开,采用MIT开源协议,允许商业用途。蚂蚁集团表示,作为预览版本,当前模型存在部分技术局限,主要表现为多语种混合生成时的语种一致性控制不足,以及长文本推理过程中出现的重复论证现象。针对这些问题,研发团队计划在正式版Ring-1T中通过持续优化RLVR训练流程,并引入RLHF(基于人类反馈的强化学习)技术进一步提升模型的输出质量和可控性。

行业分析人士指出,万亿参数模型的开源将极大降低大模型研究的技术门槛,推动AI推理技术在金融风控、科学计算、智能制造等垂直领域的快速落地。随着后续迭代优化,Ring-1T系列模型有望在数学推理、代码生成、复杂决策等核心能力上实现更大突破,为通用人工智能的发展提供重要的技术参考范式。

【免费下载链接】Ring-1T-preview项目地址: https://ai.gitcode.com/hf_mirrors/inclusionAI/Ring-1T-preview

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/79727/

相关文章:

  • Qwen3-235B-A22B-Instruct-2507震撼登场:256K超长上下文开启AI全场景应用新纪元
  • 14、Linux Mint 多媒体与用户管理全攻略
  • 15、深入了解Linux Mint用户管理与权限设置
  • 16、Linux用户管理、权限设置与网络连接指南
  • DeepSeek-Coder-V2-Instruct-0724强势登榜Aider LLM排行第二,技术突破引领代码大模型新高度
  • 18、Linux系统文件共享与安全防护指南
  • 字节跳动发布UI-TARS模型:重新定义GUI自动化交互,实现82.8%视觉感知准确率
  • 6.React记忆化处理
  • 20、强化Linux系统安全与高级管理技巧
  • 21、Linux系统高级管理技巧全解析
  • 大模型突破:DeepSeek-OCR掀起视觉记忆革命,重新定义AI信息处理范式
  • 22、高级系统管理与故障排除技巧
  • 2025年12月最新降低知网AI率的攻略,1h手把AI率降低到3%!
  • Cesium快速入门16:Primitive多个实体与颜色修改
  • C语言实现堆排序(附带源码)
  • SolidWorks异形孔向导功能介绍
  • 后台任务与WebSocket实时应用
  • SolidWorks异形孔的类型介绍
  • SQL分析函数`ROW_NUMBER`的兼容性与深度解析
  • Day 11 常见的调参方式
  • Elasticsearch 的倒排索引原理
  • Elasticsearch vs MySQL:查询语法与设计哲学对比
  • 《安卓逆向这档事》demo2----正己大佬
  • 一口气看懂 Android 操作系统架构 ——从“高层 App”一路挖到 “内核深处”
  • 双 Token 机制解析:提升用户体验的安全认证方案
  • ViGEmBus虚拟游戏控制器驱动终极指南:从零到精通的完整教程
  • 单岩藻糖乳糖-N-六糖III:解码生命糖码的精密钥匙 CAS号: 96656-34-7
  • 从课堂例子到实战工具:用 C 语言结构体打造一个迷你学生信息管理系统
  • Kubernetes Master 节点核心组件全景解析
  • SolidWorks倒角设计深度介绍