当前位置：首页 > news >正文

申请量超6.6万！小米MiMo-V2.5-Pro-UltraSpeed模型延长体验期，输出速度远超GPT-5.5

news 2026/6/25 17:34:44

6月23日，小米MiMo开放平台宣布延长MiMo-V2.5-Pro-UltraSpeed模型的体验期限，因申请量远超预期。该模型输出速度超1000 tokens/s，价格有优势。

体验延期原因

MiMo-V2.5-Pro-UltraSpeed模型6月9日上线，原体验窗口到6月23日。但截至该日，收到超6.6万个使用申请，涵盖多领域，申请者有世界500强、行业头部企业和个人开发者，所以团队决定延长开放时间。

模型突出优势

这一模型由小米MiMo与AI推理系统团队TileRT联合推出，首次在万亿参数旗舰模型上突破1000 tokens/s输出速度，峰值约1200 tokens/s，还支持100万token超长上下文。实现路径不依赖专用硬件，通过模型和系统侧协同优化达成。

优化实现路径

模型侧采用FP4混合量化，降低模型体积和访存压力，引入DFlash投机解码提升效率。系统侧TileRT定制编译引擎与计算核，减少算子启动和同步开销。底层模型已在Hugging Face开源，许可证为MIT。

定价极具竞争力

UltraSpeed API限时体验价是标准版MiMo-V2.5-Pro的3倍，却有近10倍输出速度提升。其输出定价约18元/百万tokens，远低于Anthropic的Claude Opus。

行业影响与反响

在行业中，1000 tokens/s的速度冲击力大，远超GPT-5.5等。在海外开发者社区引发强烈反响，不过也有人对“万亿参数”可比性存疑。

编辑观点：小米MiMo模型的速度和价格优势显著，有望在大模型领域占据一席之地，后续发展值得关注。

查看全文

http://www.jsqmd.com/news/1076175/

荣耀定义 Agentic OS：终端将从“应用容器”走向“智能体舞台”

06-LangGraph入门

链博会上的英伟达：“五层蛋糕”AI 生态，多领域展现强大布局野心！

【TEE从入门到精通及实战】55 密钥轮换与生命周期管理：在Enclave内实现无缝旋转

我用 Claude Opus 4.8 做了一次接口评审，记录几个真正有用的 Prompt

四Agent科研协作实战：Codex、Claude Code、OpenClaw、Hermes组成可迭代AI研究团队

2026年6个字体素材网站推荐，设计师常用的字体资源整理

终极ADB图形化管理工具：QtAdb让Android调试从未如此简单

V-Ray 7.20.01 for 3ds Max2020-2026 完整版安装教程｜GPU 渲染性能全面升级

【零基础AI应用开发】第01章：环境搭建与工具安装（入门篇）

PHP文件包含漏洞与Phar反序列化攻击链深度剖析与防御实践

精准选对矩形导向轨，专业制造商该看哪些点

RAG+多智能体：金融AI分析的可验证工程实践

机器学习落地闭环：从Notebook到生产环境的实战指南

传统后端程序员，如何利用业余时间3-6个月转行高薪AI应用开发

为什么你收藏了 100 个 Skills，也未必能用得好 AI 编程？

高级 | 系统工程与信息系统基础错题集

GPT-3范式迁移：从微调到提示驱动的NLP革命

关闭 VIP 通道（高频踩坑点）

5种实战方案：如何用智能浏览器自动化重构你的工作流

从“问对问题”到“建对系统”：Prompt、Context、Loop、Harness 工程的演变与理解

CSRF攻击原理深度解析：从身份冒用到防御实战

Appsmith：开源低代码平台，快速构建内部工具

7个已落地AI工程方向：轻量化部署、RAG增强、多模态理解等实操指南

人形机器人全身动作跟踪算法解析：从参考动作、奖励函数到真实机器人部署

在长度2N的数组中找出重复N次的元素（一）

多级蒙特卡洛梯度估计：原理、复杂度分析与在随机优化中的应用

深圳登报声明去哪里办理？深圳登报声明要多少钱？

MitoHiFi：5步掌握PacBio HiFi线粒体基因组组装完整指南

向量空间 JBoltAI TokUI 底层设计理念与技术演进

体验延期原因

模型突出优势

优化实现路径

定价极具竞争力

行业影响与反响

相关文章：