当前位置: 首页 > news >正文

申请量超6.6万!小米MiMo-V2.5-Pro-UltraSpeed模型延长体验期,输出速度远超GPT-5.5

6月23日,小米MiMo开放平台宣布延长MiMo-V2.5-Pro-UltraSpeed模型的体验期限,因申请量远超预期。该模型输出速度超1000 tokens/s,价格有优势。

体验延期原因

MiMo-V2.5-Pro-UltraSpeed模型6月9日上线,原体验窗口到6月23日。但截至该日,收到超6.6万个使用申请,涵盖多领域,申请者有世界500强、行业头部企业和个人开发者,所以团队决定延长开放时间。

模型突出优势

这一模型由小米MiMo与AI推理系统团队TileRT联合推出,首次在万亿参数旗舰模型上突破1000 tokens/s输出速度,峰值约1200 tokens/s,还支持100万token超长上下文。实现路径不依赖专用硬件,通过模型和系统侧协同优化达成。

优化实现路径

模型侧采用FP4混合量化,降低模型体积和访存压力,引入DFlash投机解码提升效率。系统侧TileRT定制编译引擎与计算核,减少算子启动和同步开销。底层模型已在Hugging Face开源,许可证为MIT。

定价极具竞争力

UltraSpeed API限时体验价是标准版MiMo-V2.5-Pro的3倍,却有近10倍输出速度提升。其输出定价约18元/百万tokens,远低于Anthropic的Claude Opus。

行业影响与反响

在行业中,1000 tokens/s的速度冲击力大,远超GPT-5.5等。在海外开发者社区引发强烈反响,不过也有人对“万亿参数”可比性存疑。

编辑观点:小米MiMo模型的速度和价格优势显著,有望在大模型领域占据一席之地,后续发展值得关注。

http://www.jsqmd.com/news/1076175/

相关文章:

  • 荣耀定义 Agentic OS:终端将从“应用容器”走向“智能体舞台”
  • 06-LangGraph入门
  • 链博会上的英伟达:“五层蛋糕”AI 生态,多领域展现强大布局野心!
  • 【TEE从入门到精通及实战】55 密钥轮换与生命周期管理:在Enclave内实现无缝旋转
  • 我用 Claude Opus 4.8 做了一次接口评审,记录几个真正有用的 Prompt
  • 四Agent科研协作实战:Codex、Claude Code、OpenClaw、Hermes组成可迭代AI研究团队
  • 2026年6个字体素材网站推荐,设计师常用的字体资源整理
  • 终极ADB图形化管理工具:QtAdb让Android调试从未如此简单
  • V-Ray 7.20.01 for 3ds Max2020-2026 完整版安装教程|GPU 渲染性能全面升级
  • 【零基础AI应用开发】第01章:环境搭建与工具安装(入门篇)
  • PHP文件包含漏洞与Phar反序列化攻击链深度剖析与防御实践
  • 精准选对矩形导向轨,专业制造商该看哪些点
  • RAG+多智能体:金融AI分析的可验证工程实践
  • 机器学习落地闭环:从Notebook到生产环境的实战指南
  • 传统后端程序员,如何利用业余时间3-6个月转行高薪AI应用开发
  • 为什么你收藏了 100 个 Skills,也未必能用得好 AI 编程?
  • 高级 | 系统工程与信息系统基础错题集
  • GPT-3范式迁移:从微调到提示驱动的NLP革命
  • 关闭 VIP 通道(高频踩坑点)
  • 5种实战方案:如何用智能浏览器自动化重构你的工作流
  • 从“问对问题”到“建对系统”:Prompt、Context、Loop、Harness 工程的演变与理解
  • CSRF攻击原理深度解析:从身份冒用到防御实战
  • Appsmith:开源低代码平台,快速构建内部工具
  • 7个已落地AI工程方向:轻量化部署、RAG增强、多模态理解等实操指南
  • 人形机器人全身动作跟踪算法解析:从参考动作、奖励函数到真实机器人部署
  • 在长度2N的数组中找出重复N次的元素(一)
  • 多级蒙特卡洛梯度估计:原理、复杂度分析与在随机优化中的应用
  • 深圳登报声明去哪里办理?深圳登报声明要多少钱?
  • MitoHiFi:5步掌握PacBio HiFi线粒体基因组组装完整指南
  • 向量空间 JBoltAI TokUI 底层设计理念与技术演进