小米 MiMo-V2.5-Pro 竞品深度分析报告
小米 MiMo-V2.5-Pro 竞品深度分析报告
数据截至:2026年5月4日 | 来源:Reuters、Asia Financial、Xiaomi官网、mejba.me、DesignForOnline、aimadetools.com、BenchLM.ai、AIBase等
一、公司概览
| 项目 | 详情 |
|---|---|
| 公司 | 小米集团(Xiaomi Corporation) |
| 上市状态 | 港交所上市,股票代码 1810.HK |
| 成立 | 2010年 |
| CEO & 创始人 | 雷军(Lei Jun) |
| 主营业务 | 智能手机、IoT 硬件、电动汽车、AI 模型 |
| 营收(2025财年) | ~$460亿美元(约3300亿人民币,推断) |
| AI 三年投资计划 | 至少600亿人民币(~$87亿美元),雷军2026年3月19日宣布 |
| 本年度 AI 预算 | 超160亿人民币(已超此前披露目标) |
| IoT 设备保有量 | 8亿+台(全球最大消费级 IoT 生态之一) |
战略背景:小米 AI 押注不是聊天机器人,而是**“AI Agent + 物理世界”**——将大模型嵌入手机、汽车(SU7)、智能家居设备,形成数据飞轮。雷军原话:“个人和企业都需要主动拥抱 AI 时代。”(来源:Reuters, 2026-03-19)
二、产品拆解——MiMo-V2.5-Pro
2.1 产品定位
“为 Agent 时代而生的旗舰多模态大模型”——2026年4月22日发布,是小米迄今最强模型,在前代 MiMo-V2-Pro(文本+代码)的基础上,整合了多模态(图像/音频/视频),并显著提升了长程 Agent 能力。
2.2 技术规格
| 规格项 | 参数 |
|---|---|
| 架构 | MoE(Mixture-of-Experts)混合专家 |
| 总参数量 | 1.02万亿(1.02T) |
| 每次推理激活参数 | 42B(约4%激活比例) |
| 注意力机制 | 混合注意力(Hybrid Attention,密集+稀疏混合) |
| 上下文窗口 | 100万 token(1M) |
| 最大输出 | 131,072 tokens |
| 模态支持 | 文本 + 图像 + 音频 + 视频(全模态) |
| 开源协议 | MIT License(允许商用) |
| 权重发布 | Hugging Face 公开下载 |
| 发布日期 | 2026年4月22日 |
2.3 核心能力
① 长程 Agent 能力(最核心差异化)
可在单次会话中完成1000+ 次工具调用而不丢失上下文,这是大多数模型难以做到的。官方示例:
PKU SysY 编译器(Rust 实现):672次工具调用,4.3小时完成,北大课程隐藏测试集 233/233 满分
视频编辑桌面软件:1868次工具调用,11.5小时,8192行代码,含多轨时间线、音频混音、AI配音
模拟电路设计(LDO):在180nm CMOS工艺中完成FVF-LDO设计,达成6项性能指标
② 多模态原生设计
V2.5 将前代分离的 V2-Pro(文字)和 V2-Omni(多模态)合并为单一模型,原生支持图像/视频/音频理解,而非外挂适配器。
③ Token 高效率
内部测试宣称比 Kimi K2.6 少用42%tokens 完成同等任务,比同级竞品节省 20–40% 成本。
2.4 核心基准测试
| 基准 | MiMo-V2.5-Pro | Claude Opus 4.6 | GPT-5.4 |
|---|
