当前位置: 首页 > news >正文

MiMo Vision Router:让纯文本模型秒变多模态

MiMo Vision Router:让纯文本模型秒变多模态

  • MiMo Vision Router:让纯文本模型秒变多模态
    • 背景
    • 架构
    • 安装
      • 前置条件
      • OpenCode
      • Claude Code
    • 技术实现
      • OpenAI 路径 (OpenCode)
      • Anthropic 路径 (Claude Code)
    • 配置
    • 故障排除
    • 项目结构
    • 链接
    • 总结

MiMo Vision Router:让纯文本模型秒变多模态

背景

小米 MiMo 模型有两个版本:

  • MiMo V2.5:支持多模态(图片+文本)
  • MiMo V2.5 Pro:纯文本,不支持图片

问题:使用 Pro 模型时无法直接发送图片。

方案:本地代理自动将图片转为文字描述,Pro 模型也能"看懂"图片。


架构

消息+图片

检测图片

替换为文字

返回

AI 助手

本地代理
localhost:3456

V2.5 提取描述

V2.5 Pro

支持的 AI 助手

AI 助手API 格式安装命令
OpenCodeOpenAI.\setup.ps1
Claude CodeAnthropic.\setup-claude.ps1

安装

前置条件

  • Node.js v18+
  • 小米 MiMo API Key

OpenCode

git clone https://github.com/JoJohanse/mimo-vision-router.git cd mimo-vision-router.\setup.ps1# 重启 OpenCode,选择 "MiMo V2.5 Pro (Auto Vision)" 模型

Claude Code

.\setup-claude.ps1# 使用启动器.\start-claude.ps1# 或手动$env:ANTHROPIC_BASE_URL ="http://127.0.0.1:3456"claude

技术实现

OpenAI 路径 (OpenCode)

// 检测图片functionopenaiHasImages(content){returnArray.isArray(content)&&content.some(p=>p.type==='image_url');}// 用 V2.5 描述图片asyncfunctionopenaiDescribeImages(textParts,imageUrls,apiKey){constvisionContent=[{type:'text',text:`Context:${textParts.join('\n')}\n\nDescribe the image(s)...`},...imageUrls.map(url=>({type:'image_url',image_url:{url}}))];constresult=awaithttpsRequest('/chat/completions',{model:'mimo-v2.5',messages:[{role:'user',content:visionContent}],max_tokens:4096,},apiKey);returnJSON.parse(result.body).choices?.[0]?.message?.content||'';}// 替换图片为文字asyncfunctionopenaiProcessMessage(msg,apiKey){if(!openaiHasImages(msg.content))returnmsg;// ... 提取图片,调用 describeImages,替换为 [Image: 描述]}

Anthropic 路径 (Claude Code)

// 检测图片functionanthropicHasImages(content){returnArray.isArray(content)&&content.some(p=>p.type==='image');}// Anthropic base64 → data URLfunctionanthropicImageToDataUrl(img){return`data:${img.source.media_type};base64,${img.source.data}`;}// 格式转换:Anthropic → OpenAIfunctionanthropicToOpenAI(body){constmessages=[];if(body.system)messages.push({role:'system',content:body.system});// ... 转换 messages 格式return{model:body.model,messages,max_tokens:body.max_tokens||4096};}

两条路径完全独立,不共用图片处理逻辑。


配置

编辑proxy/server.js

constPORT=3456;// 代理端口constUPSTREAM_HOST='token-plan-cn.xiaomimimo.com';// 小米 APIconstVISION_MODEL='mimo-v2.5';// 多模态模型

安装脚本会自动修改 OpenCode 配置文件。


故障排除

# 检查代理状态curl http://127.0.0.1:3456/health# 检查端口占用netstat-ano|findstr :3456# 手动启动node proxy/server.js

图片未处理?

  • OpenCode:确认选择 “MiMo V2.5 Pro (Auto Vision)”
  • Claude Code:确认环境变量ANTHROPIC_BASE_URL已设置

项目结构

mimo-vision-router/ ├── setup.ps1 # OpenCode 安装 ├── setup-claude.ps1 # Claude Code 安装 ├── README.md / CLAUDE.md # 文档 └── proxy/ ├── server.js # 代理服务器 ├── mcp-launcher.js # MCP 生命周期管理 └── start.ps1 # 手动管理

链接

  • GitHub: https://github.com/JoJohanse/mimo-vision-router (如果帮到您,麻烦给个star)
  • 小米 MiMo: https://xiaomimimo.com

总结

mimo-vision-router 通过本地代理解决了 MiMo V2.5 Pro 不支持图片的问题。

✅ 一键安装
✅ 支持 OpenCode + Claude Code
✅ 完全透明,用户无感知
✅ 开源免费


转载请注明出处。

http://www.jsqmd.com/news/926203/

相关文章:

  • 我写了十年代码,直到AI出现
  • 【Android】手机屏幕劫持防护
  • Keil C51编译器Makefile选项解析与替代方案
  • Kimi LeetCode 2911. 得到 K 个半回文串的最少修改次数 Java实现
  • 机械臂角度识别 机械臂自由度识别 yolov8机械臂关键点检测模型部署+教程+代码+数据集+工业应用
  • 量子计算冗余架构:双星设计提升容错与并行能力
  • 避坑指南:在Ubuntu 20.04上从零搭建XTDrone仿真环境(附解决MAVROS连接失败)
  • 数据结构 算法解释,排序、查找
  • 【元器件专题】MOS管内部结构
  • LEGO框架:空间加速器设计的动态数据流优化
  • 2026年Q2炉渣钢渣供应商评测:上阳建材适配性分析 - 优质品牌商家
  • 2026年汽车静电阻隔面料实测评测:四家企业横向对比 - 优质品牌商家
  • 阿里云旗舰级顶级代理商|年销4亿+官方可查,直享7折,稳靠不跑-路
  • 主流人工智能模型与工具开发商概览
  • 别再死记硬背了!用C语言手写一个test_and_set(),彻底搞懂操作系统硬件锁
  • 书匠策AI:你的课程论文救急神器,用过的人都说“真香“
  • 乐高wedo《套圈游戏》
  • AMP算法实战:用Python从零实现压缩感知信号恢复(附完整代码与避坑指南)
  • 实战落地+数据可视化:6月最新重庆优质GEO优化服务商榜单深度测评 - 品牌官
  • Codex+Vscode+Remote ssh+ 服务器自定义第三方API配置保姆级教程
  • 2026年苏州防水维修标杆机构专业市场分析与全场景渗漏治理选型适配指南 专业防水公司排名推荐(2026年5月防水补漏最新TOP权威排名) - 鼎壹万修缮说
  • 最新Python爬虫实战(多线程爬虫篇)——案例26:多线程爬取斗罗大陆3龙王传说小说批量保存到txt(附上完整爬虫代码)
  • 深度学习焊接缝识别 yolov8焊接缝缺陷分割代码+web部署
  • 2026年5月秦皇岛酒店之选:为何万怡酒店脱颖而出 - 2026年企业资讯
  • 基于MATLAB的simulink汽车防抱死仿真模型,汽车制动防抱死模型ABS仿真模型
  • 集团首都公报:放飞炬人集团内政署批准起草《出口劳务法案》《劳务产能调整和AIQI技艺法案》
  • 2026年5月国内静电压合面料主流供应商排行盘点:硅胶静电吸附遮阳帘专用皮革/耐高温静电吸附硅胶革/排行一览 - 优质品牌商家
  • RTOS学习笔记,二、多任务管理
  • 【案例分享】我从失败中学到的架构教训
  • 值得学习的嵌入式开发材料