当前位置: 首页 > news >正文

MiniCPM5-1B - 随身AI智能助手 擅长工具使用和复杂推理,长上下文处理能力强 一键整合包下载

MiniCPM5-1B 是一款由 OpenBMB 团队开发的1B参数(约10亿)小型语言模型,属于 MiniCPM5 系列的第一个版本。外号“面壁小钢炮”,简单说,它就是一个体积小、能力强、适合本地运行的 AI 助手。
MiniCPM5-1B 就是目前最强的小模型之一,专为“本地跑、不想依赖云端”的人设计,在体积和能力之间找到了很好的平衡,特别适合个人开发者、隐私场景和资源受限的环境。

主要特点

超级小巧,省资源:只有1B参数,能轻松跑在手机、笔记本、边缘设备甚至普通电脑上,不需要高端显卡。
1B级别最强(SOTA):在同等大小的开源模型里,整体能力最优秀,尤其在工具调用(Agent)、代码生成、复杂推理上表现突出。
混合思考模式:同一个模型可以“快速回答”或“慢慢思考”。通过 enable_thinking 开关切换,想快就快,想严谨就让它一步步推理(类似 <think> 标签)。
超长上下文:支持 131072 tokens(约10万+字),能一次性处理很长的文档、代码库或对话历史。
好部署:基于标准 Llama 架构,兼容 vLLM、SGLang、Ollama、llama.cpp、LM Studio 等主流工具,还有 GGUF、MLX 等量化版本,手机/电脑本地跑都很方便。
支持工具调用:能很好地调用外部工具、函数,适合做智能 Agent。



应用领域

本地私人助手:手机、电脑上跑的离线 AI 聊天、问答(隐私好、不联网)。
代码助手 / 编程 Agent:写代码、调试、理解代码仓库,特别适合开发者本地使用。
工具使用场景:能调用 API、操作工具的多步任务(比如自动处理工作流)。
长文档处理:分析长 PDF、报告、书籍,或做长上下文推理。
边缘计算 / 设备端 AI:资源有限的设备上运行智能功能(如机器人、IoT、智能硬件)。
桌面宠物 / 趣味应用:官方还做了用它驱动的本地桌面小宠物,交互很有趣。



使用教程:(建议N卡,显存4G起,支持50系显卡)

支持思考/非思考两种模式,输入问题或需求,提交即可。
支持消费级笔记本流畅运行,实测4G显存+8G运存流畅运行。


支持WebUI和GUI两种运行模式,支持api,可对接三方Agent使用
启动后 API 地址为:`http://localhost:8000`
兼容open-ai 格式api,请求参数

{ "model": "minicpm5-1b", "messages": [ {"role": "system", "content": "You are a helpful assistant."}, {"role": "user", "content": "你好"} ], "temperature": 0.9, "top_p": 0.95, "max_tokens": 4096, "stream": false, "thinking_mode": true }

crul格式

curl http://localhost:8000/v1/chat/completions \ -H "Content-Type: application/json" \ -d '{ "model": "minicpm5-1b", "messages": [ {"role": "user", "content": "用Python写一个计算器"} ], "temperature": 0.7, "stream": false }'

下载地址:点此下载

http://www.jsqmd.com/news/930072/

相关文章:

  • 茶叶目标检测实战工程包:YOLOv5训练+多格式数据集适配+模型导出与API预留
  • 想进几个TG技术交流群学习,结果被SMSfee拦了三天
  • 在线去除视频水印怎么操作?全场景方法与优质工具汇总
  • ESP8266通过Whatabot实现WhatsApp消息收发:从环境搭建到智能家居应用
  • Matlab版太阳风粒子运动仿真工具:含电势求解与轨迹可视化
  • 石油光缆抢修升级:鼎讯信通光缆路由追踪仪优势解析
  • 终极指南:在Windows上轻松安装安卓应用的APK-Installer完整教程
  • Claude Code Git 工作流:分支、提交与代码审查怎么配合
  • Visual C++ Redistributable AIO 终极指南:3分钟解决Windows软件运行问题
  • 关系型数据库核心原理拆解:SQL解析、事务引擎、存储结构全链路分析
  • 还在手动熬夜转写讲座录音?2026年这3个微软文字转语音技巧,1分钟转完1小时音频
  • 056、多 GPU 分布式训练实战:DDP 配置、通信后端选型与加速比优化
  • 基于555定时器的振动传感器DIY:从机械触发到电子锁存的完整实现
  • DC-DC升压模块改造LED头灯:原理、实践与续航性能实测
  • 2026青岛翡翠回收权威指南:合扬奢侈品回收,25年标杆护航,高价变现无套路 - 合扬奢侈品交易中心
  • 腾讯云调用IP定位
  • 二维码+IC卡层控型梯控系统,通过二维码扫码 + Mifare One IC卡刷卡双模认证方式实现电梯楼层权限控制。采用IC卡写扇区技术,用户容量无上限,适用于住宅、办公楼、酒店等多种场景
  • EEG与fNIRS多模态融合:基于神经血管耦合的工作压力客观评估
  • 从平面到立体:RPG Maker MV/MZ插件集如何重塑你的游戏视觉体验
  • 【c语言数据结构】——单链表专题
  • 暗黑2存档编辑器终极指南:3分钟学会免费修改D2/D2R游戏角色
  • 2026杭州装修设计公司推荐::杭州足浴会所/KTV装修设计公司推荐+绍兴运动馆/台球会所装修设计公司推荐合集 - 栗子测评
  • Windows 11 LTSC系统恢复微软商店的终极指南:3分钟告别应用荒
  • 旧安卓手机改造智能监控:零成本实现移动侦测与邮件报警
  • Zotero文献管理终极指南:如何用Linter插件自动格式化元数据,提升学术写作效率
  • 抖音视频怎么在线解析提取无水印,手机电脑全渠道高清无损操作详解
  • 从“激光灭蚊神器”爆单说起:出口企业,你的数据扛得住“幸福的烦恼”吗?
  • 软件研发的“工艺方差“,AI能熨平吗?
  • 从怀疑试用到真香,算下来省了八成整理时间!2026抖音学习总结我只推这一个
  • Claude Code vs Cursor:怎么选适合你的 AI 编程工具