当前位置：首页 > news >正文

两行命令，MiniMax 给 Agent 安了五条腿

news 2026/7/23 5:50:01

我上个月折腾了一个自动化短视频流水线——搜资料用一个 API，出图调 Midjourney，配音找 ElevenLabs，剪辑又得开另一个服务。光胶水代码就写了两天，中间还踩了三个接口超时的坑。当时就一个念头：这破玩意就不能打包成一个命令吗？

今天 MiniMax 发了 MMX-CLI，算是把这个想法落地了。不是又一个命令行工具——这东西从设计之初就是给 Agent 用的，不是给你在终端里敲着玩的。

装完你就知道什么叫一行命令干完以前半天的事

安装就两行：

npminstall-gmmx-cli mmx auth login --api-key sk-xxxxx

完事了。不需要配 MCP Server，不需要读五份不同格式的 API 文档，不需要你写一个 try-catch 套一个 try-catch。

装完之后你的 Agent 可以直接这样用：

mmx text chat--message"帮我写个短视频脚本"mmx image"赛博朋克风格的城市夜景"mmx speech synthesize--text"旁白文案"--outvoice.mp3 mmx video generate--prompt"镜头从天际线推到街巷"mmx music generate--prompt"电子风格BGM"--outbgm.mp3

看到没？文本、出图、配音、视频、配乐——五个环节，一条命令一个。Agent 不需要知道你背后调的是哪家的模型，它只管mmx xxx就行。

还有个我特别喜欢的：mmx search "MiniMax AI 最新动态"，直接搜网，Agent 不用再自己封装搜索接口了。

这玩意跟普通 CLI 有什么不一样？

讲真，一开始我看到"命令行工具"四个字是没什么感觉的——CLI 不都那样吗？装上、敲命令、看输出。

但 MMX-CLI 不一样的地方在于，它解决了 Agent 用命令行时那些让人崩溃的小问题。你让 Agent 跑一个普通 CLI 工具，会遇到什么？输出里混着彩色进度条和 ANSI 转义字符，Agent 解析直接炸。报错信息是一大段英文，Agent 得先读懂才能决定怎么办。参数没传全，程序就挂在那等交互式输入，整个任务卡死。

MMX-CLI 的处理方式让我觉得这团队确实用过 Agent：

stdout 只吐干净数据——文件路径或者 JSON，进度条全扔 stderr，Agent 拿到直接就能用。

错误不跟你废话，直接给退出码。鉴权失败是 1，参数错误是 2，超时是 3——Agent 看一眼数字就知道该重试还是该报错。

还有更省心的：参数不全直接退出，不傻等。长任务比如视频生成，加个--async就转后台了，Agent 可以并行干别的事。

说白了吧，这就是一个"为 Agent 而生"的 CLI。传统 CLI 是给人用的，这个是给 Agent 用的——区别就在这些细节里。

完整工作流长什么样？

假设你想让 Agent 自动做一条科普短视频，前半段先搜资料和写脚本：

mmx search"量子计算最新进展"mmx text chat--system"你是科普编剧"\--message"写个60秒短视频脚本"mmx image"量子计算机概念图，蓝紫色调"

后半段配音、配乐、生成视频一条龙：

mmx speech synthesize--text"旁白内容"\--voiceChinese_gentle_woman--outvoice.mp3 mmx music generate--prompt"科技感轻音乐"\--instrumental--outbgm.mp3 mmx video generate--prompt"量子比特可视化动画"

以前这套流程你得对接四五家服务商，每家的鉴权方式、返回格式、错误处理都不一样。现在一个mmx全搞定，额度统一走 Token Plan，mmx quota看一眼就知道还剩多少。