当前位置：首页 > news >正文

零 Token 消耗！Agnes 多模态 Agent 全栈实战指南

news 2026/6/3 3:14:51

文生图 · 文生视频 · 智能 Agent 一站式接入，真正让 AI 落地工作流

前言：我为什么开始用 Agnes？

在折腾了一堆 AI 工具之后，我最大的痛点不是模型效果，而是——每次调用都在烧钱。输入 token、输出 token，还有各种隐性计费，一个稍微复杂点的 Agent 工作流跑下来，账单看得人心疼。

直到我发现了 Agnes，才算找到了真正能「无感」使用的 AI 平台。本文不是硬广，是我实际配置并跑通了图像生成、视频生成、多轮 Agent 对话之后，把整套流程整理出来分享给大家。如果你也在找一套零 token 消耗、功能完整的多模态 AI 解决方案，这篇可以直接当手册用。

一、Agnes 平台概览：三大核心模型

Agnes 目前对外提供三个主力模型，覆盖了日常 AI 工作流的主要场景：

Agnes2.0 Flash —— 智能 Agent 模型，支持工具调用、多轮对话、自定义知识库，适合构建自动化工作流
Agnes-Image-2.1-Flash —— 图像生成模型，文生图效果出色，支持风格定制，出图速度快
Agnes-Video-V2.0 —— 视频生成模型，支持文生视频，适合内容创作、产品演示等场景

💡重点：Agnes 平台的模型调用不消耗用户的 token 配额，按实际 API 请求计费，对于高频场景尤其友好。

二、注册账号并获取 API Key

整个接入流程非常标准，跟 OpenAI 的操作逻辑基本一致，熟悉的同学五分钟内可以跑通。

2.1 创建 API 密钥

图1：Agnes 平台 API 密钥管理页面

注意密钥只在创建时完整显示一次，务必即时保存。后续列表中只展示前缀和后缀（如 sk-m9b5I...9Aobph）。

2.2 接口地址

Agnes 提供兼容 OpenAI 协议的 API，接口地址格式为：

https://api.agnes-ai.com/v1/chat/completions

三、将 Agnes 模型接入 WorkBuddy（以自定义模型为例）

Agnes 支持通过任何兼容 OpenAI 协议的客户端接入。下面以 WorkBuddy 为例，演示完整的配置流程。WorkBuddy 是目前体验较好的 AI 工作台之一，支持多模型切换、技能调用、Agent 工作流等功能。

3.1 打开「添加模型」配置弹窗

在 WorkBuddy 主界面底部工具栏，点击模型选择器 → 展开列表后，找到「+ 配置自定义模型」入口（见下图红色箭头标注）。

图2：WorkBuddy 模型选择器，底部有「+ 配置自定义模型」入口

3.2 填写配置信息

在弹出的「添加模型」对话框中，按如下内容填写各字段：

提供商：选择「自定义 / Custom」
接口地址：填入 Agnes API 地址
API Key：粘贴第二步中保存的密钥
模型名称：根据需要填写，例如 agnes2-flash 或 agnes-image-2.1-flash

图3：WorkBuddy 添加自定义模型配置弹窗

高级配置中，建议勾选「工具调用」和「图片输入」，这样 Agnes2.0 Flash 的 Agent 能力和多模态输入都能正常使用。配置完成后点击「保存」即可。

四、实战一：Agnes-Image-2.1-Flash 文生图

Agnes 图像模型支持自然语言描述直接出图，接入 WorkBuddy 后，可以通过技能（Skill）调用的方式触发图像生成。

4.1 在 WorkBuddy 中触发图像生成

配置完成后，在对话框中使用 @agnes-image-api 技能，直接用中文描述你想要的画面，模型会自动理解并生成。

图4：WorkBuddy 中调用 agnes-image-api 技能，用自然语言生成图像

如上图，输入「我要猫咪在海边散步图片」，系统触发工具调用，Agnes-Image-2.1-Flash 完成图像生成。整个过程不需要编写任何 Prompt 模板。

4.2 生成效果示例

以下是 Agnes-Image-2.1-Flash 实际输出的图像效果（提示词：猫咪在海边散步，黄昏光线，写实风格）：

图5：Agnes-Image-2.1-Flash 生成效果 —— 猫咪海边散步

画面细节丰富，光线处理自然，毛发质感和背景的海浪、贝壳都有较高的真实感，适合内容创作、社媒配图等场景。

五、实战二：Agnes2.0 Flash Agent 能力

Agnes2.0 Flash 的核心优势在于 Agent 工作流：支持多步骤工具调用、联网搜索、文件处理、自定义知识库等能力，适合构建自动化流程。

5.1 API 调用示例（Python）

下面是一个简单的 Python 示例，展示如何通过 API 调用 Agnes2.0 Flash 进行多轮对话：

import openai client = openai.OpenAI( api_key="sk-your-agnes-api-key", base_url="https://api.agnes-ai.com/v1" ) response = client.chat.completions.create( model="agnes2-flash", messages=[ {"role": "system", "content": "你是一个专业的数据分析助手"}, {"role": "user", "content": "请帮我分析这份销售数据的趋势"} ] ) print(response.choices[0].message.content)

💡Agnes2.0 Flash 完全兼容 OpenAI SDK，存量代码只需替换 api_key 和 base_url 两个参数，迁移成本极低。

5.2 工具调用（Function Calling）

Agnes2.0 Flash 支持标准的 tools 参数格式，可以接入自定义函数、数据库查询、外部 API 等工具。以下是定义工具的示例结构：

tools = [ { "type": "function", "function": { "name": "get_weather", "description": "获取指定城市的实时天气", "parameters": { "type": "object", "properties": { "city": {"type": "string", "description": "城市名称"} }, "required": ["city"] } } } ]

六、实战三：Agnes-Video-V2.0 文生视频

视频生成是 Agnes 平台近期推出的重量级功能。Agnes-Video-V2.0 支持通过文字描述直接生成短视频，适用于：

产品功能演示视频
社交媒体短视频内容
教学/说明类动态图解
创意广告素材生成

接入方式与图像模型相同，在 WorkBuddy 中配置模型名称为 agnes-video-v2 即可，或通过 API 直接调用：

response = client.chat.completions.create( model="agnes-video-v2", messages=[ {"role": "user", "content": "生成一段5秒的产品展示视频，科技感蓝色背景，3D旋转logo"} ] )

七、关于计费：不消耗 token 是什么意思？

很多同学对「不消耗 token」有疑惑，这里解释一下：

Agnes 平台的计费单位是 API 调用次数 / 请求量，而非按输入输出 token 数量计费。这意味着：

无论你的输入内容有多长，不会因为「token超出」而产生额外费用
Agent 多轮对话中的上下文不会随着对话变长而指数级增加成本
批量处理任务时，费用预估更稳定、更可控

💡对于需要频繁调用 AI 的自动化工作流来说，这种计费方式可以显著降低成本不确定性，便于做预算规划。

八、总结

折腾完这一套下来，Agnes 给我最大的感受是「接入成本低、功能覆盖全、计费逻辑清晰」。三个模型分工明确：

Agnes2.0 Flash：日常 Agent 任务、自动化工作流首选
Agnes-Image-2.1-Flash：快速出图、内容创作
Agnes-Video-V2.0：短视频素材生成

如果你正在搭建自己的 AI 工具链，或者想把 AI 能力嵌入到现有业务系统里，Agnes 是值得认真评估的选项。

有问题欢迎评论区交流，我会尽量回复。

— 本文仅供技术参考，如有更新请以官方文档为准 —

查看全文

http://www.jsqmd.com/news/939691/

2026 海外 APP 定制开发报价大揭秘！

深岩银河存档编辑器完整教程：3步实现游戏进度自由调整

三相正序理解

从MySQL转PostgreSQL：一个后端开发者的实战避坑与效率提升指南

深入拆解Xilinx CPRI IP的数据帧：10G速率下IQ数据与控制字如何复用通道？

是的是的1111111111111

告别DLL依赖！用MinGW编译Windows可执行文件的终极静态链接指南（含libgcc、libstdc++、libwinpthread）

空间机械臂Simulink力位协同控制仿真套件（含刚柔耦合建模与闭环响应验证）

Element UI Tabs里ECharts显示不全？一个`ResizeObserver` API帮你全自动搞定

避开这些坑！个人站长选择免签支付平台的3个关键决策点（附平台对比清单）

2026年微型电主轴实测评测：浮动刀柄、自动换刀主轴、进口电主轴、钻孔动力头、风冷电主轴、高速电主轴、NAKANISHI研磨机选择指南 - 优质品牌商家

STM32H750 RTC不走时？别慌，这5个坑我帮你踩过了（附完整排查流程）

告别Excel！用Python的Reliability库搞定Weibull分析，从数据拟合到置信区间计算全流程

答辩PPT高效制作方案：百考通AI一站式解决学术汇报难题

从目标检测到图像修复：我是如何把FPN（特征金字塔网络）塞进DeblurGAN-v2的

深度解析：search-plugins架构设计与多引擎集成技术实现

如何在10分钟内搭建原神私服：KCN-GenshinServer一键GUI服务端终极教程

ChatGPhish深度解析：AI时代最危险的钓鱼攻击，ChatGPT如何沦为黑客帮凶

自动驾驶感知入门：手把手教你用Python和Open3D处理激光雷达点云（附ROI与滤波代码）

陈克明“手擀”风波：粮油行业巨头，撞上新消费的“显微镜”

2026年6月6款设计AI采购建议

别再只接3.3V和GND了！ESP8266-01S稳定供电与CH340G串口模块的正确接线方案

学术答辩PPT高效制作方案：百考通AI实战使用测评

滚珠花键预压过量，为何会出现高温抱死故障？

Suno-V3深度体验：除了‘听个响’，AI生成音乐在内容创作中的真实应用场景

Navicat重置工具：macOS上无限试用数据库管理软件的终极解决方案

从STM32转战GD32？FreeRTOS移植的差异点与快速适配指南

用MATLAB和YALMIP复现顶刊论文：手把手教你搞定配电网应急电源预配置（附完整代码）

别再只画图了！用Moldflow分析优化你的灭火器模具（浇口位置、冷却与翘曲实战）

保姆级教程：用海思SS928的BurnTool工具，通过网口给Emmc烧写完整镜像（附分区表修改避坑指南）