当前位置: 首页 > news >正文

零 Token 消耗!Agnes 多模态 Agent 全栈实战指南

文生图 · 文生视频 · 智能 Agent 一站式接入,真正让 AI 落地工作流

前言:我为什么开始用 Agnes?

在折腾了一堆 AI 工具之后,我最大的痛点不是模型效果,而是——每次调用都在烧钱。输入 token、输出 token,还有各种隐性计费,一个稍微复杂点的 Agent 工作流跑下来,账单看得人心疼。

直到我发现了 Agnes,才算找到了真正能「无感」使用的 AI 平台。本文不是硬广,是我实际配置并跑通了图像生成、视频生成、多轮 Agent 对话之后,把整套流程整理出来分享给大家。如果你也在找一套零 token 消耗、功能完整的多模态 AI 解决方案,这篇可以直接当手册用。

一、Agnes 平台概览:三大核心模型

Agnes 目前对外提供三个主力模型,覆盖了日常 AI 工作流的主要场景:

  • Agnes2.0 Flash —— 智能 Agent 模型,支持工具调用、多轮对话、自定义知识库,适合构建自动化工作流
  • Agnes-Image-2.1-Flash —— 图像生成模型,文生图效果出色,支持风格定制,出图速度快
  • Agnes-Video-V2.0 —— 视频生成模型,支持文生视频,适合内容创作、产品演示等场景

💡重点:Agnes 平台的模型调用不消耗用户的 token 配额,按实际 API 请求计费,对于高频场景尤其友好。

二、注册账号并获取 API Key

整个接入流程非常标准,跟 OpenAI 的操作逻辑基本一致,熟悉的同学五分钟内可以跑通。

2.1 创建 API 密钥

登录 Agnes 平台后,进入「设置 → API 密钥」页面,点击「创建新的密钥」,为密钥命名(比如 test_01),保存后复制备用。

图1:Agnes 平台 API 密钥管理页面

注意密钥只在创建时完整显示一次,务必即时保存。后续列表中只展示前缀和后缀(如 sk-m9b5I...9Aobph)。

2.2 接口地址

Agnes 提供兼容 OpenAI 协议的 API,接口地址格式为:

https://api.agnes-ai.com/v1/chat/completions

三、将 Agnes 模型接入 WorkBuddy(以自定义模型为例)

Agnes 支持通过任何兼容 OpenAI 协议的客户端接入。下面以 WorkBuddy 为例,演示完整的配置流程。WorkBuddy 是目前体验较好的 AI 工作台之一,支持多模型切换、技能调用、Agent 工作流等功能。

3.1 打开「添加模型」配置弹窗

在 WorkBuddy 主界面底部工具栏,点击模型选择器 → 展开列表后,找到「+ 配置自定义模型」入口(见下图红色箭头标注)。

图2:WorkBuddy 模型选择器,底部有「+ 配置自定义模型」入口

3.2 填写配置信息

在弹出的「添加模型」对话框中,按如下内容填写各字段:

  • 提供商:选择「自定义 / Custom」
  • 接口地址:填入 Agnes API 地址
  • API Key:粘贴第二步中保存的密钥
  • 模型名称:根据需要填写,例如 agnes2-flash 或 agnes-image-2.1-flash

图3:WorkBuddy 添加自定义模型配置弹窗

高级配置中,建议勾选「工具调用」和「图片输入」,这样 Agnes2.0 Flash 的 Agent 能力和多模态输入都能正常使用。配置完成后点击「保存」即可。

四、实战一:Agnes-Image-2.1-Flash 文生图

Agnes 图像模型支持自然语言描述直接出图,接入 WorkBuddy 后,可以通过技能(Skill)调用的方式触发图像生成。

4.1 在 WorkBuddy 中触发图像生成

配置完成后,在对话框中使用 @agnes-image-api 技能,直接用中文描述你想要的画面,模型会自动理解并生成。

图4:WorkBuddy 中调用 agnes-image-api 技能,用自然语言生成图像

如上图,输入「我要猫咪在海边散步图片」,系统触发工具调用,Agnes-Image-2.1-Flash 完成图像生成。整个过程不需要编写任何 Prompt 模板。

4.2 生成效果示例

以下是 Agnes-Image-2.1-Flash 实际输出的图像效果(提示词:猫咪在海边散步,黄昏光线,写实风格):

图5:Agnes-Image-2.1-Flash 生成效果 —— 猫咪海边散步

画面细节丰富,光线处理自然,毛发质感和背景的海浪、贝壳都有较高的真实感,适合内容创作、社媒配图等场景。

五、实战二:Agnes2.0 Flash Agent 能力

Agnes2.0 Flash 的核心优势在于 Agent 工作流:支持多步骤工具调用、联网搜索、文件处理、自定义知识库等能力,适合构建自动化流程。

5.1 API 调用示例(Python)

下面是一个简单的 Python 示例,展示如何通过 API 调用 Agnes2.0 Flash 进行多轮对话:

import openai client = openai.OpenAI( api_key="sk-your-agnes-api-key", base_url="https://api.agnes-ai.com/v1" ) response = client.chat.completions.create( model="agnes2-flash", messages=[ {"role": "system", "content": "你是一个专业的数据分析助手"}, {"role": "user", "content": "请帮我分析这份销售数据的趋势"} ] ) print(response.choices[0].message.content)

💡Agnes2.0 Flash 完全兼容 OpenAI SDK,存量代码只需替换 api_key 和 base_url 两个参数,迁移成本极低。

5.2 工具调用(Function Calling)

Agnes2.0 Flash 支持标准的 tools 参数格式,可以接入自定义函数、数据库查询、外部 API 等工具。以下是定义工具的示例结构:

tools = [ { "type": "function", "function": { "name": "get_weather", "description": "获取指定城市的实时天气", "parameters": { "type": "object", "properties": { "city": {"type": "string", "description": "城市名称"} }, "required": ["city"] } } } ]

六、实战三:Agnes-Video-V2.0 文生视频

视频生成是 Agnes 平台近期推出的重量级功能。Agnes-Video-V2.0 支持通过文字描述直接生成短视频,适用于:

  • 产品功能演示视频
  • 社交媒体短视频内容
  • 教学/说明类动态图解
  • 创意广告素材生成

接入方式与图像模型相同,在 WorkBuddy 中配置模型名称为 agnes-video-v2 即可,或通过 API 直接调用:

response = client.chat.completions.create( model="agnes-video-v2", messages=[ {"role": "user", "content": "生成一段5秒的产品展示视频,科技感蓝色背景,3D旋转logo"} ] )

七、关于计费:不消耗 token 是什么意思?

很多同学对「不消耗 token」有疑惑,这里解释一下:

Agnes 平台的计费单位是 API 调用次数 / 请求量,而非按输入输出 token 数量计费。这意味着:

  • 无论你的输入内容有多长,不会因为「token超出」而产生额外费用
  • Agent 多轮对话中的上下文不会随着对话变长而指数级增加成本
  • 批量处理任务时,费用预估更稳定、更可控

💡对于需要频繁调用 AI 的自动化工作流来说,这种计费方式可以显著降低成本不确定性,便于做预算规划。

八、总结

折腾完这一套下来,Agnes 给我最大的感受是「接入成本低、功能覆盖全、计费逻辑清晰」。三个模型分工明确:

  • Agnes2.0 Flash:日常 Agent 任务、自动化工作流首选
  • Agnes-Image-2.1-Flash:快速出图、内容创作
  • Agnes-Video-V2.0:短视频素材生成

如果你正在搭建自己的 AI 工具链,或者想把 AI 能力嵌入到现有业务系统里,Agnes 是值得认真评估的选项。

有问题欢迎评论区交流,我会尽量回复。

— 本文仅供技术参考,如有更新请以官方文档为准 —

http://www.jsqmd.com/news/939691/

相关文章:

  • 2026 海外 APP 定制开发报价大揭秘!
  • 深岩银河存档编辑器完整教程:3步实现游戏进度自由调整
  • 三相正序理解
  • 从MySQL转PostgreSQL:一个后端开发者的实战避坑与效率提升指南
  • 深入拆解Xilinx CPRI IP的数据帧:10G速率下IQ数据与控制字如何复用通道?
  • 是的是的1111111111111
  • 告别DLL依赖!用MinGW编译Windows可执行文件的终极静态链接指南(含libgcc、libstdc++、libwinpthread)
  • 空间机械臂Simulink力位协同控制仿真套件(含刚柔耦合建模与闭环响应验证)
  • Element UI Tabs里ECharts显示不全?一个`ResizeObserver` API帮你全自动搞定
  • 避开这些坑!个人站长选择免签支付平台的3个关键决策点(附平台对比清单)
  • 2026年微型电主轴实测评测:浮动刀柄、自动换刀主轴、进口电主轴、钻孔动力头、风冷电主轴、高速电主轴、NAKANISHI研磨机选择指南 - 优质品牌商家
  • STM32H750 RTC不走时?别慌,这5个坑我帮你踩过了(附完整排查流程)
  • 告别Excel!用Python的Reliability库搞定Weibull分析,从数据拟合到置信区间计算全流程
  • 答辩PPT高效制作方案:百考通AI一站式解决学术汇报难题
  • 从目标检测到图像修复:我是如何把FPN(特征金字塔网络)塞进DeblurGAN-v2的
  • 深度解析:search-plugins架构设计与多引擎集成技术实现
  • 如何在10分钟内搭建原神私服:KCN-GenshinServer一键GUI服务端终极教程
  • ChatGPhish深度解析:AI时代最危险的钓鱼攻击,ChatGPT如何沦为黑客帮凶
  • 自动驾驶感知入门:手把手教你用Python和Open3D处理激光雷达点云(附ROI与滤波代码)
  • 陈克明“手擀”风波:粮油行业巨头,撞上新消费的“显微镜”
  • 2026年6月6款设计AI采购建议
  • 别再只接3.3V和GND了!ESP8266-01S稳定供电与CH340G串口模块的正确接线方案
  • 学术答辩PPT高效制作方案:百考通AI实战使用测评
  • 滚珠花键预压过量,为何会出现高温抱死故障?
  • Suno-V3深度体验:除了‘听个响’,AI生成音乐在内容创作中的真实应用场景
  • Navicat重置工具:macOS上无限试用数据库管理软件的终极解决方案
  • 从STM32转战GD32?FreeRTOS移植的差异点与快速适配指南
  • 用MATLAB和YALMIP复现顶刊论文:手把手教你搞定配电网应急电源预配置(附完整代码)
  • 别再只画图了!用Moldflow分析优化你的灭火器模具(浇口位置、冷却与翘曲实战)
  • 保姆级教程:用海思SS928的BurnTool工具,通过网口给Emmc烧写完整镜像(附分区表修改避坑指南)