当前位置: 首页 > news >正文

我写了一个AI图像视频生成工具,免费API+本地部署,分享给大家

事情是这样的

上个月刷到一条新闻,说有个叫Agnes AI的团队,把旗下文本、图片、视频三个模型的API全部免费开放了,无限期。

我当时的第一反应是:这玩意儿靠谱吗?

毕竟“免费”这俩字在AI圈子里,通常意味着:前几次免费 → 用着用着开始收费 → 收得还不便宜。但仔细看了一下,Agnes这次不是搞什么限时活动,是实打实地把API token全部免费了。免费第一周,图片模型就生成了超过200万张图。

说实话,我被触动了。

我平时经常需要做一些配图、封面图,有时候想做个短视频玩玩,但又不想花钱买那些动辄几十美金一个月的AI工具。Midjourney要钱,Runway要钱,Pika也要钱——虽然效果确实好,但对我这种非重度用户来说,每次为了几张图去充会员,总觉得肉疼。

于是我就想:既然API免费,那我能不能自己写个工具,把这些能力包起来,做成一个自己能随便用的东西?

然后就写了这个项目——Agnes Creator Studio

项目地址在这里,觉得有用的话帮忙点个Star⭐️:
👉 https://github.com/you-want/agnes-image-tool

这工具能干啥

简单说,就是一个基于Gradio搭建的Web界面,背后调用Agnes AI的免费API,帮你生成图片和视频。

目前支持的功能有这些:

文生图:输入一段描述文字,AI直接给你生成一张图。支持1024×1024、1024×1792(抖音竖屏)、1792×1024(横屏)等多种尺寸。

图生图:上传一张你自己的图片,然后告诉AI你想转成什么风格。比如你拍了一张风景照,输入“油画风格,印象派”,AI就给你出一张油画版的。重绘强度可以自己调,0.1到1.0,数值越高变化越大。

文生视频:输入文字描述,生成3到18秒的视频。分辨率支持1080p、720p、480p,帧率12到60 FPS可调。宽高比也覆盖了16:9、9:16、1:1、4:3、3:4。

图生视频:上传一张图片,生成动态视频。这个需要图片有公网URL——不过如果你把项目部署在服务器上,上传本地图片也能用。

多图视频/关键帧动画:上传多张图片,在它们之间生成平滑过渡的视频。这个做产品展示或者创意短片挺好用的。

还有历史记录功能,所有生成的内容自动保存,随时查看和下载。

怎么用

如果你想在自己电脑上跑起来,步骤很简单:

# 1. 克隆项目gitclone https://github.com/you-want/agnes-image-tool.gitcdagnes-image-tool# 2. 安装依赖pipinstall-rrequirements.txt# 3. 去 agnes-ai.com 免费拿个 API Key,然后设置环境变量exportAGNES_API_KEY="你的API密钥"# 4. 启动python app.py

然后浏览器打开http://localhost:7860就能用了。

不想本地跑的话,也可以用Docker一键部署,或者直接部署到Hugging Face Spaces上。

整个项目就五个核心文件:app.py(主界面)、api_client.py(API调用)、config.py(配置)、utils.py(工具函数)、styles.py(样式)。代码量不大,结构也清晰,想自己改改也很方便。

技术栈

后端是Python 3.10+,界面框架用的Gradio 6.0。Gradio这东西特别适合做AI工具的快速原型,几行代码就能搭出一个带界面的Demo。

API请求用Requests处理,图片用Base64编码传输。没什么花里胡哨的,主打一个简单能用。

一些真实的感受

写这个项目的过程,让我重新思考了一个问题:AI工具到底应该怎么做?

现在市面上的AI工具,基本上是两个极端。要么是功能极其强大但价格劝退,要么是免费但各种限制——每天只能用几次、有水印、不能商用、排队排到天荒地老。

Agnes这次免费开放API,其实提供了一个第三种可能性:开发者可以基于免费API自己造工具,用户不需要为每一个小需求付费。

对我自己来说,这个工具解决了一个很实际的痛点——我需要配图的时候,打开网页、输入描述、点一下生成,完事。不需要打开Midjourney Discord频道、不需要记复杂的参数、不需要等别人排队。

而且因为是本地部署,所有数据都在自己电脑上,隐私方面也放心。

说点实在的

这个项目肯定比不上那些大厂砸了几千万做的产品。界面不算华丽,功能也不算最全。

但它的核心价值在于:免费、能用、自己说了算。

如果你跟我一样,偶尔需要AI生成点图片视频,又不想为这点需求花冤枉钱,可以试试这个工具。

项目是MIT协议开源的,随便用、随便改、商用也行。有任何问题欢迎提Issue,会持续维护。

最后,如果觉得有用,去GitHub点个Star⭐️就是对我最大的鼓励。

👉 https://github.com/you-want/agnes-image-tool

PS:Agnes的API目前确实是免费的,但未来会不会调整谁也说不准。趁现在能用,赶紧用起来吧。

http://www.jsqmd.com/news/1076681/

相关文章:

  • 2026年AI大模型接口中转服务全维度实测推荐:主流服务商性能成本场景适配完整指南
  • 高度测量用三维光学轮廓仪推荐:国产与进口能力对比分析
  • DonkeyCar油门校准:从PWM信号到ESC驱动的完整指南
  • 第三部分 日志系统实战进阶
  • 防火墙原理与技术
  • KAN神经网络实操指南:从数学定理到科学建模可解释部署
  • 生成式AI在软件开发中的人机协同实践指南
  • 2026小程序开发系统多平台功能与应用全面解析
  • 架构 - 理解架构的演进
  • 3分钟快速上手:Obsidian Excel转Markdown表格完整指南
  • 在macOS上实现Intel无线网卡驱动的技术挑战与解决方案:itlwm项目深度解析
  • Log4j2漏洞复现与防御:从JNDI注入到远程代码执行实战
  • 2026年苏州玻璃间隔纸哪家公司好:无尘度高,抗静电性能强
  • BilldDesk:重新定义开源远程桌面控制的跨平台解决方案
  • 高防 CDN 工作原理拆解 从流量识别到攻击拦截的全流
  • 当微信机器人遇见大模型:如何让算法更懂你的语义接口?
  • ZeroTier:把地球变成一个局域网
  • 我在飞书里养了个“分身”——私聊喊它办事,群里 @ 它干活,还能替我传话
  • 爬虫转大模型:真实开发里的落地路径
  • 层次聚类实战指南:从树状图到可解释业务分组
  • 3分钟掌握PPTist:免费网页版PPT制作工具的完整指南
  • 现场签约40项目!美豪品牌家族品鉴会圆满举行,艺科交出整合赋能答卷
  • Selenium vs Cypress vs Playwright:现代Web自动化测试框架横向评测与选型指南
  • saphana数据库Alert告警:check type: id 130 alert check own certificate expiration date
  • 为什么有的人偏爱 Mac
  • 【Springboot毕设全套源码+文档】基于Java的篮球馆预约系统的设计与实现(丰富项目+远程调试+讲解+定制)
  • 计算机毕业设计之基于ssm的图书分享管理系统
  • 哔哩下载姬视频旋转功能深度解析:从元数据处理到批量操作
  • AIGC赋能测试用例生成:工程化实践与效率革命
  • SGLang:每天处理万亿 token 的 LLM 推理引擎