当前位置: 首页 > news >正文

ai-image-gen-mcp MCP 服务说明文档

1. 服务概述

一句话简介:多模型AI图像生成MCP Server。支持Seedream (Doubao)、SDXL、FLUX.1 Schnell/Dev。30x RTX 4090 GPU加速。

  • 服务名称:ai-image-gen-mcp
  • 版本号:最新版本
  • 开发者/提供方:zhaohongyuziranerran
  • 协议类型:MCP (Model Context Protocol)

2. 核心功能

列出该MCP服务提供的主要功能点:

  • 多模型支持:支持4种主流AI图像生成模型 - Seedream 5.0、SDXL、FLUX.1 Schnell、FLUX.1 Dev
  • 文本生成图像:根据文本描述生成高质量图像
  • 图像转换:支持图像到图像的转换和变换
  • 图像处理:提供图像放大(2x/4x)、背景移除等功能
  • 批量生成:支持批量生成多个图像
  • 风格迁移:支持8种艺术风格的迁移应用
  • GPU加速:30块RTX 4090 GPU加速本地模型推理

3. 使用场景

描述该服务适合在什么情况下使用:

  • 创意设计:快速生成创意图像,支持多种艺术风格
  • 内容创作:为文章、博客、社交媒体生成配图
  • 图像编辑:图像放大、背景移除、风格迁移等后期处理
  • 批量生产:批量生成大量图像,提高工作效率
  • 原型设计:快速生成设计原型和概念图

4. 接入方式

4.1 服务端点

在线访问地址:http://www.mzse.com/image-gen-mcp/

GitHub仓库:https://github.com/zhaohongyuziranerran/ai-image-gen-mcp

4.2 认证与权限

该服务需要配置以下环境变量:

  • SEEDREAM_API_KEY:Seedream API密钥(默认内置)
  • SEEDREAM_BASE_URL:Seedream API基础URL
  • COMFYUI_URL:本地ComfyUI端点(默认:http://localhost:8188)
  • IMAGE_OUTPUT_DIR:生成图像的输出目录

4.3 数据格式

所有请求和响应均采用JSON格式。图像生成结果返回图像URL或Base64编码。

4.4 服务器配置

在MCP客户端配置中添加服务:

{ "mcpServers": { "ai-image-gen-mcp": { "url": "http://www.mzse.com/image-gen-mcp/" } } }

5. 接口定义

该服务提供10个核心工具:

工具名称功能描述主要参数
generate_image文本生成图像prompt, model, style, size
generate_from_image图像到图像转换image, prompt, model
list_models列出可用模型
get_model_info获取模型详情和定价model_id
upscale_image超分辨率放大(2x/4x)image, scale
remove_background背景移除image
batch_generate批量生成图像prompts, model, style
get_generation_status检查任务状态task_id
style_transfer应用艺术风格image, style
image_variation生成图像变体image, num_variations

5.1 支持的模型

模型提供商速度质量成本
Seedream 5.0Doubao API~17秒¥0.04/图
SDXL本地 4090~5秒免费
FLUX.1 Schnell本地 4090~3秒免费
FLUX.1 Dev本地 4090~15秒最佳免费

5.2 支持的艺术风格

该服务支持8种艺术风格:

  • photorealistic:照片写实风格
  • anime:动漫风格
  • oil-painting:油画风格
  • watercolor:水彩风格
  • 3d-render:3D渲染风格
  • pixel-art:像素艺术风格
  • chinese-ink:中国水墨风格
  • cyberpunk:赛博朋克风格

6. 快速开始

6.1 环境要求

  • Python 3.8+
  • FastMCP 2.x
  • GPU(推荐):NVIDIA RTX 4090或更高配置
  • ComfyUI(用于本地模型)

6.2 示例代码

本地安装
# 安装依赖 pip install -r requirements.txt # 运行(stdio模式 - 用于Claude/WorkBuddy) python server.py # 运行(HTTP模式 - 用于远程访问) python server.py --transport http --port 8009
生成图像示例
generate_image( prompt="a cyberpunk cat jumping over neon signs", model="flux-schnell", style="cyberpunk", size="1024x1024" )
图像放大示例
upscale_image( image="path/to/image.jpg", scale=4 )
背景移除示例
remove_background( image="path/to/image.jpg" )
风格迁移示例
style_transfer( image="path/to/image.jpg", style="oil-painting" )

7. 注意事项

  • 模型选择:根据需求选择合适的模型,平衡速度、质量和成本
  • GPU加速:本地模型需要GPU支持,推荐使用RTX 4090或更高配置
  • API密钥:使用Seedream API需要配置API密钥
  • 输出目录:建议配置IMAGE_OUTPUT_DIR环境变量指定输出目录
  • 部署方式:支持stdio和HTTP两种传输模式,推荐使用在线访问方式
  • 许可证:采用MIT开源许可证
http://www.jsqmd.com/news/1098873/

相关文章:

  • 数据安全检查,这3个API盲区最容易被问穿
  • Windows 11 点击“电源和电池”设置直接闪退?罪魁祸首竟然是Sensor Service!
  • 机器学习与模式识别 第一章 机器学习导论 考点压缩
  • 吃透Spring事务 :核心原理,传播机制,隔离级别,使用场景
  • 自动化测试框架选型与Robot Framework环境搭建实战指南
  • Windows Defender深度控制架构设计与系统级安全策略管理实现
  • 基于改进YOLOv8与无人机航拍的电动自行车违规行为智能检测系统实战
  • E-Hentai下载器完整指南:如何轻松批量下载并打包图片资源
  • 如何快速部署Python自动化脚本:京东商品预约下单的完整解决方案
  • 第一次学 volatile 关键字,我看了三遍才搞懂它到底在干嘛
  • 如何免费使用Outfit字体:9种字重打造专业品牌设计的完整指南
  • 别再傻傻手写了!Python一行代码判断是不是数字,爽到飞起
  • Ansible自动化运维实战:从入门到精通,轻松管理服务器集群
  • JVM 运行时数据区 —— 5 大块内存
  • C++ Primer Plus 重读精讲 _ 指针进阶全集:三类const指针辨析、指针数组数组指针硬核区分、指针地址传参、工控函数双向改参实战
  • VMware虚拟机组网通信全链路解析(ESXi 7.0+vSphere 8.0实测验证)
  • 面向对象——多态
  • Focus架构:视觉语言模型的高效加速方案
  • 群辉Nas部署GitServer随笔
  • 别再被Python列表拷贝坑了!浅拷贝深拷贝,一个不注意就让你代码崩盘
  • 如何快速查找 *Bash* 命令的*类型*?
  • File和IO
  • 与你的 Elasticsearch 数据对话:使用 Google ADK 和 MCP 构建一个实时语音 agent ,分为 3 个组件
  • 5分钟快速上手:RedisDesktopManager-Windows终极可视化数据库管理工具完整指南
  • 告别串口乱码!STM32F401RCT6用Arduino框架点灯+串口打印保姆级教程
  • C#工业视觉实战:集成工业相机与YOLOv8实现缺陷检测系统
  • 探索兴趣爱好的内涵
  • 廖雪峰Python2教程PDF!20行代码秒杀C语言1000行,速度慢?谁在乎
  • 别再让激光器‘发烧’了!手把手教你用运放搭建高精度恒流源(附LTspice仿真文件)
  • 如何生成字母或数字的*序列*?