当前位置: 首页 > news >正文

Ideogram-V3 Edit API 调用完全手册

Ideogram‑V3 Edit

Ideogram‑V3 Edit 是 Ideogram 3.0 模型的图像局部编辑(Inpainting)接口,核心是用蒙版指定区域、用提示词重绘该区域,同时保留原图其余部分不变。

一、核心定位与能力

  • 核心功能:基于蒙版的局部图像编辑(Inpainting)
    • 上传原图 + 蒙版(白色=要编辑区域)
    • 用提示词描述蒙版区域的新内容
    • AI 重绘蒙版区,其余像素保持原样
  • V3 增强
    • 更高真实感、光影与细节还原
    • 精准文本渲染(适合海报、Logo 编辑)
    • 支持角色一致性(Character Reference)
    • 可搭配风格参考、背景替换、换脸等场景

二、API 调用(官方 / 第三方)

1. 官方 Edit V3 接口

  • Endpoint:https://api.ideogram.ai/v3/edit
  • 请求方式:POSTmultipart/form-data
  • 必填参数
    • image:原图文件(JPG/PNG/WebP,≤10MB)
    • mask:蒙版文件(与原图同尺寸,白色=编辑区)
    • prompt:描述蒙版区内容的提示词
  • 可选参数
    • rendering_speed:生成速度(FAST/BALANCED/QUALITY
    • magic_prompt:自动优化提示词(ON/OFF/AUTO
    • seed:随机种子(0–2³¹‑1,复现结果)
    • num_images:生成数量(默认 1)
  • 响应:返回编辑后图像 URL(有效期 24 小时)
  • 【OpenAI】获取OpenAI API Key的多种方式全攻略:从入门到精通,再到详解教程!

2. 第三方封装示例(Fal.ai)

  • Endpoint:https://fal.run/fal‑ai/ideogram/v3/edit
  • 参数:image_urlmask_urlprompt为必填
  • 示例请求
{"image_url":"https://example.com/original.jpg","mask_url":"https://example.com/mask.png","prompt":"A golden retriever wearing a red bandana","rendering_speed":"BALANCED","num_images":1}

三、使用流程(通用)

  1. 准备原图与蒙版(同尺寸,白色标记要修改区域)
  2. 构造提示词,描述蒙版区的目标内容
  3. 调用 Edit 接口,传入原图、蒙版、提示词
  4. 获取并下载编辑后的图像

四、适用场景

  • 局部替换:给人物换衣服、给场景加物体
  • 文本编辑:修改海报文字、Logo 内容
  • 背景局部调整:替换天空、添加道具
  • 角色一致性编辑:保持人物面部/发型不变,修改服装/场景

五、与 Ideogram‑V3 Remix 的区别

  • Edit:蒙版+局部重绘,精准控制修改范围,保留其余部分
  • Remix:全图风格/内容调整,无蒙版,整体重绘,保留原图结构
http://www.jsqmd.com/news/533516/

相关文章:

  • DREAMER数据集实战:基于EEG和ECG的多模态情绪识别技术解析
  • 诊疗效率提升20%:星林医疗家具中医诊室改造案例 - 速递信息
  • Poetry:高效Python项目管理实战指南
  • 量子债务转移:把技术屎山抛给平行宇宙——软件测试从业者的生存与反击指南
  • 性价比高的猫粮有哪几种品牌?猫粮排行榜2026最新 - 资讯焦点
  • 看看2026年PP中空板供应商排名,交货快且靠谱的品牌有哪些 - 工业品网
  • 实战演练:基于快马平台构建具备Markdown实时预览的增强型nodepad应用
  • Ostrakon-VL-8B行业落地:社区团购自提点监控——包裹识别、取件合规与滞留预警
  • 银渐层猫吃什么猫粮好?2026英短银渐层最适合的十大猫粮品牌推荐 - 资讯焦点
  • 3分钟极速部署WrenAI:让业务人员也能轻松对话数据库的智能分析神器
  • openclaw 学习资源 与三种沙箱模式的区别及配置
  • 免费实时语音变声器终极指南:3步实现专业级声音转换
  • 猫粮哪款好?2026国产猫粮排行榜前十名推荐 - 资讯焦点
  • 北京香港硕士留学中介哪家强?5 家优质机构测评 - 资讯焦点
  • 保姆级教程:AI超分镜像快速部署,3步完成图片智能放大
  • 国产以太网PHY芯片SR8201与GD32F450的RMII接口实战指南
  • 正则表达式六:字符重复匹配
  • AI智能文档扫描仪性能对比:OpenCV算法与AI模型谁更高效?
  • 知网/维普/万方降AI效果对比:哪款工具表现最稳?
  • 影视站必看!苹果CMS防黑指南:从上传漏洞到DNS的完整防护链
  • **神经编码新视角:用Python实现生物启发式神经信号解码与可视化**
  • 2026年微信SVG动画制作神器:8款微信编辑器实测对比,质感提升指南 - 鹅鹅鹅ee
  • VS Code 终端切换全攻略:从PowerShell到CMD的保姆级教程(附常见问题解决)
  • 4大技术突破让开发者轻松掌握多模态AI:CLIP ViT-H/14全解析
  • LangChain 全链路实战指南:从基础组件到多 Agent 落地,附完整代码案例
  • Phi-4-Reasoning-Vision保姆级教程:宽屏界面适配2K/4K显示器的CSS定制技巧
  • GBase 8a数据库之「穿云箭」:图形化工具GDS解析(上)
  • 在大脑皮层植入反扫描病毒:神经防御工程的系统设计与测试挑战
  • 千问3.5-27B基础教程:FastAPI路由设计/generate与/chat_stream区别
  • 图解STGCN:5张流程图搞懂时空图卷积如何预测堵车(比RNN快10倍!)