当前位置: 首页 > news >正文

FLUX.1 Kontext:文本驱动图像编辑模型

FLUX.1 Kontext:用文字指令编辑图像

FLUX.1 Kontext 是 Black Forest Labs 推出的新型图像编辑模型。作为 FLUX.1 系列的最新成员,该模型在通过文本提示编辑图像方面表现出色。

测试结果显示,Kontext 能够提供准确且效果出色的编辑结果。该模型在性能和成本效益上均优于某机构的 4o/gpt-image-1 模型。

该系列包含三个版本,其中两个现已可用,另一个开源权重版本即将发布:

  • FLUX.1 Kontext [pro]:面向图像编辑的最先进模型,提供高质量输出、优秀的指令遵循能力和一致的结果。
  • FLUX.1 Kontext [max]:高级模型,在保持处理速度的前提下,实现最大性能、更强的指令遵循能力和高质量文字生成。
  • 即将推出:FLUX.1 Kontext [dev]:开源权重、指导蒸馏版本的 Kontext。

基于 Kontext 的能力,在 Replicate 平台上创建了一系列模型集合,展示其应用场景:

  • 多图像融合:将两张图像合二为一
  • 肖像系列:从单张图像生成一系列肖像
  • 发型变换:改变人物的发型和颜色
  • 标志性地点:将人物置于著名地标前
  • 专业头像:从任意图像生成专业级头像

通过 API 调用 Kontext

与 Replicate 平台上的所有模型一样,只需几行代码即可通过 API 调用 Kontext。

以下是使用 Replicate JavaScript 客户端调用 Kontext Pro 的示例:

importReplicatefrom"replicate";constreplicate=newReplicate();constmodel="black-forest-labs/flux-kontext-pro";constinput={prompt:"Make this a 90s cartoon",input_image:"https://replicate.delivery/pbxt/N55l5TWGh8mSlNzW8usReoaNhGbFwvLeZR3TX1NL4pd2Wtfv/replicate-prediction-f2d25rg6gnrma0cq257vdw2n4c.png",};constoutput=awaitreplicate.run(model,{input});console.log(output.url())

Kontext 的应用能力

图像编辑模型允许通过指令引导图像的变更。这意味着可以使用文本提示进行微调或大幅转换,同时保留原始图像作为起点。无论是改变汽车颜色、替换背景,还是为肖像赋予全新风格,只需通过文本告知 Kontext 即可实现。

Kontext 在快速图像编辑方面表现出色。在人物图像编辑中,无论变更大小,人物的身份特征都能得到良好保持。

风格迁移

在进行风格迁移时,具体的提示词会产生显著差异。应避免使用模糊的指令,明确指定具体风格,如"印象派绘画"或"水彩素描"。参考知名艺术运动或艺术家有助于更清晰地引导模型。

如果风格标签效果不佳,可以描述其关键特征,如"可见的笔触、厚重的颜料纹理和丰富的色彩深度"。如需保留某些元素,也应明确说明。

文本编辑

Kontext 能够直接编辑图像中的文字,无需重新创建标志、海报或标签。最清晰的方式是引用需要更改的确切文字。

处理文本时的一些通用建议:

  • 使用可读性强的字体,高度风格化的文字效果可能不佳
  • 明确需要保留的内容,如需保持字体风格应特别说明
  • 尽可能匹配文本长度,避免因长度变化导致布局意外改变

角色一致性

Kontext 在多次编辑过程中能保持良好的角色一致性。从清晰的参考描述开始,明确说明变更的内容。如需保持同一人物,需说明需要保留的面部、表情、服装等特征。

在编辑背景和场景时,为保持角色一致性,可能需要明确要求保持主体的相同位置、比例或姿势。简单的提示可能导致过多解读空间,建议使用更详细的描述性提示。

商业使用

在 Replicate 上直接使用 Kontext 生成的图像可自由用于商业项目,包括应用程序、营销或其他商业用途。只需在 Replicate 上运行 Kontext 或其衍生模型,即可将生成内容用于商业目的。

提示词技巧

FLUX Kontext 具有出色的 versatility。无论是调整服装、将照片重新构想为油画,还是替换标志性文字,关键在于编写清晰、具体且必要时分步进行的提示词。

FLUX Kontext 的提示词编写要点:

  • 具体明确:使用清晰、详细的语言,指定精确的颜色,准确描述视觉元素,选择直接的动作动词,避免模糊术语
  • 从简开始:先进行基础变更,测试小修改后逐步扩展,利用 Kontext 支持的迭代编辑特性
  • 有意保留:明确指出需要保持不变的元素,使用"保持相同面部特征"或"维持原始构图"等表述保护关键元素
  • 必要时迭代:将复杂编辑分解为小步骤,按顺序进行大幅变更更易管理
  • 直接命名主体:使用描述性短语如"短黑发女性"或"红色汽车",避免使用模糊的代词
  • 文本使用引号:编辑文本时精确表达,使用"将’x’替换为’y’"的格式效果更佳
  • 明确控制构图:编辑场景时,如需保持拍摄角度或构图需明确说明
  • 谨慎选择动词:"转换"一词暗示全面重制,如需更多控制,使用"改变服装"或"替换背景"等具体动作FINISHED
    更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
    对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)
http://www.jsqmd.com/news/398995/

相关文章:

  • Glck hat mir nie gegeben。
  • 2月聚焦!国内受人认可的东方美学珠宝定制排行推荐,东方秩序/高端珠宝/东方美学珠宝,东方美学珠宝品牌口碑推荐 - 品牌推荐师
  • 题解:最大子段和3
  • 《数字信号处理》学习笔记
  • 柳梦梅
  • 题解:单词解密
  • 2026新年快乐
  • 摆脱论文困扰! 8个降AI率工具测评:自考降AI率全攻略
  • 盘点台州提供宠物腹腔镜绝育的医疗机构,宠物/异宠/狗狗体检/宠物内科/24小时宠物医院,宠物绝育医院哪家靠谱 - 品牌推荐师
  • 自动化测试之魂:Selenium 与 TestNG 深度集成内核、Page Object 模型实战与 Web UI 交付质量指南
  • 如何选择试验机厂家?这几家品牌值得关注,摩擦系数仪/分析仪/试验机/测试仪/测厚仪/检测仪/扭矩仪,试验机企业排行榜单 - 品牌推荐师
  • 横评后发现,一键生成论文工具,千笔·专业论文写作工具 VS 万方智搜AI
  • 题解:删数最大子段和
  • 摆脱论文困扰!10个AI论文写作软件测评:本科生毕业论文+开题报告高效工具推荐
  • 对比一圈后 9个一键生成论文工具深度测评:MBA毕业论文与科研写作必备推荐
  • 股市赚钱学概论:赚钱理之九,赚守住的钱
  • 六角晶格结构是一种常见的晶体结构,其中原子或分子排列成六角形的周期性网络。 在这种结构中
  • 初升高英语分班冲刺卷推荐:2026年精选题库解析,入学分班卷/分班卷/暑假练习册/名著考点,冲刺卷源头厂家品牌推荐 - 品牌推荐师
  • 数学 物理:八幕对应史诗
  • 当下-新云天明的童话
  • 2026年宁波高端红茶批发市场观察与厂家推荐,山水印红茶/有机认证高端红茶/生态红茶,高端红茶供应厂家怎么选 - 品牌推荐师
  • mysql replace某个字段并重新复制
  • 数学工具 物理学:一一对应全景
  • 攻防实战视角下的网络弹性重构——CISA红队评估启示与关键基础设施安全升级路径
  • RustSalvo框架上传文件接口(带参数)400错误解决方案
  • 中国科学技术大学计算机考研复试【经验分享】
  • 中国海洋大学计算机考研复试【经验分享】
  • 题解:单词的划分
  • 基于MATLAB搭建的准Z源NpC三电平逆变器拓扑,利用SVPWM调制算法,加入了中性点平衡算...
  • 数学体系全景图