当前位置: 首页 > news >正文

Seedream 3.0 填充:OneReward 使下一代掩码编辑成为可能

概述

本文提出了一个新颖的强化学习框架 OneReward,用于综合处理图像生成中的多个编辑任务。

传统的图像编辑模型通常是专门针对个别任务(如内画(填充)、外画(增强)、对象移除和文本渲染)进行训练的,由于每个任务的数据分布和评估标准不同,限制了其通用性。

此外,传统的基于人类偏好的强化学习(RLHF)需要针对每个任务和评估维度建立不同的奖励模型,这对训练效率和一致性提出了挑战。

通过使用 VLM 作为唯一的奖励模型,本研究中的 OneReward 可以实现符合人类偏好的一致评价,同时区分任务和评价标准。
这样就能将不同的任务整合到一个统一的编辑模型中,创建一个兼具效率和性能的创新框架。

此外,应用该框架开发的 Seedream 3.0 Fill 在性能上优于最先进的商业和开源模型。

建议的方法

OneReward 的核心机制是使用单一 VLM 作为奖励模型,综合处理多个任务和多维评价标准。

OneReward 将任务 ID 和评价标准嵌入评价查询中,并确定哪个 VLM 更适合输入图像对。
这种基于比较的设计允许在保留不同评价维度之间不一致性的同时进行训练。

在学习过程中,现有的扩散模型被用作参考模型,而策略模型则与部分去噪生成的图像进行比较。
在此过程中,奖励模型使用二进制 "是/否 "输出来确定哪些图像符合人类偏好,并将这一概率作为强化学习的信号。

这样,该模型就能在多任务环境中同时学习多维偏好,并实现统一的性能提升,而无需额外的特定任务 SFT(监督微调)。

实验

作者将使用 OneReward 训练的 Seedream 3.0 Fill 的性能与最先进的模型(如 Adobe Photoshop、Ideogram 和 Flux Fill [Pro])进行了比较。

评估在四个主要任务中进行:图像填充、增强(有/无提示)、对象移除和文本渲染,从多个维度进行测量,包括可用率、文本一致性、结构一致性、美学质量和移除质量。
结果表明,Seedream 3.0 填充法在所有任务中的表现都优于现有方法,特别是在图像增强(无提示)中,可用率达到 87.54%,明显优于其他模型。

此外,在物体去除方面,它的去除质量高达 86.33%,生成的不需要的物体最少。
此外,在基于人工评估的 "好-同-坏 "测试中,与基本模型相比,带有 OneReward 的模型显著提高了 "好 "决策的比例。

这些实验表明,OneReward 可以通过单一奖励模型有效地完成各种编辑任务,从而实现统一的高性能图像编辑。

http://www.jsqmd.com/news/129922/

相关文章:

  • 开题报告写到崩溃?百考通AI平台,一句话生成专业初稿,3分钟搞定!
  • 高校专利数据1985-2025)
  • 设计模式:责任链模式
  • 开题报告毫无头绪?百考通AI平台,一句话生成完整初稿,3分钟搞定导师满意方案!
  • 基于Spring Boot和Dubbox的分布式API接口与后台管理系统设计与实现
  • 微型磁力泵进阶之选:卓越性能如何化解行业应用难题 - 品牌2025
  • MHT-FN321 光纤组合导航系统技术指南:轻量化高帧率导航的工程实现与协议解析
  • 基于微服务架构的智能运维堡垒机系统设计与实现
  • 人工智能项目成果的9个标准
  • 突破选型困局:从介质特性到系统集成的避坑法则 - 品牌2025
  • 百考通AI:您的智能项目开发加速器,海量源码即取即用!
  • 一文了解:Multi-Agent多智能体核心架构的协调与调度模块是如何工作的?
  • CNAS软件测评机构【Gatling查询参数和表单数据queryParam、formParam和multipartFormData参数处理方式】
  • 湖北宜昌非开挖修复优选服务商湖北侦汇探:精准修复专业铸就口碑 - 朴素的承诺
  • 第三方CMA软件评测机构Gatling超时设置connectionTimeout、requestTimeout参数使用
  • 开题报告写到凌晨三点?百考通AI平台,3分钟给你一份“能过审”的专业初稿!
  • AI训练图片视频数据集供应商—卓特视觉用亿级语料加速模型商业化 - 品牌2026
  • 当10年架构师拿起AI:不是写不动了,是写得太快了
  • 潮流新纪元:专业活动策划执行与布置,打造沉浸式体验
  • 蓝丝带:很多妈妈不知道,这家专业产后康复品牌已服务数十万家庭
  • 开题报告毫无头绪?百考通AI平台,一句话生成专业初稿,3分钟搞定导师认可方案!
  • AI绘画总翻车?掌握这2个技巧,小白也能生成惊艳作品
  • 区块链 Web3 项目的费用
  • 选产康门店管理系统别乱挑!玄微云 3 大核心优势,从业者必看
  • 【笔记】pwn.college之Pwntools Tutorials(pwn.college)
  • 基于java + vue蘑菇百科系统(源码+数据库+文档)
  • 全球化电商平台的测试架构设计
  • 格(Lattice)
  • 智能决策引擎:高效处理来源标签
  • 技术赋能新浪潮:从桌卡到腕带,深度评测丽屏展架如何定义活动物料三大潮流趋势