当前位置: 首页 > news >正文

UniWorld数据集完全指南:724K高质量图像编辑数据集详解

UniWorld数据集完全指南:724K高质量图像编辑数据集详解

【免费下载链接】UniWorldUniWorld: High-Resolution Semantic Encoders for Unified Visual Understanding and Generation项目地址: https://gitcode.com/gh_mirrors/un/UniWorld

UniWorld数据集是一个包含724K高质量图像编辑样本的综合资源库,所有样本的短边均≥1024像素,为图像生成与编辑领域的研究者和开发者提供了丰富的训练素材。该数据集通过GPT-4o筛选自ImgEdit项目,并结合了多种开源数据集的精华,成为当前视觉理解与生成任务中不可或缺的基础资源。

📊 数据集核心特性

1. 超大规模与高质量并存

UniWorld数据集的724K样本经过严格质量控制,确保每个编辑对都具有明确的语义变化和视觉连贯性。数据集采用Qwen2-VL-72B模型对286K长描述样本进行标注,并通过GPT-4o进行精细筛选,最终保留约50%的优质样本。所有图像均满足短边≥1024像素的高分辨率要求,为模型训练提供了丰富的细节信息。

2. 多样化的编辑任务覆盖

数据集涵盖20+图像编辑任务类型,主要包括:

  • 基础编辑:添加、移除、替换、调整等操作
  • 风格迁移:包含StyleBooth-11k和Ghibli-36k等风格数据
  • 结构控制:边缘检测(canny)、深度图(depth)、草图(sketch)等控制信号
  • 专业领域:产品提取、虚拟试穿等商业应用场景

图1:UniWorld数据集包含的多种风格迁移效果展示,展示了同一内容在不同艺术风格下的表现

📂 数据集构成详解

核心数据来源

UniWorld数据集主要由以下几部分构成:

  • imgedit-724k:经GPT-4o筛选的高质量编辑样本,存储占用约2.8TB
  • OmniEdit-368k:过滤后保留的368k图像编辑数据,存储占用204GB
  • SEED-Data-Edit:包含两部分共77k样本,专注于指令引导的图像编辑
  • PromptfixData-18k:图像修复与编辑数据,存储占用9GB

数据文件结构

数据集采用"源图像+标注JSON"的组织方式,典型的data.txt文件格式如下:

data/imgedit/add/add_part0,json/imgedit/laion_add_part0_edit.json,true data/imgedit/remove/remove_part1,json/imgedit/results_remove_laion_part1_edit.json,true

其中第三列指示是否启用区域加权策略,建议对编辑数据设为true,其他数据设为false

🔍 典型应用案例

案例1:图像风格迁移

通过UniWorld数据集训练的模型能够实现多种艺术风格的迁移,从写实到卡通、从油画到素描,如图1所示的风格迁移样例展示了同一人物在不同风格下的视觉效果。

案例2:物体属性编辑

以下展示了基于UniWorld数据集的物体颜色编辑效果,原始黑色运动鞋被编辑为白色版本,保持了原有结构和细节:

图2:原始黑色Nike Air Force 1运动鞋

图3:通过UniWorld模型编辑后的白色版本,保持了原有细节和结构

案例3:高分辨率图像生成

UniWorld数据集包含大量高分辨率图像,如下所示的美食场景图片分辨率达到7748x4470,展示了数据集中图像的细节丰富度:

图4:UniWorld数据集中的高分辨率美食图像样本,展示了丰富的纹理和细节

🚀 快速开始使用

1. 环境准备

git clone https://gitcode.com/gh_mirrors/un/UniWorld cd UniWorld/UniWorld-V1 conda create -n univa python=3.10 -y conda activate univa pip install -r requirements.txt pip install flash_attn --no-build-isolation

2. 数据下载

通过Hugging Face Hub下载数据集:

huggingface-cli download --resume-download LanguageBind/UniWorld-V1 --local-dir ./data

3. 数据验证

使用提供的工具验证数据路径设置:

python univa/serve/check_data.py

📚 数据集详细文档

完整的数据集说明可参考项目官方文档:

  • 数据准备指南
  • 训练配置文件
  • 评估脚本

🔄 数据集更新与扩展

UniWorld团队持续维护和扩展数据集,计划在未来版本中增加:

  • 更多语言的标注支持
  • 动态场景的视频编辑样本
  • 3D物体的多角度编辑数据

研究者可通过项目GitHub页面获取最新更新,或提交新的数据贡献。

📝 引用与致谢

如果使用UniWorld数据集,请引用以下论文:

@article{ye2025imgedit, title={ImgEdit: A Unified Image Editing Dataset and Benchmark}, author={Ye, Yang and He, Xianyi and Li, Zongjian and Lin, Bin and Yuan, Shenghai and Yan, Zhiyuan and Hou, Bohan and Yuan, Li}, journal={arXiv preprint arXiv:2505.20275}, year={2025} }

数据集的构建感谢ImgEdit、OmniEdit、SEED-Data-Edit等开源项目的贡献,以及Qwen2-VL和GPT-4o在数据标注与筛选中的支持。

【免费下载链接】UniWorldUniWorld: High-Resolution Semantic Encoders for Unified Visual Understanding and Generation项目地址: https://gitcode.com/gh_mirrors/un/UniWorld

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/973552/

相关文章:

  • 如何快速搭建AI股票分析平台:多智能体金融交易框架完整指南
  • 从电商金额计算到数据报表:Java保留两位小数的实战场景全解析
  • 3步快速上手Akagi:打造你的智能麻将AI教练完整指南
  • 微信投票链接制作步骤|2026实测教程,3分钟搞定(附免费工具横评) - 微信投票小程序
  • 告别STM32?用FPGA和NIOS II软核处理器,从零搭建一个可定制的片上系统(Quartus 18.1实战)
  • 解密智能歌词引擎:一站式自动化歌词处理实战指南
  • 衡水母婴除甲醛CMA甲醛检测治理公司深度测评:绿呼吸环保稳居榜首 - 一修哥咨询
  • 从源码到实践:深入理解acts_as_follower的实现原理
  • 2026年惠州CPPM报名资料班期怎么确认?众智商学院官网400冯老师费用咨询 - 众智商学院职业教育
  • Java实现生产级Agentic AI系统的核心架构与工程实践
  • 如何在5分钟内完成MobileGestalt文件提取:解锁misakaX全部功能的关键步骤
  • 汽车电子萌新避坑指南:LIN总线协议里的‘隐性’电平、Break场和校验和到底怎么玩?
  • 选Codex还是Claude Code?一篇讲透!从配置到适用场景,再也不纠结​
  • 华阴母婴除甲醛CMA甲醛检测治理公司深度测评:绿呼吸环保稳居榜首 - 一修哥咨询
  • 2026年安徽芜湖汽车供应链岗位SCMP众智商学院试听课报名费用怎么问 - 众智商学院职业教育
  • Umi-OCR在离线文字识别场景中的完整解决方案
  • 从《A Virtual Life》到数字游民:一个前电视制片人的远程工作避坑指南与心理调适
  • React Yelp Clone商家详情页实现:从API数据到UI展示
  • Android音频配置实战:手把手教你读懂audio_policy_configuration.xml(附源码解析)
  • 黄骅母婴除甲醛CMA甲醛检测治理公司深度测评:绿呼吸环保稳居榜首 - 一修哥咨询
  • acts_as_follower与其他社交 gems 对比:为什么它是最佳选择?
  • 如何高效解决硬件监控问题:完整配置优化指南
  • TMC2209寄存器读写避坑指南:从数据手册到串口实战,搞定方向、细分和电流
  • Qt6.5实战:从零封装一个可复用的动态曲线绘制组件(支持拖拽、缩放)
  • 从一次真实的网络广播风暴说起:我是如何用`spanning-tree mode rapid-pvst`命令拯救公司网络的
  • 2026年众智商学院SCMP官网咨询入口:怎么确认报名和费用怎么问 - 众智商学院职业教育
  • 3分钟搞定视频流畅度革命:Flowframes让你的视频瞬间丝滑如丝
  • 衡阳母婴除甲醛CMA甲醛检测治理公司深度测评:绿呼吸环保稳居榜首 - 一修哥咨询
  • 别再手动拖拽了!用MATLAB的dir函数+循环,5分钟搞定上百个TIFF栅格数据的批量读取与导出
  • 上海专业的代账报税公司 - GrowthUME