当前位置: 首页 > news >正文

Polyvore数据集完整使用指南

Polyvore数据集完整使用指南

【免费下载链接】polyvore-datasetDataset used in paper "Learning Fashion Compatibility with Bidirectional LSTMs"项目地址: https://gitcode.com/gh_mirrors/po/polyvore-dataset

Polyvore数据集是时尚搭配研究领域的标杆性资源,为AI时尚推荐系统提供了丰富的训练素材。这个开源数据集包含了数十万套精心设计的服装搭配组合,是研究计算机视觉、推荐算法和时尚AI的必备工具。

数据集概述

Polyvore数据集来源于流行的时尚网站Polyvore.com,用户可以在该网站上创建和上传服装搭配数据。该数据集包含21,889套服装搭配,其中17,316套用于训练,1,497套用于验证,3,076套用于测试。

快速开始

获取数据集

首先克隆项目仓库:

git clone https://gitcode.com/gh_mirrors/po/polyvore-dataset

解压数据文件

数据集的核心数据存储在polyvore.tar.gz压缩文件中,解压命令如下:

tar -xzf polyvore.tar.gz

数据结构详解

服装搭配数据格式

数据集中的每个JSON项目包含以下信息:

{ "name": "服装搭配名称", "views": "搭配被查看的次数", "items": [ { "index": "在搭配中的索引位置", "name": "时尚单品描述", "price": "单品价格(美元)", "likes": "单品被点赞次数", "image": "单品图片URL", "categoryid": "单品类别ID" } ], "image": "搭配图片URL", "likes": "搭配被点赞次数", "date": "上传日期", "set_url": "搭配URL", "set_id": "搭配ID", "desc": "搭配描述" }

类别系统

数据集包含丰富的时尚类别,涵盖从服装到配饰的各个领域:

  • 服装类:连衣裙、上衣、外套、裤子等
  • 鞋履类:靴子、高跟鞋、平底鞋、运动鞋等
  • 配饰类:包包、珠宝、眼镜、帽子等
  • 家居类:家具、装饰、照明等
  • 美妆类:化妆品、护肤品、香水等

完整的类别映射关系可以在category_id.txt文件中找到。

核心任务类型

1. 服装搭配推荐

训练数据存储在train_no_dup.jsonvalid_no_dup.jsontest_no_dup.json文件中,分别对应训练集、验证集和测试集。

2. 填空式时尚推荐

fill_in_blank_test.json文件包含用于评估填空式时尚推荐任务的问题。每个问题包含:

  • question:形成问题的时尚单品序列
  • answers:可供选择的多项选项集
  • blank_position:需要填充的空白位置

3. 时尚兼容性预测

fashion_compatibility_prediction.txt文件包含约7,000套搭配,其中4,000套不兼容,3,000套兼容。

数据处理最佳实践

数据预处理技巧

  1. 类别过滤:数据集已删除非时尚类别的单品,如背景、文字和装饰品
  2. 数量限制:对于包含过多时尚单品的搭配,只保留前8个单品
  3. 索引处理:搭配中的单品索引可能不连续

特征工程建议

  • 利用单品描述文本进行自然语言处理
  • 结合价格信息进行经济价值分析
  • 使用点赞数据评估受欢迎程度

应用场景

学术研究

  • 时尚搭配推荐算法研究
  • 跨模态检索技术开发
  • 视觉语言模型训练
  • 个性化推荐系统构建

工业应用

  • 电商平台服装搭配推荐
  • 虚拟试衣间技术开发
  • 时尚趋势分析预测

注意事项

  1. 数据时效性:数据集爬取于2017年2月,部分搭配可能已过时
  2. 图片可用性:原始图片URL已不可用,可通过Kaggle获取相关图片
  3. 版权合规:使用时请遵守相关许可协议

引用说明

如果本数据集对您的研究有帮助,请引用相关论文:

@inproceedings{han2017learning, author = {Han, Xintong and Wu, Zuxuan and Jiang, Yu-Gang and Davis, Larry S}, title = {Learning Fashion Compatibility with Bidirectional LSTMs}, booktitle = {ACM Multimedia}, year = {2017}, }

常见问题解答

Q: 如何获取原始图片数据?A: 原始图片可以通过Kaggle上的Maryland Polyvore Images数据集获取。

Q: 数据集是否包含重复的搭配?A: 数据集文件以"no_dup"命名,表示已去除重复项。

Q: 如何处理搭配中单品数量不一致的问题?A: 建议使用填充或截断技术来处理变长序列。

通过本指南,您可以快速上手Polyvore数据集,开展时尚AI相关的研究和开发工作。

【免费下载链接】polyvore-datasetDataset used in paper "Learning Fashion Compatibility with Bidirectional LSTMs"项目地址: https://gitcode.com/gh_mirrors/po/polyvore-dataset

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/153427/

相关文章:

  • Open-AutoGLM应用场景全景图:9大行业落地案例深度剖析
  • 字节跳动M3-Agent:开启多模态AI的长期记忆革命
  • 2025年口碑好的南京静音发电机/南京发电机行业内口碑厂家排行榜 - 品牌宣传支持者
  • kgateway MCP支持 - 重构Agent间通信新范式实战指南
  • 终极漏洞赏金工具集合:快速安全测试神器大全
  • 深入理解一位全加器:硬件结构系统学习指南
  • 离婚财产分割律师如何选?2025年终5位顶尖律师深度对比及专业推荐! - 十大品牌推荐
  • DiffSynth-Studio AI视频创作工具完整配置与使用指南
  • YOLO模型支持COCO与VOC双格式数据集
  • 6G显存也能玩转2K生图?腾讯混元Image-2.1 GGUF版让AI绘画真正普及
  • 中国节假日智能判断:从传统方法到现代化解决方案
  • 终极指南:如何用XeGTAO实现物理精确的实时环境光遮蔽
  • no stlink delected:使用Zadig工具重装驱动完整示例
  • 2025年终中国离婚财产分割律师推荐:多维度能力横向对比及顶尖专家盘点 - 十大品牌推荐
  • 测试自动化与DevOps的融合革命
  • 免费开源POS系统NexoPOS完整使用指南:快速搭建专业收银平台
  • 如何快速配置AllTalk TTS:文本转语音完整指南
  • 终极指南:如何将飞利浦Hue完美接入HomeKit生态系统
  • 如何在银河麒麟V10上快速搭建完整的网络调试环境
  • Keil4 C51开发环境搭建:新手教程(从零开始)
  • 告别Vim多文件编辑困扰!这些缓冲区管理神器让你效率翻倍 [特殊字符]
  • 自动化测试数据管理最佳实践
  • 2025最新!9个AI论文平台测评:继续教育科研写作全攻略
  • ALBERT模型注意力可视化:从黑盒到透明化的技术突破
  • YOLO模型训练日志监控系统上线,进度实时掌握
  • 2025年终继电器厂家推荐:主流厂商横向测评与高可靠性产品榜单解析 - 品牌推荐
  • 2025年口碑好的防火阀执行机构厂家推荐及选购指南 - 品牌宣传支持者
  • J-Runner-with-Extras 实战指南:从零开始掌握 Xbox 360 改机工具
  • 2025年终继电器厂家推荐:十大品牌权威排名揭晓,基于技术实力与市场口碑深度对比 - 品牌推荐
  • 【大模型自动化新突破】:Open-AutoGLM三大关键技术全曝光