当前位置: 首页 > news >正文

目前最全的计算机视觉公开数据集汇总 持续更新 400+数据集

总计:47个类别,涵盖约400+个具体数据集

这47个类别基本覆盖了计算机视觉的全部主流研究领域,从底层图像处理(去噪/增强/修复)到中层视觉(检测/分割/跟踪),再到高层理解(识别/问答/推理),以及3D视觉、多模态学习和特殊应用场景。

目录

一、通用视觉基础数据集(分类/检测/分割)

二、自动驾驶与智能交通

三、视频理解与动作识别

四、3D视觉与点云(物体/场景)

五、遥感与航空图像

六、医疗影像(诊断/分割/重建)

七、视觉-语言多模态(CLIP/LLM训练)

八、专业领域与新兴任务

九、数据集聚合平台(一站式检索)

十、细粒度视觉分类(Fine-Grained Visual Classification)

十一、行人重识别(Person Re-identification)

十二、第一人称/自我中心视角视觉(Egocentric Vision)

十三、医学影像(补充)

十四、低光/夜间视觉增强

十五、图像去雾(Dehazing)

十六、图像去雨(Deraining)

十七、立体匹配与光流(Stereo Matching & Optical Flow)

十八、情感计算与面部属性

十九、人脸检测

二十、农业与植物表型

二十一、零售与自动结算

二十二、工业异常检测

二十三、视频目标跟踪(Visual Object Tracking)

二十四、多目标跟踪(Multi-Object Tracking, MOT)

二十五、图像修复(Image Inpainting)

二十六、阴影检测与去除(Shadow Detection/Removal)

二十七、反射去除(Reflection Removal)

二十八、单目深度估计(Monocular Depth Estimation)

二十九、事件相机/神经形态视觉(Event-based Vision)

三十、虚拟试穿与时尚(Virtual Try-on & Fashion)

三十一、文档理解(Document Understanding)

三十二、步态识别(Gait Recognition)

三十三、视觉问答(Visual Question Answering, VQA)

三十四、显著性目标检测(Salient Object Detection)

三十五、图像协调(Image Harmonization)

三十六、视觉地点识别(Visual Place Recognition)

三十七、3D点云分割(Point Cloud Segmentation)

三十八、视频超分辨率(Video Super-Resolution)

三十九、图像质量评估(Image Quality Assessment)

四十、骨架动作识别(Skeleton-Based Action Recognition)

四十一、神经辐射场/神经渲染(NeRF & Neural Rendering)

四十二、伪装目标检测(Camouflaged Object Detection, COD)

四十三、水下图像增强(Underwater Image Enhancement)

四十四、全景分割(Panoptic Segmentation)

四十五、视频异常检测(Video Anomaly Detection)

四十六、人群计数(Crowd Counting)

四十七、小样本学习(Few-Shot Learning)


一、通用视觉基础数据集(分类/检测/分割)

表格

数据集发布机构规模与特点适用任务下载地址
ImageNet-1K/21K斯坦福李飞飞团队1400万+图像,2万+类别,CV领域黄金标准图像分类、预训练
http://www.jsqmd.com/news/478590/

相关文章:

  • WHAT - 浏览器缓存机制系列(二)强缓存、协商缓存和启发式缓存
  • CausalML高级技巧:特征选择与因果效应异质性分析
  • ROS以及工控机环境配置
  • Gorilla技术播客系列:与AI先驱探讨函数调用的未来
  • 去毛刺机设计(机械毕业设计)
  • 为什么我的电脑不能升级Windows 11?终极兼容性检测工具深度解析
  • OCRmyPDF内存优化:处理大型PDF文件的内存管理技巧
  • Leetcode_155. 最小栈
  • 软考中级--数据库系统工程师 备考建议和考试注意事项
  • 电脑CPU速度很快,为什么3dMax还会出现卡顿的情况?
  • 牛客_JZ31 栈的压入、弹出序列
  • Slurm高级特性详解:QoS、资源限制与作业优先级配置指南
  • Gorilla网络安全应用:威胁检测API集成与响应自动化完整指南
  • Leetcode_43. 字符串相乘
  • 【C++BFS】690. 员工的重要性
  • 【AutoSAR】只讲干货!使用EB Tresos配置Port
  • 终极指南:Upspin核心架构完全解析——三大服务如何构建全球命名系统
  • 【亲测免费】推荐项目:Dubbo Spring Boot Starter - 简化你的微服务开发
  • 从XML到JSON:Proteus如何革命性重构Android动态布局开发
  • 【亲测免费】 推荐使用:KCloud-Platform-IoT - 超强微服务架构的物联网云平台
  • SpringBoot集成RestTemplate请求高德地图API
  • PyCaret批量预测:处理大规模推理任务的终极指南
  • 排序——快速排序
  • MessagePack-CSharp未来发展方向:终极路线图与功能规划指南
  • 10个终极API安全测试技巧:awesome-web-hacking实战指南
  • 如何使用IPED进行文件类型统计趋势分析:掌握数字证据随时间变化的关键技巧
  • Python枚举类型完全指南:从入门到精通的10个实用技巧
  • 掌握mmdetection模型剪枝技术:通道剪枝与结构剪枝完整指南
  • vue3横向滚动日期选择器组件(Element Plus)
  • 空间函数在 ABAP SQL 里到底是什么