当前位置: 首页 > news >正文

iNaturalist开放海量自然数据与计算机视觉挑战

iNaturalist开放海量自然数据,推动计算机视觉研究

iNaturalist应用程序允许全球用户记录和识别野生动植物。如今,由某机构云服务支持的人工智能技术正越来越多地参与到对这些观察数据的分类工作中。该项目从一个硕士项目发展成为一个拥有150万科学家和自然爱好者的社区,其目标是将人与自然连接起来,而计算机视觉技术正在显著提升用户的参与度和体验。

独特的计算机视觉挑战

iNaturalist的数据对计算机视觉领域提出了独特挑战。与互联网上精心拍摄的高质量图片不同,iNaturalist上的照片多为业余人士拍摄,背景复杂、目标模糊、姿态各异。例如,识别快速飞行的燕子,或区分外观极为相似的物种,对计算机模型都是巨大考验。此外,物种存在多种命名方式(学名与俗名)和生命周期形态(卵、幼虫、成虫),进一步增加了识别难度。

这些挑战涵盖了地球上数百万种动植物。目前,托管在某机构云上的iNaturalist已收录超过30万个物种,随着用户持续添加数据,其潜力巨大。研究人员展望,未来可能构建一个能以前所未有的能力推理所有这些事物的系统。

新型机器学习竞赛

自2017年起,研究人员Grant Van Horn和Oisin Mac Aodha开始在计算机视觉与模式识别会议(CVPR)上,利用iNaturalist数据举办竞赛。这些竞赛属于会议中“细粒度视觉分类”研讨会的一部分,旨在评估参赛团队对数据集的分类准确率。

早期竞赛仅构建基础分类体系就是一个挑战,因为世界上没有统一的分类学权威。研究人员花费大量时间学习处理分类法、清理数据。首届竞赛使用了包含85.9万张图片的数据集。第二年,他们引入了具有长尾分布特征的数据集,即许多物种只有少量相关图片。2019年的数据集则缩减至268,243张图片,这些图片在广泛场景下捕捉了高度相似的类别。

经过一年休整,2021年的iNat竞赛规模更大,其训练数据集包含270万张图片,涵盖10,000个物种。竞赛于3月8日开始,5月28日结束。更大的数据集鼓励团队探索机器学习领域中的无监督学习趋势,即模型无需标签,通过寻找数据内在模式进行学习。

每个竞赛参赛作品必须为数据集中的每张图片提供一个预测分类。对于今年的数据集,实现5%的错误率将是“惊人的”成绩。

向开放数据迈进

对大规模图像进行分类的能力,为解答有关物种栖息地、行为和个体差异的广泛科学问题打开了大门。例如,iNaturalist用户已记录了洛杉矶异蜥蜴的交配仪式,这在传统野生动物研究中因私有财产限制而无法实现。

基于此类洞察,研究人员创建了一个新的自然世界任务数据集(NeWT),该数据集超越了物种分类问题,探索了照片中展现的行为和属性相关概念。相关成果将在今年的CVPR会议上展示,并计划举办竞赛,挑战参与者构建能泛化解决这些替代性问题的模型。

目前,竞赛的优胜代码尚未直接部署到iNaturalist应用中,因为最低错误率的代码与能在智能手机上高效运行的代码之间存在性能权衡。然而,竞赛数据集已在计算机视觉和机器学习文献中得到广泛应用,在过去几年中产生了约300次引用。

竞赛托管在Kaggle平台上,吸引了iNaturalist社区之外的众多参赛者。2019年的竞赛吸引了来自全球的213支队伍,获胜者来自中国。

为确保公平,参赛者必须能无障碍访问和处理数据集中成千上万的图片。这些竞赛以及iNaturalist应用本身,都是某机构云上开放数据的一部分,这使得数据访问变得极其便捷。

2020年,iNaturalist获得了某机构机器学习研究奖,该奖项为学术界提供无限制现金和某机构云推广积分,以推动机器学习前沿。这帮助iNaturalist在实施机器学习分类时,继续将数据存储在云上。今年3月,该应用迁移至某机构云开放数据注册中心,确保其约6000万条的庞大观察数据对任何人免费开放。

如今,iNaturalist已从完全由人工驱动,转变为定期提供机器生成的识别结果,这正开始揭示新的潜在研究路径。确保这些数据的长期稳定性和可访问性至关重要。FINISHED
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

http://www.jsqmd.com/news/487056/

相关文章:

  • 卷积神经网络零基础-Alexnet网络
  • D3DCompiler_47.dll怎么解决?当运行某程序出现提示找不到此文件问题
  • 如何通过485通信控制汇川电机
  • 锂离子电池的充电状态和健康状态估计 石墨-磷酸铁锂电池的循环寿命模型 该项目的目标是设计一个强...
  • 光储直流微电网Simulink仿真模型——独立光伏系统能量管理及最大功率点跟踪
  • 2026最新!AI大模型系统学习路线图曝光,从入门到商业落地_AI大模型的详细完整学习路线,从入门到精通
  • 打开软件时弹出提示D3DCompiler_47.dll文件找不到无法启动应用解决方法
  • 文档检索软件self searcher绿色版下载
  • BEV 融合
  • JavaScript同时触发多个函数的5种高效方法
  • 都什么时候了, 你还在担心不会英语不能做外贸?
  • 成都GEO优化公司选择指南?本地标杆和全国企业的对比评测 - 速递信息
  • 解决openclaw下载OMM问题
  • 机房漏水监测系统白皮书:技术革新×应用实践·未来蓝图
  • MOVA“亮剑”AWE2026:让机器人长出“轮足”,用芯片重新定义智慧生活
  • vue+Python云听在线听读音乐小程序的设计与实现
  • 无锡π乐思镜片优质企业
  • 技能提升路线程序,输入目标岗位,倒推所需技能,规划学习顺,少走弯路,快速进阶。
  • 专业提供角膜塑形镜的企业
  • 1/2L7812CV稳压芯片解析
  • 2026年亲测!合肥系统门窗工厂实录
  • 温升测试基础
  • c语言指针解析
  • 【面试真题】能讲讲MySQL的锁机制吗
  • C++ 实战进阶:从编译避坑到打造“转码 - 合并 - 压缩 - 加密”全能视频工厂
  • 使用Maven创建一个web项目
  • 分享一个【连续下跌企稳反弹】指标——在暴跌后的混沌期,精准识别那些即将走牛的黄金坑
  • 基于扩展卡尔曼滤波的车辆质量与道路坡度估计模型(Matlab Simulink 2019+)
  • VMware Workstation 安装 CentOS 7 64位 完整教程
  • 8-Kotlin高阶语法-高阶函数与Lambda