当前位置: 首页 > news >正文

详细介绍:AI喷洒无人机助力智慧菜田除草新模式,基于最新以注意力为核心的YOLOv12全系列【n/s/m/l/x】参数模型开发构建无人机航拍农田巡检场景下田地杂草智能化检测识别系统

科技发展到今天,无人机喷洒药物已经不是一件新鲜事情了,在很多高危的工作领域中,比如高空电力设备除冰,电力设备部件传送更换等等,无人机都能够扮演非常出色的作用,最近回到老家正值菜田幼苗除草,小片的农田大都还是一家一户几个人背着一个喷雾器然后在地里面人工喷药,大片的标准化农田近些年来已经逐渐有了机械化规模化的意思, 无人机设定路线配置药水一键启动喷药即可,相当高效快捷,传统的这种施药模式就好比是十几年前甚至几十年前的浇地模式一样,大都采用的是大水漫灌的形式,效率低且资源浪费严重,假设遇上水资源匮乏的情况就更加明显了,结合回老家看到的景象突然有个想法就是未来的农药喷灌模式是否允许跟浇地模式的改变学一下吗?传统的大水漫灌改成了喷头式的喷灌,那么无人机广撒网的全覆盖模式能够结合AI技术变成智能化“点喷”?我觉得这个在未来发展一定是能有作为的赛道。

在前文中我们已经进行了相关的开发实践,感兴趣的话可以自行移步阅读即可:

《AI喷洒无人机助力智慧菜田除草新模式,基于YOLOv11全系列【n/s/m/l/x】参数模型开发构建无人机航拍农田巡检场景下田地杂草智能化检测识别系统》

本文主要是想要基于YOLOv12全系列的模型来进行相应的制作实践,首先看下实例效果:

接下来看下实例数据情况:

YOLO系列最近的迭代速度不可谓不快,可能感觉YOLOv11都还没有推出多久,YOLOv12就这么水灵灵地来了,下面是对YOLOv12论文的阅读记录,感兴趣的话可以自行移步阅读即可:

《卷出火花继续飞升,YOLO家族最新成员YOLOv12重磅发布——YOLOv12: Attention-Centric Real-Time Object Detectors以注意力为中心的实时目标检测器》

官方发布的预训练权重如下:

Turbo (default):

Model (det)size
(pixels)
mAPval
50-95
Speed (ms)
T4 TensorRT10
params
(M)
FLOPs
(G)
YOLO12n64040.41.602.56.0
YOLO12s64047.62.429.119.4
YOLO12m64052.54.2719.659.8
YOLO12l64053.85.8326.582.4
YOLO12x64055.410.3859.3184.6

v1.0:

Model (det)size
(pixels)
mAPval
50-95
Speed (ms)
T4 TensorRT10
params
(M)
FLOPs
(G)
YOLO12n64040.61.642.66.5
YOLO12s64048.02.619.321.4
YOLO12m64052.54.8620.267.5
YOLO12l64053.76.7726.488.9
YOLO12x64055.211.7959.1199.0

Instance segmentation:

Model (seg)size
(pixels)
mAPbox
50-95
mAPmask
50-95
Speed (ms)
T4 TensorRT10
params
(M)
FLOPs
(G)
YOLOv12n-seg64039.932.81.842.89.9
YOLOv12s-seg64047.538.62.849.833.4
YOLOv12m-seg64052.442.36.2721.9115.1
YOLOv12l-seg64054.043.27.6128.8137.7
YOLOv12x-seg64055.244.215.4364.5308.7

Classification:

Model (cls)size
(pixels)
Acc.
top-1
Acc.
top-5
Speed (ms)
T4 TensorRT10
params
(M)
FLOPs
(G)
YOLOv12n-cls22471.790.51.272.90.5
YOLOv12s-cls22476.493.31.527.21.5
YOLOv12m-cls22478.894.42.0312.74.5
YOLOv12l-cls22479.594.52.7316.86.2
YOLOv12x-cls22480.195.33.6435.513.7

一共提供了n、s、m、l和x五款不同参数量级的模型。

这里大家保持完全相同的实验参数设置来进行四款模型的开发训练,等待训练完成之后我们来整体进行各项指标的对比分析。

【Precision曲线】
精确率曲线(Precision Curve)是一种用于评估二分类模型在不同阈值下的精确率性能的可视化工具。它经过绘制不同阈值下的精确率和召回率之间的关系图来协助大家了解模型在不同阈值下的表现。
精确率(Precision)是指被正确预测为正例的样本数占所有预测为正例的样本数的比例。召回率(Recall)是指被正确预测为正例的样本数占所有实际为正例的样本数的比例。
绘制精确率曲线的步骤如下:
使用不同的阈值将预测概率转换为二进制类别标签。通常,当预测概率大于阈值时,样本被分类为正例,否则分类为负例。
对于每个阈值,计算相应的精确率和召回率。
将每个阈值下的精确率和召回率绘制在同一个图表上,形成精确率曲线。
根据精确率曲线的形状和变化趋势,可能选择适当的阈值以达到所需的性能要求。
通过观察精确率曲线,我们可以根据需求确定最佳的阈值,以平衡精确率和召回率。较高的精确率意味着较少的误报,而较高的召回率则表示较少的漏报。根据具体的业务需求和成本权衡,允许在曲线上选择合适的执行点或阈值。
精确率曲线通常与召回率曲线(Recall Curve)一起使用,以提供更全面的分类器性能分析,并帮助评估和比较不同模型的性能。

【Recall曲线】
一种用于评估二分类模型在不同阈值下的召回率性能的可视化工具。它依据绘制不同阈值下的召回率和对应的精确率之间的关系图来帮助我们了解模型在不同阈值下的表现。就是召回率曲线(Recall Curve)
指被正确预测为正例的样本数占所有实际为正例的样本数的比例。召回率也被称为灵敏度(Sensitivity)或真正例率(True Positive Rate)。就是召回率(Recall)
绘制召回率曲线的步骤如下:
使用不同的阈值将预测概率转换为二进制类别标签。通常,当预测概率大于阈值时,样本被分类为正例,否则分类为负例。
对于每个阈值,计算相应的召回率和对应的精确率。
将每个阈值下的召回率和精确率绘制在同一个图表上,形成召回率曲线。
根据召回率曲线的形状和变化趋势,允许选择适当的阈值以达到所需的性能要求。
通过通过观察召回率曲线,我们可以根据需求确定最佳的阈值,以平衡召回率和精确率。较高的召回率表示较少的漏报,而较高的精确率意味着较少的误报。根据具体的业务需求和成本权衡,能够在曲线上选择合适的操作点或阈值。
召回率曲线通常与精确率曲线(Precision Curve)一起使用,以给出更全面的分类器性能分析,并帮助评估和比较不同模型的性能。

【mAP0.5】
mAP0.5,也被称为mAP@0.5或AP50,指的是当Intersection over Union(IoU)阈值为0.5时的平均精度(mean Average Precision)。IoU是一个用于衡量预测边界框与真实边界框之间重叠程度的指标,其值范围在0到1之间。当IoU值为0.5时,意味着预测框与真实框至少有50%的重叠部分。
Precision-Recall Curve曲线下面的面积,这个面积越大,说明AP的值越大,类别的检测精度就越高。就是在计算mAP0.5时,首先会为每个类别计算所有图片的AP(Average Precision),然后将所有类别的AP值求平均,得到mAP0.5。AP
mAP0.5重要关注模型在IoU阈值为0.5时的性能,当mAP0.5的值很高时,说明算法能够准确检测到物体的位置,并且将其与真实标注框的IoU值超过了阈值0.5。

【mAP0.5:0.95】
mAP0.5:0.95,也被称为mAP@[0.5:0.95]或AP@[0.5:0.95],表示在IoU阈值从0.5到0.95变化时,取各个阈值对应的mAP的平均值。具体来说,它会在IoU阈值从0.5开始,以0.05为步长,逐步增加到0.95,并在每个阈值下计算mAP,随后将这些mAP值求平均。
这个指标考虑了多个IoU阈值下的平均精度,从而更全面、更准确地评估模型性能。当mAP0.5:0.95的值很高时,说明算法在不同阈值下的检测结果均非常准确,覆盖面广,可以适应不同的场景和应用需求。
对于一些需求比较高的场合,比如安全监控等领域,需保证高的准确率和召回率,这时mAP0.5:0.95可能更适合作为模型的评价标准。
综上所述,mAP0.5和mAP0.5:0.95都是用于评估目标检测模型性能的重要指标,但它们的关注点有所不同。mAP0.5首要关注模型在IoU阈值为0.5时的性能,而mAP0.5:0.95则考虑了多个IoU阈值下的平均精度,从而更全面、更准确地评估模型性能。

【loss曲线】
在深度学习的训练过程中,loss函数用于衡量模型预测结果与实际标签之间的差异。loss曲线则是凭借记录每个epoch(或者迭代步数)的loss值,并将其以图形化的方式展现出来,以便我们更好地理解和分析模型的训练过程。

【F1值曲线】
F1值曲线是一种用于评估二分类模型在不同阈值下的性能的可视化工具。它依据绘制不同阈值下的精确率(Precision)、召回率(Recall)和F1分数的关系图来协助大家理解模型的整体性能。
F1分数是精确率和召回率的调和平均值,它综合考虑了两者的性能指标。F1值曲线能够帮忙大家确定在不同精确率和召回率之间找到一个平衡点,以选择最佳的阈值。
绘制F1值曲线的步骤如下:
运用不同的阈值将预测概率转换为二进制类别标签。通常,当预测概率大于阈值时,样本被分类为正例,否则分类为负例。
对于每个阈值,计算相应的精确率、召回率和F1分数。
将每个阈值下的精确率、召回率和F1分数绘制在同一个图表上,形成F1值曲线。
根据F1值曲线的形状和变化趋势,可以选择适当的阈值以达到所需的性能要求。
F1值曲线通常与接收者操作特征曲线(ROC曲线)一起使用,以帮助评估和比较不同模型的性能。它们提供了更全面的分类器性能分析,可以根据具体应用场景来选择合适的模型和阈值设置。

整体对比分析来看:不难发现五款不同参数量级的模型最终达到了较为相似的结果,没有拉开非常大的差距,这里综合参数量考虑我们最终选定了s系列的模型来作为线上的推理计算模型。

接下来看下s系列模型的详细情况。

【离线推理实例】

【Batch实例】

【混淆矩阵】

【F1值曲线】

【Precision曲线】

【PR曲线】

【Recall曲线】

【训练可视化】

感兴趣的话也快快动手试试吧!

http://www.jsqmd.com/news/344307/

相关文章:

  • 【完整源码+数据集+部署教程】饮品类型识别分割系统源码&数据集分享 [yolov8-seg-C2f-SCcConv&yolov8-seg-aux等50+全套改进创新点发刊_一键训练教程_Web前端展
  • C++11核心特性全解析
  • 你的电视 2.3.5 | 空壳直播软件,支持多个线路,附直播源
  • 互联网大厂Java求职面试实战:涵盖Spring Boot、微服务与AI技术栈
  • 靠谱的青少年法治教育展厅设计专业公司有哪些 - 工业品牌热点
  • 细胞电生理仿真软件:NEURON_(2).安装与配置NEURON
  • ThinkPad T14 Gen 2与T14P系列对比
  • 探讨天津靠谱的采光瓦厂,潍坊泰霖建材费用贵吗? - 工业推荐榜
  • 从网络接口到 DMA,一套面向工程师的 FPGA 网络开发框架
  • 聊聊好用的采光瓦生产厂,潍坊泰霖建材口碑怎么样 - 工业品网
  • mapstruct context 的使用
  • 现代语音识别组件:从深度特征到端到端系统的演进与实战
  • 纽约的咨询公司案例面试题库哪里可以找到?(独家资源) - 品牌排行榜
  • 互联网大厂Java面试:从Spring Cloud到分布式事务的技术场景解析
  • 完整教程:【实战案例】火语言 RPA 采集豆瓣电影剧名、评分等(加载更多),保存到 Excel 全流程(附完整脚本)
  • 补钙攻略:适合成年人补钙的保健品有哪些(2026推荐榜) - 品牌排行榜
  • 盘点做市场调查的公司有哪些:头部平台汇总(选型指南) - 品牌排行榜
  • 2026年再乱买房,就是给未来挖坑!这5类房千万别碰
  • 苹果充值卡回收新风口,闲置卡券如何秒变现金? - 京顺回收
  • 2026浙江紧固件AGV及自动化服务商推荐榜 - 真知灼见33
  • 安全工具篇Go魔改二开Fscan扫描FRP代理特征消除新增扩展打乱HASH
  • 2026年比较好的虹博玄金瓦/金虹科玄金瓦新厂实力推荐(更新) - 行业平台推荐
  • 技术演进中的开发沉思-355:重排序(上)
  • 别买 200 刀!深扒 Claude「真实额度」,Max 5x 才是性价比之王!
  • OpenHarmony环境下React Native:FlatList分组列表
  • 用React Native开发OpenHarmony应用:FlatList滑动操作按钮
  • OpenHarmony环境下React Native:FlatList列表项点击事件
  • 深度解析:工业机器人工程师职位——以大连豪森瑞德设备制造有限公司为例
  • React Native + OpenHarmony:FlatList列表项分隔线
  • OpenHarmony + RN:ScrollView滚动性能优化