当前位置：首页 > news >正文

详细介绍：AI喷洒无人机助力智慧菜田除草新模式，基于最新以注意力为核心的YOLOv12全系列【n/s/m/l/x】参数模型开发构建无人机航拍农田巡检场景下田地杂草智能化检测识别系统

news 2026/7/10 7:58:58

科技发展到今天，无人机喷洒药物已经不是一件新鲜事情了，在很多高危的工作领域中，比如高空电力设备除冰，电力设备部件传送更换等等，无人机都能够扮演非常出色的作用，最近回到老家正值菜田幼苗除草，小片的农田大都还是一家一户几个人背着一个喷雾器然后在地里面人工喷药，大片的标准化农田近些年来已经逐渐有了机械化规模化的意思，无人机设定路线配置药水一键启动喷药即可，相当高效快捷，传统的这种施药模式就好比是十几年前甚至几十年前的浇地模式一样，大都采用的是大水漫灌的形式，效率低且资源浪费严重，假设遇上水资源匮乏的情况就更加明显了，结合回老家看到的景象突然有个想法就是未来的农药喷灌模式是否允许跟浇地模式的改变学一下吗？传统的大水漫灌改成了喷头式的喷灌，那么无人机广撒网的全覆盖模式能够结合AI技术变成智能化“点喷”？我觉得这个在未来发展一定是能有作为的赛道。

在前文中我们已经进行了相关的开发实践，感兴趣的话可以自行移步阅读即可：

《AI喷洒无人机助力智慧菜田除草新模式，基于YOLOv11全系列【n/s/m/l/x】参数模型开发构建无人机航拍农田巡检场景下田地杂草智能化检测识别系统》

本文主要是想要基于YOLOv12全系列的模型来进行相应的制作实践，首先看下实例效果：

接下来看下实例数据情况：

YOLO系列最近的迭代速度不可谓不快，可能感觉YOLOv11都还没有推出多久，YOLOv12就这么水灵灵地来了，下面是对YOLOv12论文的阅读记录，感兴趣的话可以自行移步阅读即可：

《卷出火花继续飞升，YOLO家族最新成员YOLOv12重磅发布——YOLOv12: Attention-Centric Real-Time Object Detectors以注意力为中心的实时目标检测器》

官方发布的预训练权重如下：

Turbo (default):

Model (det)	size (pixels)	mAPval 50-95	Speed (ms) T4 TensorRT10	params (M)	FLOPs (G)
YOLO12n	640	40.4	1.60	2.5	6.0
YOLO12s	640	47.6	2.42	9.1	19.4
YOLO12m	640	52.5	4.27	19.6	59.8
YOLO12l	640	53.8	5.83	26.5	82.4
YOLO12x	640	55.4	10.38	59.3	184.6

v1.0:

Model (det)	size (pixels)	mAPval 50-95	Speed (ms) T4 TensorRT10	params (M)	FLOPs (G)
YOLO12n	640	40.6	1.64	2.6	6.5
YOLO12s	640	48.0	2.61	9.3	21.4
YOLO12m	640	52.5	4.86	20.2	67.5
YOLO12l	640	53.7	6.77	26.4	88.9
YOLO12x	640	55.2	11.79	59.1	199.0

Instance segmentation:

Model (seg)	size (pixels)	mAPbox 50-95	mAPmask 50-95	Speed (ms) T4 TensorRT10	params (M)	FLOPs (G)
YOLOv12n-seg	640	39.9	32.8	1.84	2.8	9.9
YOLOv12s-seg	640	47.5	38.6	2.84	9.8	33.4
YOLOv12m-seg	640	52.4	42.3	6.27	21.9	115.1
YOLOv12l-seg	640	54.0	43.2	7.61	28.8	137.7
YOLOv12x-seg	640	55.2	44.2	15.43	64.5	308.7

Classification:

Model (cls)	size (pixels)	Acc. top-1	Acc. top-5	Speed (ms) T4 TensorRT10	params (M)	FLOPs (G)
YOLOv12n-cls	224	71.7	90.5	1.27	2.9	0.5
YOLOv12s-cls	224	76.4	93.3	1.52	7.2	1.5
YOLOv12m-cls	224	78.8	94.4	2.03	12.7	4.5
YOLOv12l-cls	224	79.5	94.5	2.73	16.8	6.2
YOLOv12x-cls	224	80.1	95.3	3.64	35.5	13.7

一共提供了n、s、m、l和x五款不同参数量级的模型。

这里大家保持完全相同的实验参数设置来进行四款模型的开发训练，等待训练完成之后我们来整体进行各项指标的对比分析。

【Precision曲线】
精确率曲线（Precision Curve）是一种用于评估二分类模型在不同阈值下的精确率性能的可视化工具。它经过绘制不同阈值下的精确率和召回率之间的关系图来协助大家了解模型在不同阈值下的表现。
精确率（Precision）是指被正确预测为正例的样本数占所有预测为正例的样本数的比例。召回率（Recall）是指被正确预测为正例的样本数占所有实际为正例的样本数的比例。
绘制精确率曲线的步骤如下：
使用不同的阈值将预测概率转换为二进制类别标签。通常，当预测概率大于阈值时，样本被分类为正例，否则分类为负例。
对于每个阈值，计算相应的精确率和召回率。
将每个阈值下的精确率和召回率绘制在同一个图表上，形成精确率曲线。
根据精确率曲线的形状和变化趋势，可能选择适当的阈值以达到所需的性能要求。
通过观察精确率曲线，我们可以根据需求确定最佳的阈值，以平衡精确率和召回率。较高的精确率意味着较少的误报，而较高的召回率则表示较少的漏报。根据具体的业务需求和成本权衡，允许在曲线上选择合适的执行点或阈值。
精确率曲线通常与召回率曲线（Recall Curve）一起使用，以提供更全面的分类器性能分析，并帮助评估和比较不同模型的性能。

【Recall曲线】
一种用于评估二分类模型在不同阈值下的召回率性能的可视化工具。它依据绘制不同阈值下的召回率和对应的精确率之间的关系图来帮助我们了解模型在不同阈值下的表现。就是召回率曲线（Recall Curve）
指被正确预测为正例的样本数占所有实际为正例的样本数的比例。召回率也被称为灵敏度（Sensitivity）或真正例率（True Positive Rate）。就是召回率（Recall）
绘制召回率曲线的步骤如下：
使用不同的阈值将预测概率转换为二进制类别标签。通常，当预测概率大于阈值时，样本被分类为正例，否则分类为负例。
对于每个阈值，计算相应的召回率和对应的精确率。
将每个阈值下的召回率和精确率绘制在同一个图表上，形成召回率曲线。
根据召回率曲线的形状和变化趋势，允许选择适当的阈值以达到所需的性能要求。
通过通过观察召回率曲线，我们可以根据需求确定最佳的阈值，以平衡召回率和精确率。较高的召回率表示较少的漏报，而较高的精确率意味着较少的误报。根据具体的业务需求和成本权衡，能够在曲线上选择合适的操作点或阈值。
召回率曲线通常与精确率曲线（Precision Curve）一起使用，以给出更全面的分类器性能分析，并帮助评估和比较不同模型的性能。

【mAP0.5】
mAP0.5，也被称为mAP@0.5或AP50，指的是当Intersection over Union（IoU）阈值为0.5时的平均精度（mean Average Precision）。IoU是一个用于衡量预测边界框与真实边界框之间重叠程度的指标，其值范围在0到1之间。当IoU值为0.5时，意味着预测框与真实框至少有50%的重叠部分。
Precision-Recall Curve曲线下面的面积，这个面积越大，说明AP的值越大，类别的检测精度就越高。就是在计算mAP0.5时，首先会为每个类别计算所有图片的AP（Average Precision），然后将所有类别的AP值求平均，得到mAP0.5。AP
mAP0.5重要关注模型在IoU阈值为0.5时的性能，当mAP0.5的值很高时，说明算法能够准确检测到物体的位置，并且将其与真实标注框的IoU值超过了阈值0.5。

【mAP0.5:0.95】
mAP0.5:0.95，也被称为mAP@[0.5:0.95]或AP@[0.5:0.95]，表示在IoU阈值从0.5到0.95变化时，取各个阈值对应的mAP的平均值。具体来说，它会在IoU阈值从0.5开始，以0.05为步长，逐步增加到0.95，并在每个阈值下计算mAP，随后将这些mAP值求平均。
这个指标考虑了多个IoU阈值下的平均精度，从而更全面、更准确地评估模型性能。当mAP0.5:0.95的值很高时，说明算法在不同阈值下的检测结果均非常准确，覆盖面广，可以适应不同的场景和应用需求。
对于一些需求比较高的场合，比如安全监控等领域，需保证高的准确率和召回率，这时mAP0.5:0.95可能更适合作为模型的评价标准。
综上所述，mAP0.5和mAP0.5:0.95都是用于评估目标检测模型性能的重要指标，但它们的关注点有所不同。mAP0.5首要关注模型在IoU阈值为0.5时的性能，而mAP0.5:0.95则考虑了多个IoU阈值下的平均精度，从而更全面、更准确地评估模型性能。

【loss曲线】
在深度学习的训练过程中，loss函数用于衡量模型预测结果与实际标签之间的差异。loss曲线则是凭借记录每个epoch（或者迭代步数）的loss值，并将其以图形化的方式展现出来，以便我们更好地理解和分析模型的训练过程。

【F1值曲线】
F1值曲线是一种用于评估二分类模型在不同阈值下的性能的可视化工具。它依据绘制不同阈值下的精确率（Precision）、召回率（Recall）和F1分数的关系图来协助大家理解模型的整体性能。
F1分数是精确率和召回率的调和平均值，它综合考虑了两者的性能指标。F1值曲线能够帮忙大家确定在不同精确率和召回率之间找到一个平衡点，以选择最佳的阈值。
绘制F1值曲线的步骤如下：
运用不同的阈值将预测概率转换为二进制类别标签。通常，当预测概率大于阈值时，样本被分类为正例，否则分类为负例。
对于每个阈值，计算相应的精确率、召回率和F1分数。
将每个阈值下的精确率、召回率和F1分数绘制在同一个图表上，形成F1值曲线。
根据F1值曲线的形状和变化趋势，可以选择适当的阈值以达到所需的性能要求。
F1值曲线通常与接收者操作特征曲线（ROC曲线）一起使用，以帮助评估和比较不同模型的性能。它们提供了更全面的分类器性能分析，可以根据具体应用场景来选择合适的模型和阈值设置。