当前位置: 首页 > news >正文

YOLOv11最新创新改进系列:多模态融合RGB+红外线(IR),融合BoTNet模块,ResNet的最后三个的卷积层替换成MHSA层,融合CNN+自然语言处理技术的优势,提升检测效果!

YOLOv11最新创新改进系列:多模态融合RGB+红外线(IR),融合BoTNet模块,ResNet的最后三个的卷积层替换成MHSA层,融合CNN+自然语言处理技术的优势,提升检测效果!

购买相关资料后畅享一对一答疑

畅享超多免费持续更新且可大幅度提升文章档次的纯干货工具!

自己排列组合2-4种后,考虑位置不同后可排列组合上千万种!!专注AI学术,关注B站博主:Ai学术叫叫兽!

数据集准备

我给大家配置了默认的M3FD.yaml,大家可以直接在代码中使用,然后按照自己的数据进行简单的替换就行!非常简单!

# Ultralytics YOLO , AGPL-3.0 license# M3FD dataset# Example usage: yolo train data=M3FD.yaml# Train/val/test sets as dir: path/to/imgspath:# dataset root dirtrain:images/train# train visible images (relative to 'path')train2:imagesTR/train# train infrared images (relative to 'path')val:images/val# val visible images (relative to 'path')val2:imagesIR/val# val infrared images (relative to 'path')test:# test images (optional)#image_weights: Truenc:6# Classesnames:0:People1:Car2:Bus3:Motorcycle4:Lamp5:Truck

其中,ImagesIR 为红外线图像


Image为可见光(RGB)图像

详细的改进教程以及源码,戳这!戳这!!戳这!!!B站:AI学术叫叫兽 源码在相簿的链接中,动态中也有链接,感谢支持!祝科研遥遥领先!

改进

一、 BoTNet简介

论文地址:https://arxiv.org/abs/2101.11605

BoTNet是一种简单但功能强大的主干网络,该架构将注意力模块纳入了包括图像分类,目标检测,实例分割等多种计算机视觉任务。通过仅将ResNet的最后三个的卷积层替换成MHSA层,并不进行其他改变,在墓边检测方面显著改善了极限,同时减少了参数两,从而使得延迟最小化。
Transformer中的MHSA和BoTNet中的MHSA的区别:

归一化,Transformer使用 Layer Normalization,而BoTNet使用 Batch Normalization。
非线性激活,Transformer仅仅使用一个非线性激活在FPN block模块中,BoTNet使用了3个非线性激活。
输出投影,Transformer中的MHSA包含一个输出投影,BoTNet则没有。
优化器,Transformer使用Adam优化器训练,BoTNet使用sgd+ momentum

二、 改进教程

2.1 修改YAML文件

2.2 新建.py

2.3 修改tasks.py

三、验证是否成功即可

执行命令

python train.py

改完收工!
关注B站:AI学术叫叫兽
从此走上科研快速路
遥遥领先同行!!!!

写在最后

学术因方向、个人实验和写作能力以及具体创新内容的不同而无法做到一通百通,关注UP:Ai学术叫叫兽
在所有B站资料中留下联系方式以便在科研之余为家人们答疑解惑,本up主获得过国奖,发表多篇SCI,擅长目标检测领域,拥有多项竞赛经历,拥有软件著作权,核心期刊等经历。
因为经历过所以更懂小白的痛苦!
因为经历过所以更具有指向性的指导!

祝所有科研工作者都能够在自己的领域上更上一层楼!

以下为给大家庭小伙伴们免费更新过的绘图代码,均配有详细教程,超小白也可一键操作! 后续更多提升文章档次的资料的更新请大家庭的小伙伴关注UP:Ai学术叫叫兽!



http://www.jsqmd.com/news/777398/

相关文章:

  • 我做了一个 MD5 在线哈希工具:校验值不用再临时写脚本
  • 不止于安装:手把手教你配置TwinCAT 3实现PC与PLC的TCP/IP通信(附NetAssist工具使用)
  • 通过 TaoToken 用量看板清晰掌握团队大模型支出明细
  • 【AI技术大会志愿者招募终极指南】:SITS2026官方认证流程、隐藏福利与3大优先录取通道曝光
  • 常州黄金回收 2026 风口|5 区 1 市全域上门,6 大品牌正规无套路,闲置黄金高价变现必看 - 金掌柜黄金回收
  • ANSYS四点雨流计数法
  • 2026年柴油机火花熄灭器生产厂家深度测评:如何为高危场景匹配最佳方案? - 速递信息
  • centos 7 安装图形化
  • 新粗野主义React组件库:设计系统与前端工程实践
  • 一物一码数字化全链路领域供应商选择建议:多维度做客观深度解析 - 易全一物一码提供商
  • Chrome 安全机制深度解析
  • 课程论文写不出来?宏智树AI教你5分钟理清思路,告别“期末熬夜综合征”
  • Proteus 8.13 + Keil C51 联调:手把手教你用 AT89C52 驱动 AT24C02 并显示到 LCD1602
  • 告别无限配网!用ESP32+Arduino实现一键切换的智能配网方案(附完整代码)
  • 3分钟搭建Python大麦网抢票神器:告别手速拼抢的时代
  • 三部最经典的营销管理书籍推荐
  • 如何用ncmdumpGUI轻松解锁网易云音乐NCM文件:Windows用户的完整指南
  • 微信小程序逆向工程:wxappUnpacker完整指南与安全分析实战
  • YOLOv13最新创新改进系列:融入AKConv(可改变核卷积),加强特征提取,任意数量的参数和任意采样形状,为网络开销和性能之间的权衡提供了更丰富的选择。 拉升检测性能!
  • 2026年4月酒店名称,西双版纳酒店/民宿/酒店/西双版纳民宿/西双版纳住宿/住宿,酒店预订 - 品牌推荐师
  • BilibiliCacheVideoMerge:三步告别缓存碎片,安卓端B站视频完美合并指南
  • 国产测厚仪行业格局解析,吉恩斯高精度镀层检测仪器推荐 - 品牌推荐大师1
  • AD9361的LVDS模式不止传数据:深度挖掘CTRL_IN/OUT引脚在TDD系统中的妙用
  • 模拟电路设计:超低功耗定时发声器原理与复刻实践
  • RT-DTER最新创新改进系列:融合YOLOv9下采样机制ADown,强强联合!扩大YOLOv13网络模型感受野,降低过拟合,让小目标无处可遁!检测精度再提新高!!
  • 深度解析常见网络配置故障与底层排错逻辑
  • 国产恶臭监测仪替代进口首选,西原环保实力优势拆解 - 品牌推荐大师1
  • PardusBot:基于AI Agent的智能定时任务与数据抓取自动化工具
  • 告别龟速:如何用开源插件将GitHub下载速度提升100倍?
  • 15、世界杯—把两个Excel的内容放在一个新Excel里面