当前位置：首页 > news >正文

YOLO26 全网独家改进创新：ECCV2026 S2-FracMix 颈部网络，引入形状-尺度分形混合 Neck，独家创新！

news 2026/7/5 1:25:45

YOLO26 全网独家改进创新：ECCV2026 S2-FracMix 颈部网络，引入形状-尺度分形混合 Neck，独家创新！

购买相关资料后畅享一对一答疑！

微信公众号：Ai计算机视觉
畅享超多免费持续更新且可大幅度提升文章档次的纯干货工具！

本文对应改进文件：yolo26-ECCV2026-S2FracMixNeck.yaml
工程基线：ultralytics26-main7.10 改进位置：Neck 颈部网络核心模块：S2FracMixFusion、S2FracMixBlock、S2FracMixC2f`
论文来源：S²-FracMix: Label-Preserving Self-Saliency Mixup Augmentation, ECCV 2026

本文将 S²-FracMix 从图像增强迁移到 YOLO26 Neck 特征融合中，形成 shape-scale fractional PAN/FPN。

1. 原文摘要与 Introduction 总结提炼

1.1 S²-FracMix 原文摘要翻译

S²-FracMix 论文指出，数据增强可以提升视觉模型泛化能力。近年来 Mixup 类方法通过构造插值样本提升模型性能，但跨样本混合不仅带来额外计算开销，还可能破坏样本语义。为此，作者提出Self-Saliency Mixup：从同一张图像中提取多尺度显著区域，并将其重新插入非显著区域，从而构造更具挑战性但仍保持标签一致的训练样本。

在此基础上，作者提出FracMix，将自相似分形结构以自适应比例注入显著区域，使模型同时学习分形和非分形结构。该统一框架在分类、鲁棒性、校准、目标检测和迁移学习等多类任务中取得领先表现。

1.2 Introduction 总结提炼

论文 Introduction 的核心观点如下：

观点	解释	对 YOLO Neck 的启发
跨样本 Mixup 容易语义干扰	随机混合两张图可能破坏目标语义	Neck 融合时也应避免无选择地拼接噪声特征
显著区域应被优先保护	自显著区域包含最关键判别信息	FPN/PAN 中应更关注目标显著响应
多尺度 patch 有助于尺度不变性	同一图像中多尺度区域重组可增强泛化	Neck 正是多尺度融合核心位置
分形/自相似结构提升鲁棒性	结构扰动让模型学习更稳健表示	在特征层引入 scale bank 和 shape bank

因此，本文不是复刻原论文的数据增强流程，而是将其思想迁移到 YOLO26 颈部网络中，构建S2FracMixNeck。

2. 为什么要融合 + 改进模块核心结构

2.1 为什么选择 Neck 融合 S2-FracMix

YOLO26 的 Neck 承担 P3/P4/P5 多尺度语义融合，是小目标、中目标、大目标信息流动的关键路径。原结构主要采用：

Upsample / Downsample -> Concat -> C3k2

该结构虽然高效，但存在三个问题：

问题	说明
硬拼接	Concat 不判断不同尺度特征质量
形状建模不足	横向细长目标、竖向目标、局部遮挡目标缺乏显式分支
层内尺度扰动不足	P3/P4/P5 是层级尺度，但每一层内部缺少自相似尺度混合

S²-FracMix 的思想刚好对应 Neck 的需求：多尺度、自显著、结构扰动、标签保持。迁移到特征融合后，可以让 Neck 更主动地学习目标形状和尺度变化。

Neck 相关核心类：

S2FracMixBlock S2FracMixFusion S2FracMixC2f

对应 yaml：

ultralytics/cfg/models/26/yolo26-ECCV2026-S2FracMixNeck.yaml

2.3 S2FracMixFusion

用于替代原 Neck 中的Concat：

多尺度输入 -> 统一通道 -> resize 对齐 -> learnable level weight -> fused feature -> S2FracMixBlock

部件	作用
channel projection	将不同层特征投影到统一通道
resize_like	对齐空间尺寸
level_logits	学习不同尺度的融合权重
S2FracMixBlock	做形状和尺度分形混合

2.4 S2FracMixBlock

核心由两个 bank 构成：

bank	分支	对应目标
shape bank	3×3 DWConv	普通局部目标
shape bank	1×7 DWConv	横向细长目标
shape bank	7×1 DWConv	竖向细长目标
scale bank	0.5~1.5 多比例缩放	小中大尺度扰动

该模块将原论文中的“多尺度显著 patch + 分形比例混合”转换为特征图内部的 shape-scale fractional mixing。

2.5 S2FracMixC2f

在 Fusion 后进一步做 C2f 风格增强：

Conv split -> S2FracMixBlock -> S2FracMixBlock -> Concat -> Conv

这使得每个 PAN/FPN 节点都具备显式形状和尺度重整能力。

3. 三种融合方法总览、优势特点、原理和网络结构图

3.1 S2FracMixNeck 网络结构图

32 原 Neck 与融合 Neck 对比

原 YOLO26 Neck：

P5 upsample + P4 -> Concat -> C3k2 P4 upsample + P3 -> Concat -> C3k2 P3 downsample + P4 -> Concat -> C3k2 P4 downsample + P5 -> Concat -> C3k2

融合后：

P5 upsample + P4 -> S2FracMixFusion -> S2FracMixC2f P4 upsample + P3 -> S2FracMixFusion -> S2FracMixC2f P3 downsample + P4 -> S2FracMixFusion -> S2FracMixC2f P4 downsample + P5 -> S2FracMixFusion -> S2FracMixC2f

3.4 yaml 关键改动

head:-[-1,1,nn.Upsample,[None,2,"nearest"]]-[[-1,6],1,S2FracMixFusion,[]]-[-1,2,S2FracMixC2f,[]-[-1,1,nn.Upsample,[None,2,"nearest"]]-[[-1,4],1,S2FracMixFusion,[]]-[-1,2,S2FracMixC2f,[]]

4. 适合写进论文的创新点表述

4.1 中文表述

本文针对 YOLO26 颈部网络在多尺度融合过程中缺乏显式形状与尺度扰动建模的问题，提出一种 S²-FracMix-inspired Neck。该方法借鉴 ECCV2026 S²-FracMix 中自显著多尺度混合与分形自相似扰动思想，将其从图像级数据增强迁移到特征空间融合。具体而言，本文以 S2FracMixFusion 替代传统 PAN/FPN 中的硬拼接操作，通过可学习尺度权重实现不同层级特征的自适应融合；随后利用 S2FracMixC2f 内部的 shape bank 和 scale bank 同时建模横向、纵向、局部形状以及多比例尺度扰动，从而提升模型对小目标、细长目标、密集目标和尺度变化目标的检测鲁棒性。

4.2 英文表述

We propose an S²-FracMix-inspired neck for YOLO26 to improve multi-scale feature fusion. Motivated by the self-saliency and fractal mixing strategy of S²-FracMix, the proposed module transfers image-level augmentation principles into feature-space fusion. Specifically, S2FracMixFusion replaces the hard concatenation in PAN/FPN with learnable level-wise fusion, while S2FracMixC2f introduces shape and scale banks to model local, horizontal, vertical, and self-similar scale variations. This design enhances scale-invariant and shape-aware representations for small, elongated, dense, and scale-varying objects.

4.3 创新点表格

创新点	论文写法
特征级 S²-FracMix	将图像增强思想迁移到 Neck 特征融合
可学习尺度融合	替代固定 Concat，降低无效尺度噪声
shape bank	显式覆盖横向、纵向、局部目标形态
scale bank	模拟分形自相似尺度扰动
复杂 Neck	每个 PAN/FPN 节点都进行 S2FracMixC2f refinement

5. 原网络和融合后特点对比、注意事项

5.1 特点对比

维度	原 YOLO26 Neck	S2FracMixNeck
融合方式	Concat	learnable fusion
后处理模块	C3k2	S2FracMixC2f
形状建模	隐式卷积学习	3×3、1×7、7×1 显式分支
尺度建模	P3/P4/P5 层级尺度	层级尺度 + 层内 scale bank
小目标	依赖 P3	多尺度融合更灵活
细长目标	无专门结构	横向/纵向分支增强

5.2 注意事项

注意事项	建议
Neck 计算量增加	建议先用`n/s`模型验证
与 BiFPN 类方法叠加需谨慎	两者都改融合节点，建议分开消融
bins 不宜过大	默认`bins=4`，过大可能增加延迟
当前为特征迁移版	原 S²-FracMix 是数据增强，本模块为 YOLO Neck 适配创新

写在最后

学术因方向、个人实验和写作能力以及具体创新内容的不同而无法做到一通百通，关注UP：Ai学术叫叫兽
在所有B站资料中留下联系方式以便在科研之余为家人们答疑解惑，本up主获得过国奖，发表多篇SCI，擅长目标检测领域，拥有多项竞赛经历，拥有软件著作权，核心期刊等经历。
因为经历过所以更懂小白的痛苦！
因为经历过所以更具有指向性的指导！

祝所有科研工作者都能够在自己的领域上更上一层楼！

微信公众号：Ai计算机视觉

查看全文

http://www.jsqmd.com/news/1125164/