当前位置: 首页 > news >正文

开源|DroneRFa:面向低空反无人机探测的大规模射频信号数据集(浙大最新成果)

重磅开源|DroneRFa:面向低空反无人机探测的大规模射频信号数据集(浙大最新成果)

发布平台:电子与信息学报|2024 年第 4 期
作者:俞宁宁,毛盛健,周成伟,孙国威,史治国 *,陈积明
单位:浙江大学浙江省协同感知与自主无人系统重点实验室、承德市公安局
原文链接

一、为什么我们需要一套全新无人机射频公开数据集?

近些年消费级、工业级无人机普及速度飞快,航拍、电力巡检、农林植保、应急救援都离不开无人机,但随之而来的黑飞、滥飞安全事件持续激增,已经成为空域安防、公共治安、机场管控、重点区域防护的重大难题。

文中整理近年全球典型无人机违规事件,涵盖毒品走私、隐私偷拍、机场停运、禁区闯入、公共设施损毁等多类场景:

  • 美国加州利用微型无人机跨境走私毒品;

  • 法、意多地无人机闯入政务活动、历史地标空域;

  • 国内海口、武汉接连出现铁路、居民区无人机违规拍摄;

  • 爱尔兰都柏林机场因无人机入侵临时停运航班。

现有空域管控手段对带 GPS 的正规商用无人机约束有效,但无 GPS 自制改装无人机、境外改装飞控设备不受禁飞区限制,管控存在巨大漏洞。当前主流四类反无人机探测方案各有明显短板:

探测方式探测距离核心优势致命短板
视觉光电1–2km无源隐蔽、目标直观受光照、遮挡影响极大,夜间探测成本高
声学探测<150m设备廉价、无源接收城市车流、人声噪声严重干扰识别
有源雷达3–8km远距离、测速测距低空杂波严重、设备昂贵、电磁辐射明显不适合城区
无源射频探测1–5km电磁特征难以伪装、无源低干扰、城区适配性强同频 WiFi、蓝牙杂波干扰,硬件成本偏高

综合对比后,基于射频信号的无源探测是城市低空无人机监测最优路线之一。但目前领域发展存在关键瓶颈:

  1. 现有公开无人机射频数据集机型少、覆盖频段单一,大多仅采集 2.4GHz 信号,缺少多频段切换数据;

  2. 大量研究采用私有闭源数据集,不同算法无法在统一基准下公平对比,行业缺少标准化评测基准;

  3. 缺少区分室内 / 户外、远近不同飞行距离的标注数据,难以支撑信号衰减、复杂场景识别算法研究。

针对以上痛点,浙江大学团队公开DroneRFa 大规模无人机射频数据集,完整覆盖多机型、多场景、三大 ISM 公用频段,配套两套完整识别验证方案,可供所有反无人机、频谱识别领域学者免费下载使用。

二、DroneRFa 数据集核心优势一览

1. 样本规模大、机型覆盖全面

数据集总计25 类射频信号

  • 城市户外运动无人机信号:9 类

  • 城市室内静态无人机 / 飞控信号:15 类

  • 背景干扰参照信号:1 类(含 WiFi、蓝牙电磁环境)

覆盖大疆全系列消费、工业级无人机,外加 VBar、FrSky、Futaba、RadioLink、云卓等主流第三方飞控器,完全匹配市面主流违规无人机硬件。

数据采集标准严苛:每一类机型不少于 12 个独立信号片段,单片段采样点超 1 亿个,数据量级足以支撑深度学习、传统时频统计算法训练与验证。

2. 三 ISM 频段双通道同步采集,弥补现有数据短板

采集覆盖全球通用三大工业科学医疗开放频段:
915MHz(902–928MHz)、2.4GHz(2400–2484.5MHz)、5.8GHz(5725–5850MHz)
采用双通道同步采集机制,可完整记录无人机多频段自动切换通信行为。
现有绝大多数公开数据集仅聚焦 2.4GHz 单频段,本数据集填补多频段跳频图传数据空白,适配新一代多模无人机研究。

3. 精细化距离标注,支撑射频衰减、远距离弱信号研究

户外采集严格划分三级飞行距离标签:

  • D00:20–40m(近距)

  • D01:40–80m(中距)

  • D10:80–150m(远距)
    不同距离下无人机射频信号衰减、信噪比变化完整留存,专门面向远距离微弱无人机信号检测、抗衰减识别算法研发。

4. 标准化二进制编码命名,批量读取、筛选便捷

全部数据统一为.mat格式文件,文件名自带完整标签,格式:Txxxxx_Dxx_Sxxxx.mat

  • T:机型二进制编码(0000 为背景,其余对应大疆各机型、第三方飞控)

  • D:距离二进制编码(近 / 中 / 远三档)

  • S:频段模式编码(区分初始通信频段、可切换多频段设备)

举例:T0010_D01_S1110.mat= 40–80m 距离 DJI Phantom 4 Pro,支持 2.4G/5.8G 频段切换射频数据。

单文件内置 4 路 I/Q 基带数据:RF0_I、RF0_Q、RF1_I、RF1_Q,双接收通道同相正交复信号,双精度浮点存储,Matlab、Python h5py 均可一键读取,官方提供读取代码示例。

三、数据集硬件采集方案与完整采集流程

1. 全套采集设备清单

  1. 射频接收机:NI USRP-2955
    频率覆盖 10MHz–6GHz,4 收发通道,最大瞬时带宽 80MHz,采样率最高 100MS/s,14bit ADC,增益 0–95dB;

  2. 接收天线:VERT2450 全向垂直增益天线,2.4/5.8GHz 双频段,3dBi 增益;

  3. 计算主机:Win10 工作站,至强 W-2245 处理器,32GB 内存,1TB 以上存储,LabVIEW 驱动采集;

  4. 传输套件:PCIe 高速连接线,单通道吞吐 100MS/s,传输延迟<10ms;

  5. 被测目标:全系列大疆无人机 + 多品牌独立飞控。

2. 采集场景划分

  1. 户外场景:杭州城郊开阔小镇,无人机水平距离接收机 20–150m,飞行速度 5–15m/s 动态采集;

  2. 室内场景:无人机与接收机固定间距 2m,无远距离衰减干扰,用于纯净信号特征提取。

3. 标准化采集步骤

  1. 无人机开机与遥控器配对,确认通信链路正常;

  2. LabVIEW 初始化 USRP,双通道中心频率按需配置:

    • 大疆主流机型:通道 0=2440MHz,通道 1=5800MHz;

    • 仅支持 915M/2.4G 飞控:通道 0=915MHz,通道 1=2440MHz;
      统一参数:采样率 100MS/s、接收增益 50dB、单次存储 10M 采样点;

  3. 操控人员由近至远改变无人机位置,划分近 / 中 / 远三档距离标定;

  4. 采集人员按编码规则命名 mat 文件,每段采集≥1 亿采样点;

  5. 更换机型、飞行距离、通信频段重复采集,样本量达标后停机。

补充说明:数据连续性细节

采集采用 “采集 - 存储” 分段模式,每 10M 采样点区间内信号完整连续,间断仅出现在分段交界处。无人机跳频、图传周期特征在 0.1s(10M 采样点)窗口内完整呈现,短时信号分析不受分段间隙影响。

四、两套完整无人机识别验证方案(数据集有效性论证)

论文配套两套识别算法,分别适配轻量化实时检测、高精度复杂场景识别,所有实验均基于 DroneRFa 完成,可直接复现。

方案一:基于频谱可视统计特征的轻量化识别(无深度学习、低算力)

原理基础

无人机射频分为两类核心信号:

  1. 上行控制跳频信号:遥控器下发飞行指令,采用跳频扩频调制,不同机型跳频带宽、跳频间隔、脉冲时长存在固定出厂特征;

  2. 下行图传 OFDM 信号:无人机回传航拍画面,具备固定周期、占空比,可作为区分特征。

6 类核心统计特征指标

跳频块带宽、跳频块持续时长、相邻跳频时间间隔、相邻跳频带宽间隔、图传信号周期、图传占空比。
论文给出全部 24 类无人机、飞控器完整特征参数表,可直接建立特征匹配库。

识别流程
  1. 对 I/Q 复信号做 STFT 短时傅里叶变换,生成时频图;

  2. 滑动窗口遍历时频图谱,提取全部跳频块、图传脉冲;

  3. 计算 6 项统计特征,与数据库先验参数匹配完成机型分类。

适用场景

边缘低算力无源探测设备、实时快速筛查;短板为远距离弱信号、同调制机型识别精度不足。

方案二:基于 ResNet-18 深度学习的高精度识别(复杂干扰、远距离弱信号适配)

针对传统统计特征方法缺陷(短片段特征缺失、远距离信号淹没、同类调制区分度低),采用卷积神经网络自动挖掘隐层时频特征。

实验配置
  1. 样本划分:每 100 万采样点(10ms)作为独立样本,6:2:2 划分训练 / 验证 / 测试集,样本总量近 1.6 万;

  2. STFT 参数:汉明窗,滑动重叠 0.5,输入时频图尺寸 (2,1024,1024);

  3. 训练参数:Adam 优化器,学习率 0.001,批次 32,损失函数交叉熵;

  4. 对比变量:时域长度、频域分辨率双变量消融实验。

核心实验结论(性能对照表精简解读)
  1. 基准配置(时频窗 1024×1024)识别准确率 97.73%,多分类精确率、召回率、F1 值均超 0.97,单帧推理速度 53fps;

  2. 时域长度压缩对精度衰减影响远大于频域压缩:缩短信号时长会大幅丢失跳频周期特征,识别性能断崖下跌;

  3. 若需提升设备实时推理速度,优先降低频域分辨率,可在精度小幅下降前提下大幅提升帧率(最高 217fps)。

混淆矩阵结果显示,绝大多数机型无严重错分,仅少量调制参数近似飞控存在极低概率混淆,证明数据集特征区分度充足。

五、数据集下载与引用规范

  1. 官方下载地址
    https://jeit.ac.cn/web/data/getData?dataType=Dataset3

  2. 学术使用强制要求
    论文、学位论文、会议报告、专利、项目成果中使用 DroneRFa 数据集,必须规范引用本文:
    俞宁宁,毛盛健,周成伟,等.DroneRFa: 用于侦测低空无人机的大规模无人机射频信号数据集 [J]. 电子与信息学报,2024,46 (4):1147-1156.
    DOI:10.11999/JEIT230570

六、总结与后续研究规划

  1. 现有数据集价值
    DroneRFa 填补了国内多场景、多频段、带距离标注开源无人机射频数据集空白,统一评测基准,同时提供传统时频统计、深度学习两套完整基线算法,可支撑无人机检测、机型识别、弱信号复原、多源干扰抑制、射频指纹提取全方向研究。

  2. 后续扩充计划
    团队将持续维护更新数据集,后续迭代方向:

  • 新增多无人机集群同时飞行混合射频样本;

  • 叠加 WiFi、蓝牙、移动通信等强同频干扰场景数据;

  • 补充更多国产、自制改装飞控、小型穿越机射频样本;

  • 增加多接收阵列、多距离梯度精细化标注数据。

文末留言区(公众号互动话术)

  1. 从事反无人机射频识别、频谱感知、深度学习信号分类的同行,可直接前往官网下载数据集复现论文基线;

  2. 如有数据集读取、采集方案复现、算法优化相关问题,可查阅原文实验章节,或联系通信作者史治国教授;

  3. 转发分享给空域安防、电磁信号处理、无人系统方向课题组,共建统一开源评测基准!


http://www.jsqmd.com/news/1075660/

相关文章:

  • claude-mem:让 Claude Code 拥有持久记忆的插件
  • 快速上手Flowframes:AI视频插帧神器,让你的视频流畅度翻倍
  • 现在开始提升短视频宣传质量
  • 联邦学习实战指南:数据不出域的AI协作范式
  • 5大核心技术革新:OpCore-Simplify如何实现OpenCore配置效率3200%提升
  • 【HCIA-AI笔记(微认证1)】2.6 AI开发框架MindSpore
  • Poly Haven Assets:Blender中免费3D资源库的终极解决方案
  • 导学-Vue2导学:从零开始掌握Vue2
  • 人机协作新范式:高效论文写作全流程AI论文工具推荐(2026 最新)
  • G-Helper终极指南:如何免费提升华硕笔记本性能与续航
  • MuleSoft+LangChain企业级AI编排实战:构建合规可审计的LLM流水线
  • Log4Shell漏洞复现与防御:从JNDI注入到远程代码执行实战
  • 从NXP与吉利合作看汽车半导体如何驱动智能汽车创新
  • ArcObjects SDK 10.8实战指南:构建企业级地理信息系统的核心技术架构
  • JMeter接口测试入门:从零到一掌握核心组件与实战技巧
  • csswizardry:一个网页性能工程师的开源工具箱
  • 101 01 黄大年茶思屋榜文101期 第1题 内存友好的高效MoE架构
  • 毕业论文神器!2026年闭眼可入的专业AI论文写作软件
  • 终极指南:用Ryujinx模拟器在PC上畅玩Switch游戏的完整方案
  • 阿里星2027届应届生招聘正在进行中!扫描下方内推二维码,投递意向岗位。
  • 想找好用的会议音响供应商?这里有你不可错过的优质之选!
  • 蒙特卡洛强化学习实战:从机器人试错到稳定决策
  • 原神小助手:让AI帮你玩转提瓦特大陆的智能伙伴
  • HumanEgo 论文主实验硬件解析:Trossen WidowX AI 双臂工作站实操方案
  • JavaScript安全审计:从代码层面挖掘垂直越权漏洞的实战指南
  • 硅基流动上线高速版 Kimi K2.7 Code
  • 2026 完整版 Claude Code 入门教程:从零安装、环境配置到核心命令实战
  • 如何选择最适合的macOS屏幕录制工具:QuickRecorder技术深度解析与实战指南
  • Dapr:分布式应用开发的通用运行时
  • 在Rust中tokio::spawn和tokio::task::spawn_blocking的区别