当前位置：首页 > news >正文

实战教程：如何将Anti-UAV数据集标签快速转换为YOLO格式（附完整代码）

news 2026/3/26 23:11:40

实战教程：如何将Anti-UAV数据集标签快速转换为YOLO格式（附完整代码）

在无人机检测领域，高质量的数据集是模型训练的基础。Anti-UAV作为反无人机检测的权威数据集，其标注格式与YOLO系列算法要求的格式存在差异。本文将手把手教你如何实现格式转换，并提供可直接运行的Python脚本。

1. 理解数据集与格式差异

Anti-UAV数据集采用JSON格式存储标注信息，每个视频序列对应一个JSON文件，包含以下关键字段：

exist: 布尔数组，表示每帧是否存在目标
gt_rect: 边界框坐标数组，格式为[x,y,width,height]

而YOLO格式要求每个图片对应一个.txt文件，每行表示一个目标：

<class_id> <x_center> <y_center> <width> <height>

其中坐标值需归一化到[0,1]范围。

关键差异对比：

特性	Anti-UAV格式	YOLO格式
存储方式	每视频1个JSON	每图片1个TXT
坐标系	左上角原点	中心点坐标
数值范围	绝对像素值	归一化值
类别表示	隐含单类别	显式class_id

2. 环境准备与脚本架构

转换脚本需要以下依赖：

pip install pillow

脚本采用模块化设计，主要包含三个功能层：

目录遍历层：batch_convert()处理整个数据集目录
核心转换层：process_single_json()执行格式转换
工具函数：get_image_size()和find_image_path()提供支持

注意：建议在Linux系统下运行，路径分隔符需特别注意。Windows用户可将路径中的/改为\\

3. 关键代码解析

3.1 坐标转换逻辑

核心转换发生在process_single_json()函数中：

# 原始坐标（左上角+宽高） x, y, w, h = bbox # 计算中心点 cx = x + w/2 cy = y + h/2 # 归一化处理 cx_norm = cx / img_width cy_norm = cy / img_height w_norm = w / img_width h_norm = h / img_height

常见陷阱：

当exist=0时跳过写入（避免生成空文件）
边界框超出图像范围时自动截断（需额外处理）

3.2 多帧图片匹配

由于无人机视频可能跳帧，采用动态查找策略：

def find_image_path(image_subdir, frame_num): for ext in ['.jpg', '.png', '.jpeg']: path = os.path.join(image_subdir, f"{frame_num:06d}{ext}") if os.path.exists(path): return path return None

4. 完整优化版脚本

以下脚本增加了错误处理和边界检查：

import json import os from PIL import Image def safe_bbox_normalize(bbox, img_w, img_h): """带边界检查的坐标归一化""" x, y, w, h = bbox # 确保不越界 x = max(0, min(x, img_w - 1)) y = max(0, min(y, img_h - 1)) w = max(1, min(w, img_w - x)) h = max(1, min(h, img_h - y)) # 计算中心点并归一化 cx = (x + w/2) / img_w cy = (y + h/2) / img_h w_norm = w / img_w h_norm = h / img_h return cx, cy, w_norm, h_norm def process_single_json(json_path, output_dir, image_subdir, img_size): """增强版JSON处理器""" img_w, img_h = img_size with open(json_path, 'r') as f: data = json.load(f) for frame_idx, (exist, bbox) in enumerate(zip(data['exist'], data['gt_rect'])): if exist != 1: continue # 查找对应图片 img_path = find_image_path(image_subdir, frame_idx+1) if not img_path: continue # 转换坐标 try: cx, cy, w, h = safe_bbox_normalize(bbox, img_w, img_h) output_path = os.path.join(output_dir, f"{frame_idx+1:06d}.txt") with open(output_path, 'w') as f_out: f_out.write(f"0 {cx:.6f} {cy:.6f} {w:.6f} {h:.6f}\n") except Exception as e: print(f"转换失败 frame {frame_idx+1}: {str(e)}")

5. 验证与调试技巧

转换完成后建议进行三重验证：

基础完整性检查

# 检查文件数量是否匹配 find images/ -type f | wc -l find labels/ -type f | wc -l

可视化验证脚本

import cv2 import random def visualize_yolo_label(img_path, label_path): img = cv2.imread(img_path) h, w = img.shape[:2] with open(label_path) as f: for line in f: _, cx, cy, bw, bh = map(float, line.split()) # 转换回像素坐标 x1 = int((cx - bw/2) * w) y1 = int((cy - bh/2) * h) x2 = int((cx + bw/2) * w) y2 = int((cy + bh/2) * h) cv2.rectangle(img, (x1,y1), (x2,y2), (0,255,0), 2) cv2.imshow('Preview', img) cv2.waitKey(0) # 随机抽样验证 sample_img = random.choice(os.listdir('images')) visualize_yolo_label(f'images/{sample_img}', f'labels/{os.path.splitext(sample_img)[0]}.txt')

统计分布检查
- 使用matplotlib绘制边界框尺寸分布直方图
- 检查宽高比是否符合无人机特征（通常接近1:1）

6. 性能优化方案

当处理大规模数据集时，可采用以下优化策略：

多进程加速：

from multiprocessing import Pool def parallel_convert(args): input_dir, image_dir, output_dir = args # 单目录转换逻辑... if __name__ == '__main__': dirs = [(d, d.replace('json','images'), d.replace('json','labels')) for d in find_json_dirs()] with Pool(processes=4) as pool: pool.map(parallel_convert, dirs)

内存优化技巧：

使用ijson库流式解析大JSON文件
批量处理完成后立即释放内存

7. 扩展应用场景

本方案稍作修改即可适配其他场景：

多类别检测：

# 修改class_id根据JSON中的类别字段 class_id = 0 if data['category'] == 'drone' else 1

其他数据集迁移：
- VisDrone → YOLO
- UAVDT → YOLO
- 主要调整坐标解析逻辑即可

视频流实时处理：

while True: frame = video_capture.read() # 转换为YOLO格式并发送到推理引擎 processed_frame = convert_to_yolo_format(frame) send_to_inference(processed_frame)

在实际项目中，我们还需要考虑标注一致性检查、数据增强预处理等环节。一个完整的无人机检测系统通常包含数据流水线、模型训练和部署三个主要阶段，而高质量的数据转换是确保后续环节可靠性的关键基础。

查看全文

http://www.jsqmd.com/news/503864/

精密五金车间油雾过滤设备核心性能评测报告 - 优质品牌商家

构建Skills智能体：Yi-Coder-1.5B多任务处理实践

Qwen3.5-9B西医辅助：检验报告图理解+异常指标解读+就医建议生成

企业级AI私有化部署实战指南：构建安全高效的智能文档分析平台

2026年光纤熔接机选购指南：五大品牌深度横评与源头厂家解析 - 2026年企业推荐榜

SPI协议原理、RP2350硬件实现与W25Q64 Flash驱动实战

Qwen3-32B惊艳效果：RTX4090D上数学证明生成、编程题解、算法复杂度分析

焦作生物有机肥采购指南：2026年实力厂商深度解析与推荐 - 2026年企业推荐榜

Matlab 2020+ 实战：4种时频分析方法对比（附完整代码）

SeqGPT-560m轻量生成实操：500M级模型在RTX 4090上的推理实测

从DnCNN到通用图像复原：残差学习与批归一化的协同进化之路

AIS解码桌面小工具

多摄像头监控系统优化：从算法选择到硬件配置全解析

Nanbeige 4.1-3B惊艳效果：文字逐字蹦出+像素方块光标动效演示

PP-DocLayoutV3效果实测：扫描合同版面分析，区域定位精准

因不满出版社秘密更换主编和审稿人新规，这本期刊三分之二的编辑集体辞职！

电动式钢管接箍打标设备毕业设计图纸（此轮液压泵装配图）

Style-Bert-VITS2：如何打造情感丰富的个性化语音合成终极指南

解锁游戏资源处理：ValveResourceFormat全功能解析

图解HDFS元数据安全机制：当断电发生时，Edits+Fsimage如何避免数据丢失？

从零到一：SyzVegas内核模糊测试实战指南（含常见报错解决方案）

L2TP+抓包数据分析（知识点）

Nanbeige 4.1-3B实操手册：一键RESET重置上下文+多轮RPG对话状态管理

Cosmos-Reason1-7B效果展示：视频理解中‘这个动作需要多少扭矩’类工程问题回答

算法题学习题单

从零实现PPO算法：在CartPole-v1环境中验证策略优化

Qwen3-ASR-1.7B在VMware虚拟机中的部署实践

探索Qt/C++皮肤生成器：打造个性化界面的神器

以韶音天篱滤噪开辟行业新赛道：韶音为聆听创造第三种可能

Alpamayo-R1-10B惊艳效果：VLA模型对驾驶员分心状态的视觉-语言联合推断