当前位置：首页 > news >正文

从零到一：手把手教你用Labelme打造专属Mask数据集

news 2026/7/29 2:48:31

1. 为什么你需要掌握Labelme标注工具

如果你正在做计算机视觉相关的项目，尤其是图像分割任务，那么高质量的数据集就是你的命根子。市面上现成的数据集往往无法完全匹配你的业务需求，这时候自己动手标注数据就成了必经之路。我刚开始接触图像分割时也走过不少弯路，直到发现了Labelme这个神器。

Labelme是麻省理工学院开发的一款开源图像标注工具，特别适合做语义分割和实例分割的数据标注。它的最大优势就是简单易用，哪怕你完全没有编程基础，也能快速上手。我见过不少团队花大价钱购买商业标注工具，其实对于大多数中小项目来说，Labelme完全够用。

相比其他标注工具，Labelme有这几个杀手锏：完全免费开源、支持多边形标注、输出格式通用（JSON）、跨平台支持。最重要的是，它生成的标注文件可以很方便地转换为Mask图像，这正是训练分割模型最需要的数据格式。

2. 环境准备：从零搭建标注工作站

2.1 安装Labelme的三种方式

很多人卡在第一步的安装环节，其实Labelme的安装比你想象中简单得多。根据你的使用习惯，我推荐三种安装方式：

直接下载可执行文件（最适合小白）：去Labelme的GitHub发布页下载对应系统的.exe或.dmg文件，解压就能用。这种方式最省心，但可能不是最新版本。
通过Anaconda安装（推荐给Python用户）：
```
conda create --name=labelme python=3.8 conda activate labelme pip install labelme
```
这种方式能保证你获得最新版本，而且可以和其他Python工具链完美配合。

从源码安装（适合开发者）：

git clone https://github.com/wkentaro/labelme.git cd labelme pip install -e .

我个人的建议是：如果你只是偶尔用用，选第一种；如果要长期使用，第二种是最佳选择；除非你要修改源码，否则没必要选第三种。

2.2 准备你的标注素材

在启动Labelme之前，先整理好你的图片素材。这里有几个实用建议：

图片命名要有规律，比如"001.jpg"、"002.jpg"这样顺序编号
图片尺寸不要太大，建议长宽都在1000像素以内
最好把所有图片放在同一个文件夹内
如果是团队协作，建议先制定好标注规范（比如哪些类别要标注）

我见过不少新手犯的一个错误是：图片尺寸不统一，有的横屏有的竖屏，这会给后续处理带来不必要的麻烦。建议先用批量处理工具把图片调整为统一尺寸。

3. 手把手教你标注第一张图片

3.1 启动Labelme并加载图片

安装完成后，打开Labelme（如果是命令行安装的，直接输入labelme命令）。你会看到一个简洁的界面：

点击"Open"按钮选择你的图片文件夹
使用左右箭头键可以在图片间切换
右下角可以调整图片显示大小

第一次使用时，我建议你先熟悉这几个快捷键：

Ctrl+鼠标滚轮：缩放图片
空格键：拖动图片
Ctrl+S：快速保存

3.2 开始多边形标注

假设我们要标注图片中的一只猫，操作步骤如下：

点击左侧工具栏的"Create Polygon"按钮（或者按快捷键"P"）
沿着猫的轮廓依次点击，形成多边形节点
遇到曲线部分可以多设几个点
完成一圈后按Enter键闭合多边形
在弹出的对话框中输入标签名称，比如"cat"

这里有几个实用技巧：

按住Ctrl键可以微调节点位置
右键点击节点可以删除
标注复杂物体时，可以先用大块多边形勾勒大致形状，再逐步细化

我刚开始标注时总想一次到位，结果效率很低。后来发现分阶段标注更高效：先粗略标注整体，再逐步添加细节。

3.3 保存标注结果

标注完成后，点击"Save"按钮（或Ctrl+S）保存为JSON文件。Labelme会自动生成一个与图片同名的.json文件，里面包含了所有标注的多边形坐标信息。

重要提示：建议专门创建一个"annotations"文件夹存放这些JSON文件，与原始图片分开管理。这样后续处理会更方便。

4. 将JSON转换为Mask图像

4.1 理解Labelme的输出格式

Labelme生成的JSON文件其实是一个结构化的标注数据，包含了：

图片路径和尺寸信息
每个标注多边形的顶点坐标
对应的类别标签

要将其转换为模型训练可用的Mask图像，我们需要提取这些多边形信息并用纯色填充。

4.2 使用Python脚本转换

下面是我优化过的转换脚本，比网上常见的版本更健壮：

import json import numpy as np import cv2 import os from pathlib import Path def json_to_mask(json_path, output_dir): # 读取JSON文件 with open(json_path, "r") as f: data = json.load(f) # 读取原始图片获取尺寸 img_path = str(Path(json_path).parent / data["imagePath"]) image = cv2.imread(img_path) if image is None: raise ValueError(f"无法读取图片: {img_path}") # 创建空白Mask mask = np.zeros_like(image, dtype=np.uint8) # 处理每个标注形状 for shape in data["shapes"]: points = np.array(shape["points"], dtype=np.int32) # 不同类别使用不同颜色 if shape["label"] == "cat": color = (255, 0, 0) # 红色代表猫 elif shape["label"] == "dog": color = (0, 255, 0) # 绿色代表狗 else: color = (0, 0, 255) # 蓝色代表其他 cv2.fillPoly(mask, [points], color) # 保存Mask图像 os.makedirs(output_dir, exist_ok=True) mask_name = f"{Path(json_path).stem}_mask.png" cv2.imwrite(str(Path(output_dir) / mask_name), mask) print(f"已保存: {mask_name}") # 示例用法 json_to_mask("501.json", "masks")

这个脚本做了几点改进：

自动处理图片路径问题
增加了错误处理
支持不同类别用不同颜色标注
自动创建输出目录

4.3 批量转换技巧

如果你有很多JSON文件需要转换，可以用这个批量处理脚本：

import glob json_files = glob.glob("annotations/*.json") for json_file in json_files: try: json_to_mask(json_file, "masks") except Exception as e: print(f"处理{json_file}时出错: {str(e)}") continue

把这段代码保存为batch_convert.py，然后运行即可一键转换整个文件夹的标注文件。

5. 高级技巧与常见问题排查

5.1 提高标注效率的秘诀

经过多个项目的实践，我总结出这几个提升标注效率的方法：

使用快捷键：
- "P"：快速开始多边形标注
- "D"：复制上一个标注的形状
- "Ctrl+Z"：撤销上一步操作
分层标注法：先标注大致的形状，再用"Edit Polygon"工具细化边缘。我通常分三轮标注：
- 第一轮：快速标注所有目标的大致轮廓
- 第二轮：调整明显不准确的部分
- 第三轮：精细调整边缘细节
团队协作技巧：如果是多人标注，一定要先制定统一的标注规范，包括：
- 哪些物体需要标注
- 标注的精细程度
- 标签命名规则
- 特殊情况处理方式

5.2 常见问题解决方案

问题1：标注时鼠标卡顿

解决方案：降低图片显示质量，在View菜单中勾选"Reduce image quality for faster drawing"

问题2：转换后的Mask有空洞

原因：多边形自相交
解决方案：在标注时避免线段交叉，或者使用cv2.fillPoly的lineType=cv2.LINE_AA参数

问题3：JSON文件损坏

预防措施：定期备份标注文件
修复方法：尝试用文本编辑器打开JSON文件，检查是否有明显错误

问题4：标注结果不精确

解决方案：放大图片局部（Ctrl+鼠标滚轮）进行精细标注，或者使用"Edit Polygon"工具调整已有标注

5.3 与其他工具的配合使用

Labelme生成的Mask可以很方便地用于各种深度学习框架。这里给出两个典型用例：

PyTorch数据加载：

from torch.utils.data import Dataset class SegmentationDataset(Dataset): def __init__(self, image_dir, mask_dir): self.image_paths = sorted(Path(image_dir).glob("*.jpg")) self.mask_paths = sorted(Path(mask_dir).glob("*.png")) def __getitem__(self, idx): image = cv2.imread(str(self.image_paths[idx])) mask = cv2.imread(str(self.mask_paths[idx]), 0) # 灰度模式 return image, mask

数据增强处理：

import albumentations as A transform = A.Compose([ A.RandomRotate90(), A.Flip(), A.RandomBrightnessContrast(), ])

在实际项目中，我通常会先用Labelme标注100-200张样本，训练一个基础模型，然后用这个模型辅助标注剩下的图片，可以大幅提升效率。

查看全文

http://www.jsqmd.com/news/624909/

别再傻傻全量微调了！用Prompt-Tuning冻结大模型，成本直降99%

AI Agent 跑完任务怎么通知你？我写了个微信推送服务八

梅德生物技术快报｜重组蛋白纯化工程化实现：Amuc_0119 蛋白 Ni‑NTA 亲和层析全参数方案

AI原生体验设计为何92%失败？：从LLM幻觉到用户信任断层的5层认知陷阱与修复路径

2、高数----数列极限（知识总结）

CentOS7物理机网卡驱动缺失？手把手教你搞定Intel i219-v网卡驱动安装

Cisco 18系列AP通过u-boot实现tftp镜像启动的详细步骤解析

[具身智能-349]：在MCP架构中，如何部署大模型、启动和初始大模型？MCP Client如何与大模型交互？

OSI七层模型实战指南：从物理层到应用层的网络排错技巧

大模型工程化成本失控的5个信号，第3个90%团队至今未察觉：2026 Q1行业审计报告首发

从网线到Wi-Fi：深入浅出聊聊曼彻斯特编码在以太网中的前世今生

一物一码系统怎么搭建？从0到1的完整实施路径与避坑指南

STEP3-VL-10B效果展示：10B参数轻量模型，图片问答效果媲美百亿大模型

嵌入式系统开发方法论

从75Ω同轴线到100Ω差分线：一文搞懂不同传输线标准下的S参数转换与对比

Silk-v3-decoder技术架构解析：企业级音频格式转换解决方案

3 小时免费完成 Cyber Security 项目并获得证书：快速入门与技能提升

Java垃圾回收算法与性能调优

如何免费解锁Cursor Pro功能：3步实现AI代码编辑器无限使用终极指南

H20服务器多卡运行有错误gpu_partition ，tmux错误

详解指针1

现在不看就晚了：SITS2026圆桌紧急预警——2025Q3起，未建立AI原生ROI动态仪表盘的企业将丧失融资溢价权

中小开发者AI工具选型：Pixel Fashion Atelier对比传统SD WebUI的像素工作流优势

汉鼎建设：用技术解码高端制造的“洁净密码”

序列建模：循环神经网络（RNN）与长短时记忆网络（LSTM）

超轻量级中文OCR识别：4.7M模型实现高效离线文字提取

手把手教你在树莓派上部署OpenPose手势识别，解决卡顿实现实时检测

深入解析RT-Thread MSH_CMD_EXPORT机制及其在嵌入式开发中的应用

自动化运维工具开发

设计剧本杀门店剧本版权，按月摊销简易账务实操方案。