当前位置: 首页 > news >正文

新一代LoRA训练打标神器:支持多种打标风格,中英双语标签自由切换,打标效率飙升!

凡是经常训练 LoRA 的人都知道——

给素材打标往往是决定模型质量的关键一步

标签质量的好坏,直接影响到最终 LoRA 模型的训练效果

而且不同的 LoRA 训练任务,

对标签的风格和语言表达要求也各不相同

如果完全依赖人工打标,不仅效率低下,还极其耗费精力

一、自动打标功能

1.打开数据集

新建数据集:在LoRA训练大师中点击"新建数据集",可创建测试数据集(如命名为"test-AI搅拌手")

添加素材:支持添加PNG等格式的图片素材作为训练数据,系统会自动识别素材文件信息(如0026.png等)

素材管理:可查看素材文件的大小、修改日期等信息,支持多选素材批量添加

2.自动打标

1)自动打标过程

打标类型:支持多种标签风格选择,包括:

Stable Diffusion提示词式

口语化描述式

简洁直述式

Danbooru标签(动漫风格)

e621/Rule34标签(特定领域)

参数设置:

随机度:控制生成标签的随机性

打标长度:决定生成标签的详细程度

最大token数:限制生成标签的长度

执行过程:点击"开始打标"后系统自动处理,会显示处理进度和当前处理的素材

效果优化:建议自动打标后人工校对,以获得更好的训练效果

3.中英文标签同时生成

翻译功能:支持将生成的英文标签自动翻译为中文

模型要求:需要提前将HY-MT1.5-1.8B模型放入工作空间的caption_models目录

操作流程:点击"中英翻译"-"开始翻译",系统会自动生成中英文双语标签

完成提示:系统会显示"中文标签已生成,英文标签已生成"的完成状态

过程控制:支持随时停止翻译过程

4.中英文标签同时显示

显示切换:可在界面顶部选择显示中文标签或英文标签

同步编辑:修改主标签内容会自动同步到对应语言的标签文件

文件关联:

中文标签保存在zh.txt/zh.bt文件

英文标签保存在en.txt/en.bt文件

统一修改:支持通过"统一打标"功能批量添加触发词(如"AI搅拌手")

修改方式:可选择追加到头部/尾部,或替换已有标签

5.配置训练任务

数据集选择:在训练配置中可选择已打标的数据集(如test_aijbs)

语言选择:可根据需要选择使用中文或英文标签进行训练

参数设置:

数据分辨率

重复次数

批次大小

采样设置等

任务管理:支持新建、复制、删除训练任务

任务类型:包含常规训练、采样、Loss模型等多种训练类型

二、知识小结

功能模块

核心功能

技术特点

适用场景

对比维度

自动打标

支持多风格标签生成(自然语言/SD提示词格式)

中英文双语支持、自定义标签长度/触发词

LoRa模型训练素材预处理

效率对比:自动打标 vs 人工耗时

标签管理

触发词追加/替换、中英文标签切换

实时同步修改(主标签与翻译标签联动)

适配不同训练需求(如角色类模型需触发词)

灵活性:支持覆盖/追加/替换操作

翻译功能

一键中英互译标签

自动检测原语言、双版本并行生成

非英语用户友好场景

准确性:AI翻译 vs 人工校对

训练配置

中英文标签训练模式切换

数据集与训练任务直接关联(如lora-2.3角色模型)

多语言模型训练优化

效果对比:中文标签 vs 英文标签训练结果

可点击下方原文链接观看视频教程👇

https://comfyit.cn/blog/243/?invite_code=TSH

http://www.jsqmd.com/news/674309/

相关文章:

  • DolphinScheduler 3.x 集成 DataX 保姆级教程:从环境变量到HDFS权限,一次搞定所有坑
  • JVM GC 调优完全指南:从理论到生产实战
  • 探案教学智能体:通用化、可定制的AI探案教学系统
  • 解锁论文“黑科技”:书匠策AI带你玩转期刊论文全流程
  • q q q q q q q q q q q q q q q q q q q
  • Snap.Hutao:Windows原神玩家的7天效率提升完全指南
  • 蓄电池与超级电容双向Buck-Boost变换器仿真研究
  • 从开发机到金融级生产环境:C# AI微服务灰度发布方案(含模型版本路由、自动回滚、Prometheus指标埋点)
  • 从开发机到生产环境:C# 14原生AOT部署Dify客户端的CI/CD流水线设计(GitHub Actions + Azure Pipelines双模板)
  • FutureRestore-GUI 2025版:图形化iOS降级终极解决方案
  • MySQL 分区表设计与维护方案
  • 锡林右轴承座组件工艺及夹具设计(论文+DWG图纸)
  • z z z z z z z z z z z z z z z
  • Agent就绪≠开箱即用,Spring Boot 4.0的3层Agent抽象模型全拆解,92%团队踩坑的Classloader隔离陷阱在哪?
  • [盖茨同步带] 盖茨 Poly Chain® ADV® 同步带 | ADV 14MGT/19MGT
  • 2.2-2.3GO语言接口和错误处理
  • Dify私有化部署卡在“模型加载失败”?揭秘国产GPU(昇腾910B/寒武纪MLU370)驱动层适配关键参数,3步绕过CUDA依赖陷阱
  • 基于安卓的居家养老智能呼救系统毕业设计源码
  • 从零到一:英飞凌TC264在智能车竞赛中的实战应用与避坑指南
  • 铣削组合机床及其工作台设计
  • VNC 显示“Timed out waiting for a response from the computer”的一种解决方案
  • Django Form 与 ModelForm 实战:从留言板 Demo 到图书登记系统
  • 【Dify企业级权限管控实战白皮书】:20年安全架构师亲授RBAC+ABAC双模配置落地五步法
  • 【Dify权限审计黄金标准】:覆盖12类生产环境异常行为的实时告警配置模板(含YAML源码)
  • 宝塔面板如何给公司不同部门的非技术管理员分配特定网站操作权限
  • 韩国浦项科技大学研究团队的“导演思维“
  • 量子纠错条件中 纠错量子操作 R 的分析
  • 全球半导体展会深度解析:为何CSEAC 2026是行业必争之地 - 品牌2026
  • 如何处理SQL大型数据表JOIN超时_分批查询与临时表存储方案
  • **张量核心驱动下的编程语言革新:从PyTorch到自定义DSL的实践与思考**在深度学习迅猛发展的今天,*