当前位置: 首页 > news >正文

中医药 AI 智能识别 中药材自动化分拣 建立基于深度学习YOLOV8中药检测系统 白茯苓 白芍 白术 栀子 甘草 当归 黄精 冬虫夏草 黄精 肉桂

医学中医-中草药检测数据集
45种中草药图集已标注,YOLO格式

训练集:8500张
验证集:1500张
每种中药有1000张图片


1

1


🌿 中草药检测数据集(YOLO格式)

总类别数:45 种
总图像数量:10,000 张
标注框总数:16,754 个
标签格式:YOLO(.txt)
文件格式:JPG / PNG

项目内容说明
数据集名称中草药检测数据集(45类)
类别数量45 类
总图像数量10,000 张
标注框总数16,754 个(平均每个图像约 1.68 个目标)
数据划分
– 训练集8,500 张
– 验证集1,500 张
每类样本数量原始设计为“每种中药有 1000 张”,但实际统计显示部分类别不足(如人参仅90张)
标注方式手动标注(使用 LabelImg 或类似工具),边界框(Bounding Box)
标签格式✅ YOLO 格式.txt文件:
class_id x_center y_center width height(归一化坐标)
• 支持直接用于 YOLOv5/v8 等模型训练
图像格式JPG / PNG(高清扫描图或实物拍摄)
图像分辨率多样化(常见 800×600 至 2048×1536,取决于拍摄设备)
背景复杂度包含纯白背景、木质桌面、药材堆叠等场景,适合真实应用
典型应用场景• 中药材智能识别
• 药材质量分级
• 中医AI辅助诊断系统
• 自动化分拣机器人

📊 类别统计表(前45类)

类别ID类别名称图片数量标注数量
0白茯苓309555
1白芍356860
2白术452853
3蒲公英177177
4甘草3941026
5栀子190190
6党参340522
7桃仁96172
8去皮桃仁164164
9地肤子280280
10牡丹皮5178
11冬虫夏草359675
12杜仲106112
13当归518925
14杏仁179180
15何首乌267598
16黄精298499
17鸡血藤146146
18枸杞477807
19莲须292341
20莲肉415613
21麦门冬141176
22木通201201
23玉竹228833
24女贞子258286
25肉苁蓉203271
26人参90108
27乌梅191191
28覆盆子167167
29瓜蒌皮164164
30肉桂330431
31山茱萸212212
32山药8686
33酸枣仁276298
34桑白皮122122
35山楂310474
36天麻9797
37熟地黄407508
38小茴香165165
39泽泻126186
40竹茹121130
41川贝母133228
42川芎5611173
43玄参149149
44益智仁265325
总计-10,00016,754

⚠️备注

  • 总图片数为 10,000 张,但部分类别远少于 1000 张(如“人参”仅90张,“山药”86张),可能为标注未完成或采样不均;
  • “川芎”类别标注最多(1173个),可能是多粒密集分布;
  • “蒲公英”和“鸡血藤”等类别标注数量等于图片数,说明每图仅一个目标。

📁 数据目录结构示例

herbal_dataset/ ├── images/ │ ├── train/ # 8500 张 │ ├── val/ # 1500 张 │ └── test/ # (可选) └── labels/ ├── train/ # 对应 .txt 文件 └── val/

✅ 支持的模型任务

任务类型是否支持说明
目标检测(YOLO)使用 YOLOv5/v8 可直接训练
分类任务可提取特征用于分类器
实例分割(Mask)无 mask 标注
多标签识别单目标为主

🛠️ 推荐训练方案(YOLOv8)

1. 创建data.yaml
# data.yamlpath:./herbal_datasettrain:images/trainval:images/valnc:45names:['白茯苓','白芍','白术','蒲公英','甘草','栀子','党参','桃仁','去皮桃仁','地肤子','牡丹皮','冬虫夏草','杜仲','当归','杏仁','何首乌','黄精','鸡血藤','枸杞','莲须','莲肉','麦门冬','木通','玉竹','女贞子','肉苁蓉','人参','乌梅','覆盆子','瓜蒌皮','肉桂','山茱萸','山药','酸枣仁','桑白皮','山楂','天麻','熟地黄','小茴香','泽泻','竹茹','川贝母','川芎','玄参','益智仁']
2. 训练代码(train.py
fromultralyticsimportYOLO model=YOLO('yolov8n.pt')# 或 yolov8s.ptresults=model.train(data='data.yaml',epochs=100,imgsz=640,batch=16,name='herbal_detection',device=0,patience=20,hsv_h=0.01,hsv_s=0.5,hsv_v=0.3,degrees=10.0)

🌱总结:该数据集是中医药 AI 智能识别的宝贵资源,适用于中药材自动化分拣、质量控制、中医教学系统等场景。尽管部分类别样本偏少,但整体覆盖广泛,适合构建高性能目标检测模型。

http://www.jsqmd.com/news/224525/

相关文章:

  • Qwen3-VL智能园艺:植物养护系统实战
  • 基于Python + Flask电商比价可视化分析系统(源码+数据库+文档)
  • Qwen3-VL动物植物识别:生物多样性检测实战案例
  • AI助力VS Code在Win7上的最后兼容方案
  • 电商数据大屏实战:Vue+ECharts完美解决方案
  • Qwen3-VL-WEBUI OCR增强功能详解:32语种文档解析部署教程
  • 基于SpringBoot的农产品溯源系统(源码+lw+部署文档+讲解等)
  • 1小时打造PDF处理MVP?用PDF24 TOOLS快速验证创意
  • Qwen3-VL-WEBUI社交媒体分析:多模态内容审核部署
  • 基于Python + Flask网易云音乐数据分析与可视化系统(源码+数据库+文档)
  • Qwen3-VL-WEBUI入门教程:图文融合理解任务快速上手
  • 基于SpringBoot的农产品销售小程序的设计与实现(源码+lw+部署文档+讲解等)
  • 计算机毕业设计|基于springboot + vue智慧养老院管理系统(源码+数据库+文档)
  • 5个必学的D3.js数据可视化工具:从入门到精通指南
  • Qwen3-VL数学竞赛:解题辅助系统实战
  • Qwen3-VL书籍内容提取:长文本回忆功能实战教程
  • 基于Python + Django协同过滤算法电影推荐系统(源码+数据库+文档)
  • 5个最火AI镜像推荐:Qwen2.5-7B 0配置开箱即用,10块钱全试遍
  • 开源赋能智慧能源管理:技术全解
  • 用YOCTO快速验证硬件设计:48小时完成BSP开发
  • 效率对比:传统MD写作 vs VS Code插件方案
  • Qwen3-VL-WEBUI金融票据识别:多语言OCR部署案例
  • 信创部署,源码交付!县域低空经济无人机 AI 巡检平台,高空哨兵、一键起飞、航线规划、三维点云建模、30+ YOLO视频识别算法
  • 基于Python + Django协同过滤的招聘推荐系统(源码+数据库+文档)
  • THREE.JS小白入门指南:中文文档+AI助你轻松上手
  • AI人脸动画革命:从静态照片到生动对话的技术突破
  • Tailwind CSS极简入门:10分钟搭建第一个页面
  • SENET vs 传统CNN:性能与效率的量化对比
  • 体验Qwen2.5-7B省钱攻略:按需付费比买显卡省90%
  • AI提示词网站VS传统搜索:效率提升300%的秘密