当前位置: 首页 > news >正文

半监督食物图像分类项目

模型完成的任务是识别11种不同的食物(比如面包、牛奶、蔬菜等)。

监督学习:需要大量的“图片 + 标签”数据,但数据的标注很费时间

半监督学习:只用少量的有标签数据 + 大量无标签的数据(只有图片,没有标签)来训练模型,效果比只用少量有标签数据好很多

模块1:固定随机种子(保证结果可复现)

机器学习很多的随机操作:模型参数的随机初始化

训练时打乱数据顺序

数据增强的随机裁剪/旋转

如果没有固定随机种子,这次跑过的结果和下次跑的结果不可能一样。固定种子后,可以是可以复现,方便调参和验证改进。

模块2:数据准备与预处理

2.1数据增强:让模型“见多识广”

为什么要做数据增强?

数据增强就是通过随机裁剪、旋转,把1张图片变成 “多张不同但相似的图片”,增加数据的多样性,防止模型死记硬背(过拟合), 让他学到更通用的特征(比如“面包的形状”而不是 “这张特定图片里的面包”

验证集为什么不要做数据增强?

验证集用来考试的,要考模型的真实水平,所以不能给它“做过手脚的题”,要用原始、标准的图片。

无标签数据为什么返回的是原始图?

后面的半监督学习要用到“原始图片”来生成伪标签,所以先存一份

数据是怎么存的?

代码首先将所有的图片读进内存,而不是训练时再从硬盘读取。

原因:数据集比较小,这样做的训练速度更快,不要每次都等硬盘读取。

模块3:模型构建

1、卷积层:相当于眼睛,复制看图片的特征。

第一层卷积看“边缘”(比如面包的轮廓), 后面的卷积看“更复杂的特征”(比如面包的纹理、蔬菜的颜色)。

2、BatchNorm2d:像“给大脑按摩”,让每一层的输入分布稳定,防止梯度小时/爆炸(简单说就是防止“大脑学习不进去”)。

3、ReLU激活函数:引入“非线性”, 如果没有他,模型就像“只会做加减乘除的计算器”,不会复杂的食物分类。

4、Pooling: 把图片进行缩小,保留最明显的特征,减少计算量

5、全连接层:把前面提取的特征综合起来,输出“这张图是11种食物的概率”

为什么使用迁移学习:

加快模型的训练速度,预训练使用VGG模型,他是一个已经训练好的模型,我们只要微调最后几层。

模块4:半监督学习(“伪标签”让无标签数据发挥作用)

4.1什么是“伪标签”?

原理:先用有标签数据训练一个初始模型,用他预测无标签数据,把预测概率超过0.99(非常确定)的样本跳出来,把模型的预测结果当作“伪标签”,加入训练集。

4.2为什么只选概率 > 0.99的样本?

模型刚开始的时候训练的不好,预测的结果可能不是很准确,因此只选择“非常确定”的样本,才能保证伪标签带概率是对的 —— 如果把错的伪标签加进去,模型会“学坏”。

模块5:模型训练,不断的卷积

http://www.jsqmd.com/news/491510/

相关文章:

  • 国内首个,面向中小企业数据资产估值体系:“荟宸信科面向中小企业数据资产估值体系”正式发布(一)
  • iPhone开发 - %1$、%2$的写法
  • 就让我们从react的渲染逻辑出发吧
  • WordPress报错:preg_match() Compilation failed 错误解决方法
  • 【跨端技术ReactNative】JavaScript学习
  • 长亭 Xray Web 漏洞扫描器
  • 行业大咖谈数据资产|中海油如何规划数据资产管理?央企硬核实践拆解
  • 湘潭品牌设计公司权威推荐榜单
  • 零/负电价来了!储能业主如何抓住机遇?
  • 中小企业可用福尔蒂轻量化改性套件:含17种PA6/PBT配比+免费云端模拟
  • es为什么快面试回答
  • 筋膜提升第几天最肿
  • 深入解析HDFS:定义、架构、原理、应用场景及常用命令
  • 5 分钟搭建 Deepseek 私有化 RAG 知识库!支持多模型切换 + 激活验证 + 增量索引
  • 高级技巧-让AI自我迭代
  • 香港Web3区块链安全公司排行榜前三都有哪些公司?
  • openclaw、workbuddy上必装的12个RAG 应用 Skill 技能
  • 带你轻松了解半导体CIM系统之AMHS (二)
  • Android Studio 安装保姆级教程(mac版)
  • 巴菲特的持股策略:为什么长期持有是关键
  • 2026选不停机换单印刷机源头厂家,看这几点错不了,质量好的不停机换单印刷机技术实力与市场典范解析 - 品牌推荐师
  • 团队最佳实践
  • 改性塑料行业‘iOS生态’初现:福尔蒂开放6大基础配方API供下游二次开发
  • Redis性能提升3倍的5个冷门技巧,90%开发者都不知道!
  • 提示工程容灾备份策略中的网络依赖:架构师教你解决带宽+延迟问题
  • SQL Server 学习笔记:从 MySQL 到 SQL Server
  • 如何用NFC标签直接打开应用的某个功能?技术深度解析与商业落地
  • 开关接触不良?数据说了算!回路电阻测试仪应用与选购实战 - 品牌推荐大师
  • Git操作指南
  • 2026年五年一贯制专转本机构推荐及选择参考 - 品牌排行榜