当前位置: 首页 > news >正文

神经网络与深度学习(二)

五、深度学习视觉应用

1、数据集

常用数据集包括MNIST、Fashion-MNIST、CIFAR-10、PASCAL VOC、MS COCO、ImageNet、JFT-300M等。

2、任务评价指标

(1)精确率P与召回率R

P=TP/(TP+FP) ,表示“挑剔”的程度

R=TP/(TP+FN) ,表示“通过”的程度。召回率越高,准确度越低。

精度:(TP+TN)/(TP+FP+TN+FN)

其中,TP:正确划分为正例的个数, FP:错误划分为正例的个数,

FN:错误划分为负例的个数, TN:正确划分为负例的个数。

召回率和准确率之间的关系如图:

(2)平均准确率AP

其中,N表示测试集中所有图片个数,P(k)表示能识别出k个图时的P值,Δr(k)表示识别图片数从k-1变到k时的R的变化情况。

3、目标检测与YOLO

对于给定的图片,找到物体所在的位置,并标注出物体的类别。

(1)yolo v1

输入448*448*3的彩色图片,输出是7*7*30的张量。

损失函数包括:位置误差、置信度误差、类别概率损失

(2)yolo v2

相对于v1,v2有更大的分辨率,使用DarkNet网络,没有fc全连接层,经过5次降采样,输入图片大小必须是32的倍数。

4、全卷积网络与语义分割

FCN是语义分割的经典方法,DeepLab v3是广泛使用的语义分割方法。

http://www.jsqmd.com/news/882299/

相关文章:

  • 贵阳团体服装定制指南:文化衫、广告衫、T恤、POLO、马甲、冲锋衣怎么选?6大本土实力厂家优势解析 - 贵州服装测评君
  • 英特尔 Hammer Lake 处理器将引入统一核心架构并重拾超线程技术
  • GHelper终极指南:华硕笔记本轻量控制工具的专业使用教程
  • 从CentOS迁移到openEuler?手把手教你在vSphere ESXi 7.0上搭建测试环境
  • 免费游戏加速神器OpenSpeedy:5分钟解锁极致流畅体验终极指南 [特殊字符]
  • 机器学习力场微调策略:高效预测LiF中锂离子扩散性能
  • 以书香润心,借坚韧前行
  • CANN 算子拆解:FlashAttention 在 ops-transformer 里的实现逻辑
  • 从PDB到Mol:手把手教你用PyMOL和Open Babel搞定蛋白质-小分子复合物的结构文件转换
  • 内存池仿Nginx C++实现
  • 如何3分钟配置智慧树自动刷课插件:终极高效学习解决方案
  • 终极NCM文件解密教程:一键解锁网易云音乐加密格式
  • 别再只盯着DAVIS数据集了!手把手教你用Python复现Space-Time Memory Networks(附代码)
  • 十二周学习报告
  • 2026哪个品牌的排插好?安全实用与设计感兼具之选 - 品牌排行榜
  • WebFlux + R2DBC 场景下的分库分表预研:从架构选型到落地风险
  • Windows 10/11 下保姆级教程:VMD 1.9.4 和 NAMD 3.0 分子模拟环境一键配置(含注册避坑)
  • 工业异常检测实战:从多模态数据集构建到AI模型评估全解析
  • 引力波透镜探测:参数偏移与似然比检验的统计框架与应用
  • AI 系统分层治理:从用户无感知降级到多能力协同的架构演进
  • [408] [数据结构] 链表-代码基础
  • C# 集合详解:ArrayList 与 List<T>的核心用法与对比
  • 线性系统理论学懵了?手把手带你推导能控性格拉姆矩阵判据(附详细证明步骤)
  • 数据驱动负载减载:应对电力系统网络攻击的智能稳定控制
  • 【Verilog代码规范引起的国产安路编译器不能识别寄存器】
  • common lisp 张量,矩阵计算库介绍
  • 苏州相城区宠物基地口碑推荐榜单一览 - 品牌排行榜
  • 保姆级教程:在Ubuntu20.04上为ROS2机器人项目配置CUDA11.3与TensorRT推理环境
  • SubCube稀疏注意力架构的优势是什么
  • PHP无参RCE