当前位置: 首页 > news >正文

目标检测论文总结

PointNet: Deep Learning on Point Sets for 3D Classification and Segmentation


直接提取点云的点特征,提取后使用maxpool得到全局特征,然后将点的特征与全局特征进行连接,然后再进行进一步处理。
其中,T-Net的结构这篇博文有介绍。

VoxelNet: End-to-End Learning for Point Cloud Based 3D Object Detection

  • 这篇文博客写的很不错。
  • 采用随机从体素中采样点以进一步提取体素特征,然后使用maxpool得到体素局部特征,使用局部特征与点特征连接,然后在进行进一步处理,最后再次使用maxpool得到体素特征。得到最终的特征后使用区域建议网络生成分类结果和预测框。
  • 该文章中的正负样本指的是
    • 负样本:预测框和所有的真实框iou都小于0.45
    • 正样本:预测框和某个真实框iou大于0.6

      对于预测框与真实框最大iou值大于等于0.45,小于等于0.6的定义为不关注样本,即不计算任何分类损失。

其中,p i p o s ​ p^{pos}_i​piposp i n e g ​​ p^{neg}_i​​pineg​​分别表示正样本a i p o s a^{pos}_iaipos和负样本a i n e g a^{neg}_iaineg的Softmax输出,u i , u i ∗ u_i,u^*_iui,ui分别表示神经网络的正样本输出的标注框和真实标注框。损失函数的前两项表示对于正样本输出和负样本输出的分类损失(已经进行了正规化), 其中,L c l s L_{cls}Lcls表示交叉熵,α \alphaαβ \betaβ是两个常数,它们作为权重来平衡正负样本损失对于最后的损失函数的影响。L r e g L_{reg}Lreg​表示回归损失,这里采用的是Smooth L1函数。

PointPillars: Fast Encoders for Object Detection from Point Clouds

该方法是在点云空间中长体素柱,将点云空间直接降维到二维。简单来说,如果点云的范围是限定为[ x m i n , y m i n , z m i n , x m a x , y m a x , z m a x ] [x_{min},y_{min},z_{min},x_{max},y_{max},z_{max}][xmin,ymin,zmin,xmax,ymax,zmax],那么在PointPillars中,使用的体素的高度为z m a x − z m i n z_{max}-z_{min}zmaxzmin

需要注意的是PointPillars同样通过限制体素中点云的最小个数与体素的最大数目来对最终的体素数目进行限制。

具体网络结构可以参考这博文

http://www.jsqmd.com/news/901042/

相关文章:

  • 3种场景下的Playnite便携版配置:跨设备游戏库管理完全指南
  • 基于Snowflake与AI向量搜索构建企业级知识产权查重系统
  • 独立开发者如何借助Taotoken的Token Plan降低项目长期成本
  • OpenAI Privacy Filter实战教程:Transformers与Transformers.js双框架调用指南
  • 使用PubMedBERT-base-embeddings构建医学文献语义搜索引擎的5个步骤
  • 从ReactNativeOne学习:如何构建一个完整的React-Native应用架构 - 终极指南
  • Arduino-ESP32终极指南:如何用Arduino轻松开发ESP32物联网项目
  • 如何用Zotero Style插件实现文献阅读进度可视化与智能管理:终极指南
  • FModel终极指南:5分钟掌握虚幻引擎游戏资源提取的完整流程
  • 基于LangGraph构建Android项目智能审计代理:架构设计与工程实践
  • Claude Skills与Commands实战解析:AI编程搭子的自动化利器
  • 写毕业论文用哪个AI?2026年精选6款写论文的AI软件测评,为你打造高质量论文
  • 别再只会用微信截图了!这5种截取右键菜单的隐藏技巧,总有一款适合你
  • bert-base-italian-uncased实战:10个意大利语NLP应用场景
  • 3步解锁微信聊天记录的终极价值:让数字记忆真正属于你
  • FiberPO优化框架揭秘:JoyAI-LLM-Flash-INT4如何提升复杂任务稳定性?
  • 企业级龙虾 Claw 产品怎么选?团队能不能用龙虾?
  • 目前好用的 AI 视频创作平台有哪些?2026 实用平台盘点
  • 别再死记硬背了!用Verilog手搓一个带握手的同步FIFO,从波形图理解Valid/Ready信号
  • Zotero Style终极指南:5分钟打造高效文献管理系统
  • 从半加器到前缀加法器:用Verilog HDL手把手教你搭建一个32位CPU加法单元(附完整代码)
  • 2026年知名的大功率高压清洗机/高压清洗机厂家推荐与选型指南 - 行业平台推荐
  • Gemma-ko-v01未来路线图:即将推出的5大功能,提前了解新特性
  • 2026年评价高的理瓶机二手饮料设备/梁山包膜机二手饮料设备口碑好的厂家推荐 - 行业平台推荐
  • PingFangSC字体包:企业级品牌视觉战略的字体解决方案
  • 别再死记硬背了!用Unity的LookRotation让物体‘看向’目标,这篇保姆级教程带你搞懂原理和实战
  • 别再复制官网代码了!Vue + Ant Design 图标与分隔符的本地化实战(附完整资源包)
  • 手把手教你:MATLAB硬件支持包离线安装与本地化部署全攻略
  • FFmpeg Micro与MCP协议:Claude桌面端视频转码的AI驱动实践
  • Listen