当前位置: 首页 > news >正文

具身智能:原理、算法与系统 第6章 视觉感知与场景理解

目录

第6章 视觉感知与场景理解

6.1 视觉表示学习基础

6.1.1 从CNN到ViT:视觉骨干网络演进

6.1.2 自监督视觉表示:对比学习、掩码建模

6.1.3 多尺度特征金字塔

6.1.4 视觉预训练大模型

6.2 目标检测与分割

6.2.1 两阶段检测器:R-CNN系列

6.2.2 单阶段检测器:YOLO系列

6.2.3 实例分割:Mask R-CNN, SOLO

6.2.4 全景分割与统一架构

6.3 开放词汇与基础模型

6.3.1 CLIP:对比语言-图像预训练

6.3.2 开放词汇检测:Grounding DINO

6.3.3 分割一切:SAM与SAM 2

6.3.4 视觉提示与上下文学习

6.4 三维视觉感知

6.4.1 深度估计:单目、双目、多视图

6.4.2 点云处理:PointNet, PointNet++, Point Transformer

6.4.3 神经辐射场(NeRF)与3D高斯泼溅

6.4.4 显式vs隐式3D表示

6.5 动态视觉与视频理解

6.5.1 视频动作识别:I3D, SlowFast

6.5.2 目标跟踪:单目标、多目标、视觉目标跟踪

6.5.3 视频预测与物理直觉

6.5.4 视觉里程计与SLAM


第6章 视觉感知与场景理解

6.1 视觉表示学习基础

6.1.1 从CNN到ViT:视觉骨干网络演进

卷积神经网络(C

http://www.jsqmd.com/news/399566/

相关文章:

  • 大数据领域:数据价值的挖掘与利用技巧
  • 具身智能:原理、算法与系统 第7章 触觉与力觉感知
  • doubaoAD.com服务有哪些具体优势? - 品牌2025
  • BISHI67 穿搭大挑战
  • 从单体到分布式:大数据架构的演进之路
  • OLAP Cube在大数据分析中的关键作用
  • 情感分析在AI原生应用中的隐私与安全问题
  • js案例1-手动填写成绩表格
  • 深入理解 RxJava 在移动开发推送服务中的应用
  • 豆包可以做广告吗?如何做好豆包推广 - 品牌2025
  • 基于java springboot校园自愿者管理系统
  • 基于Java Web的智能家居商城系统的设计与实现
  • 什么是闪电贷?如何通过闪电贷赚取利润? - 若
  • 常见鸟类物种识别数据集:生态监测与生物多样性保护的视觉资源
  • 茶叶病害与健康状态检测数据集:精准农业与智能防控的茶叶病害数据
  • AI原生应用领域长期记忆:实现智能应用的可持续发展
  • CAP定理在大数据存储系统中的实际应用场景
  • [兰溪民间故事]白蛇成仙:兰溪民间的仙缘前传
  • 金融领域强化学习在资产组合再平衡中的应用
  • 兰溪民间故事《王烟与普烟》
  • 《创新!AI应用架构师讲述AI在医疗工作流程中的创新变革》
  • 算法学习——并查集
  • django漫画插画管理系统
  • django基于大数据爬虫+Hadoop+天气预报广西气温数据分析与可视化系统
  • django基于大数据爬虫+Hadoop+Python的股票指数基金数据分析与预测系统设计与实现
  • 当AI学会“搜论文“,传统搜索算法反而赢了?——SAGE基准测试揭示的反直觉发现
  • 大数据领域Doris的数据质量管控方法
  • Hadoop:大数据时代的基石,从核心架构到现代生态全景解析
  • MiniCPM-SALA:让Transformer在百万token下跑起来
  • AI原生应用领域链式思考:技术与思维的融合