当前位置: 首页 > news >正文

《计算机视觉:从入门到精通》技术手册 第21章 具身智能与机器人视觉

目录

第21章 具身智能与机器人视觉

21.1 机器人感知基础

21.1.1 机器人视觉传感器:RGB-D, 事件相机, LiDAR

21.1.2 手眼标定与相机外参估计

21.1.3 视觉伺服(Visual Servoing)基础

21.1.4 同时定位与地图构建(SLAM)概述

21.2 视觉-语言-动作(VLA)模型

21.2.1 从视觉-语言到动作预测:RT-1, RT-2

21.2.2 端到端机器人控制与模仿学习

21.2.3 世界模型与预测性视觉表征

21.2.4 2024-2025年进展:OpenVLA, π0

21.3 抓取与操作视觉

21.3.1 抓取检测:矩形抓取表示与角度分类

21.3.2 6D姿态估计与抓取点检测

21.3.3 接触检测与力视觉融合

21.3.4 灵巧操作视觉反馈


第21章 具身智能与机器人视觉

具身智能强调智能体通过物理身体与环境的交互来发展认知能力,机器人视觉作为具身智能的感知基础,需要处理动态环境中的实时视觉反馈、空间定位与操作规划。本章系统阐述机器人视觉的传感器技术、标定方法、视觉伺服控制、SLAM技术,以及视觉-语言-动作模型的最新进展。

21.1 机器人感知基础

http://www.jsqmd.com/news/412190/

相关文章:

  • 【SLAM】为什么像orb slam,vins等视觉SLAM开源算法里,精度上双目常常低于单目?
  • 《计算机视觉:从入门到精通》技术手册 第19章 视觉-语言模型与多模态学习
  • 《计算机视觉:从入门到精通》技术手册 第18章 人体姿态估计与动作捕捉
  • 鲁棒控制:质量块-阻尼器-弹簧系统的设计与分析——案例与实践中的学习手册
  • AI模型训练必看:自监督学习、半监督学习与强化学习全解析!收藏这波干货!
  • 【C++】野指针与内存践踏
  • 收藏!用LangChain+LangGraph打造深度智能体,Python实战代码全解析,轻松应对复杂任务
  • AI产品落地难?3个实战策略教你用业务语言打动决策者,收藏这波干货!
  • DS 做题记录
  • 题解:qoj8800 Triinformathlon
  • 外包干了9天,技术退步明显。。。。。
  • AI进化史诗:从逻辑机器到硅基大脑,爆了!速收藏揭秘通用智能体诞生秘诀!
  • 震惊!单Agent+Skills竟可取代多Agent系统?深度解析论文,附实验结果,建议收藏!
  • P12801/CF1173L [NERC 2022] Lisas Sequences
  • 14:00面试,15:00就出来了,问的问题过于变态了。。。
  • LangGraph实战:让AI按部就班,老板放心收藏!告别AI乱批款,实现严谨SOP自动审批!
  • 2026年AI Agent必看!技能(Skills)与MCP协同+多智能体系统工程实践(收藏版)
  • 2026.2.25
  • HZTG348 [Violet 6]蒲公英
  • P15445 「IXOI R1」永远在一起!
  • 初学Vim中如何输入指数
  • 孤燕 西安
  • 上海净水器厂家怎么选?专业科普+靠谱供应商推荐 - 小坤哥
  • 搞精益生产,流程管理到底有啥用?
  • 线段树优化DP
  • .NET 11 预览版 1 中的新兴架构演进:RISC-V 与 LoongArch 支持的深度技术解析与生态展望
  • 从月薪12K到19K*14薪!收藏这份程序员转行大模型学习指南,小白也能逆袭!
  • 收藏!AI时代,你的决策速度够快吗?爆款Demo背后的产品管理瓶颈
  • AI 翻书指南:一文读懂检索增强生成(RAG)从入门到实战
  • LangChain的DeepAgents框架:让复杂智能体开发像搭积木一样简单,收藏必备!