当前位置: 首页 > news >正文

机器学习周报五十一

文章目录

    • 摘要
    • Abstract
      • 1.Animatable 3D Gaussian
    • 总结

摘要

本周阅读了论文Animatable 3D Gaussian,对LBS如何将高斯点映射到观测空间有了了解,形成对完整的高斯泼溅重建人体的流程的认识。

Abstract

This week I read the paper Animatable 3D Gaussian and got an understanding of how LBS maps Gaussian points to the observation space, which gave me a sense of the full process of reconstructing the human body with Gaussian splats.

1.Animatable 3D Gaussian

神经辐射场能够重建高质量的可驱动人类化身,但训练和渲染成本很高。为减少消耗,提出可动画化的3D高斯,从输入图像和姿势中学习人类化身。通过在正则空间中建模一组蒙皮的3D高斯模型和相应的骨架,并根据输入姿态将3D高斯模型变形到姿态空间,将3D高斯扩展到动态人类场景。引入哈希编码的形状和外观来加快训练,并提出与时间相关的环境光遮蔽,以在包含复杂运动和动态阴影的场景中实现高质量重建。在新视图合成和新姿态合成任务中,所提出方法在训练时间、渲染速度和重建质量方面都优于现有方法。所提出方法可以很容易地扩展到多人类场景,并在25秒训练时间内实现十人场景的高质量的新视图合成结果。
初始化(规范空间中的可动画3D高斯)
输入:标准人体模板(如SMPL模型,包含约14万个顶点)。
操作:为每个顶点创建一个3D高斯点,并绑定对应的骨骼和蒙皮权重 w(权重固定,不参与优化)。
参数:每个高斯点初始包含位置x 0 x_0x0​、旋转R、缩放S、不透明度α 0 \alpha_0α0​,以及后续待优化的顶点位移σ x \sigma_xσx和球谐系数sh。

多头哈希编码器
预测顶点位移:输入为高斯中心位置x 0 x_0x0和当前帧姿态S t S_tSt​,输出位移σ x \sigma_xσx。这使得高斯点能随姿态变化产生形变。
x 0 , S t → σ x x_0,S_t \rightarrow \sigma_xx0,Stσx
预测球谐系数:输入为位置x 0 x_0x0​,输出颜色系数S H SHSH,实现连续的颜色场。
预测环境光遮蔽:输入为位置X − 0 X-0X0和时间编码y ( t ) y(t)y(t),输出遮蔽因子α 0 \alpha_0α0
位置变形:根据骨骼变换矩阵B i t B^t_iBit和蒙皮权重w i w_iwi,计算变形后的位置x t = ∑ w i B i t ( x 0 + σ x ) x_t=\sum w_i B_i^t(x_0+\sigma_x)xt=wiBit(x0+σx)
旋转变形:高斯的旋转矩阵 R 也通过同样的LBS算法变形,保证各向异性的高斯在姿态变化时方向正确。
视角方向逆变换:渲染时,将相机视角方向从姿态空间逆变换回规范空间,再查询球谐系数,保证颜色随视角变化的一致性。
最后通过高斯泼溅进行渲染。

总结

3D gaussian Animate中的很多流程都比较复杂,但是其中的deformer模块还一直被继续使用到现在,已经对LBS蒙皮等操作的描述,让我了解到高斯泼溅重建人体的完整流程。

http://www.jsqmd.com/news/1091369/

相关文章:

  • Python驱动Aspose.Words:精准提取Word文档结构化数据的实战指南
  • 1Cycle学习率调度器原理与Keras实战指南
  • 非结构化数据服务模型训练的处理方式
  • 3分钟完成Windows包管理器部署:PowerShell一键安装Winget完整指南
  • 许可复用架构的终极形态:许可池+动态调度+透明代理
  • VisualCppRedist AIO:一键修复Windows软件兼容性问题的终极免费方案
  • Coraza WAF企业级实战:从架构部署到规则调优的纵深防御指南
  • Sentaurus工艺仿真入门:从零搭建你的第一个NPN晶体管模型
  • 14 信息管理
  • 2026年最新英语教学智能软件 功能实测及避坑选购实用指南
  • 上海计算机学会2026年月6月赛C++丙组T2 平衡的判定
  • 数据集类(Data Set)与数据加载器(Data Loader)
  • Dialogue-SWEBench解读:Coding Agent真正缺的不是代码能力,而是会提问
  • 深度剖析百度 PaddleOCR-VL 0.9B 的文档解析方案:两阶段架构、统一建模与开源实践
  • 韬定律发布满月追踪:华大九天站上EDA价值重估的“C位”
  • 零基础小白C++逆向学习日记 Day.3
  • 硬盘的总线协议与接口(SATA、NVMe、PCIe)
  • 标题:良心推荐!阿贝云免费虚拟主机与云服务器实测体验
  • Ubuntu 20.04 连接 HC-05 蓝牙模块失败
  • 一个真实案例:图片裁剪引发的数据泄露
  • 【Leetcode】合并区间
  • 七到九年级英语梳理
  • 企业开发模式全景图谱:12种方法论的本质、优缺点与选型指南
  • 终极Gmail账号自动生成器:简单快速创建随机邮箱的完整教程
  • AWS VPC 和 ALB 部署规范
  • Adobe GenP 3.0完整教程:免费解锁Adobe CC全系列软件的终极指南
  • CVE-2023-22527漏洞复现:Confluence命令注入与权限校验缺失分析
  • 大模型MoE架构原理与实战:稀疏激活如何实现2%参数高效推理
  • 1234566
  • 高效解决跨平台音乐播放需求:Groove音乐播放器完整实践指南