当前位置: 首页 > news >正文

无需照片和 GPU,仅八个问题就能重建 3D 人体模型,效果还超棒!

仅需八个问题,无需照片和 GPU 即可重建 3D 人体模型

2026 年 4 月 22 日,工程、机器学习、人体重建、生产领域有了新成果。只需回答八个问题,就能输出 58 个 Anny 人体参数。一个经过物理感知损失函数训练的小型 MLP 模型,能在 CPU 上以毫秒级速度运行。身高预测精度可达 0.3 厘米,体重 0.3 千克,胸围、腰围、臀围的误差在 3 - 4 厘米之间。在周长测量方面,这比基于照片的重建方案效果更好,而且无需照片。这就是问卷式重建方案。

背景故事

当想要创建数字替身时,人们自然会想到基于 HMR 照片的重建方法,但这种方法有优缺点。在一次项目低谷期,研究人员提出观点:仅通过身高和体重(无需照片)进行简单的线性回归,就能以 1.2 - 1.6 厘米的平均绝对误差(MAE)预测 15 个人体尺寸。一开始,觉得这似乎不太合理,但对比身边朋友情况后,觉得可能有一定道理。

不只是身高和体重

直观地说,相同身高和体重的人可能有不同体型。下载原始回归模型的权重并在验证集上测试,未经处理的胸围、腰围、臀围的平均绝对误差约为 9 - 11 厘米,最差可达 25 厘米左右。部分误差是由于测量标准不匹配造成的,纠正偏差后,胸围、腰围、臀围的平均绝对误差降至约 7 厘米。Anny 模型在固定身高和体重的情况下有明显的体型变化,而身高 + 体重的回归模型无法捕捉到这些变化。

还有哪些因素有参考价值

相同的身高和体重可能产生不同的体型,可以通过更多参数区分。明显的参数有体型/腹部情况、身材形状、罩杯尺寸。在数据集上计算发现,每个特征都有价值。体型特征在倒三角形身材中最为明显。在极端情况下,相同身高和体重,不同身材形状,胸围可能相差 25 厘米,臀围相差 30 厘米,服装尺码可能相差六个号。问卷式方法的理论最佳腰围平均绝对误差约为 1 厘米。

模型与数据集

上一篇文章介绍了可用的人体模型,初始阶段后只使用 Anny 模型。生成并用于分布分析、训练和验证的数据集包含数万个合成人体模型。Anny 模型有很多混合形状参数,挑选了 58 个相关参数。8 个问卷问题经过独热编码后变成 20 个特征,输入空间是 20 个特征,输出空间是 58 个参数。训练了男女各一个模型。

训练小型 MLP 模型

原始论文使用简单的回归方法预测参数,在合成数据集上,该方法的胸围、腰围、臀围平均绝对误差约为 2.5 厘米,但体重误差较大。因此转向 MLP 模型,它有两个隐藏层,每层 256 个神经元,使用 ReLU 激活函数,并采用了一些 Dropout 技术。模型权重约为 85 KB,在笔记本电脑上每个性别大约需要 60 分钟进行训练。损失函数是关键,将前向传播纳入损失函数,缩小了体重误差。

实际效果

身高预测问题基本解决,男女平均绝对误差均为 0.3 厘米。体重预测也很准确,平均约为 0.3 千克。周长测量更具挑战性,胸围、腰围、臀围的误差在 3 - 4 厘米之间,腰围误差最大。除跟踪平均值外,还跟踪 95% 分位数和最大值,并积极优化。与 Bartol 的身高 + 体重回归模型和基于照片的重建方案相比,问卷式方法无需照片,效果更优。在真实人群上验证,解决体重计算问题后,真实人群数据与合成数据一致。这是一个统计模型,是进行测量调整的很好基础。

经验教训

最令人惊讶的是 Anny 人体测量模块在实际应用中的不一致性。人体密度不是固定值,男性和女性的人体密度不同,“肌肉比脂肪重”。使用按性别划分的仅组织密度中位数校正,经验表明这种方法有效。每 1 厘米都很重要,躯干周长变化会影响体重计算。通过体脂率估算调整密度,对体重预测准确性有很大影响。

这是最终方案吗?

文章未明确给出答案,值得思考。

亲自体验

文章未详细说明如何体验,留给读者去探索。

http://www.jsqmd.com/news/701080/

相关文章:

  • 2026年靠谱的水暖温控器优质厂家推荐榜 - 行业平台推荐
  • Terraform实战进阶:从模块化到CI/CD的完整技能树构建
  • varlock:变量级版本感知锁在Go并发控制中的实践
  • 如何用 Object.keys 与 getOwnPropertyNames 遍历键名
  • 2026年国产雪茄服务机构TOP名录:高希霸、高端雪茄、中式雪茄、入门雪茄、古巴雪茄、大卫杜夫、手工雪茄、新手雪茄选择指南 - 优质品牌商家
  • NVIDIA Profile Inspector完整指南:5步解锁显卡隐藏性能,告别游戏卡顿
  • 04华夏之光永存:黄大年茶思屋19期完美解榜战略价值总纲 三题全解赋能华为构筑AI时代核心战略壁垒
  • 终极指南:3步永久备份QQ空间说说的完整解决方案
  • 强化学习训练LLM智能体:从PPO、GRPO到工具使用的技术全景与实战指南
  • 5步轻松掌握人类微生物组数据分析:curatedMetagenomicData完整指南
  • Pentaho Kettle架构演进:从传统ETL到现代化数据集成平台的范式转移
  • 重大变革!AI Agent让CPU重回C位
  • AI驱动的Web质量优化:web-quality-skills技能包实战指南
  • Star-Office-UI:面向中后台管理系统的Vue 3场景化UI组件库深度解析
  • 2026年3月靠谱的油水分离设备直销厂家口碑推荐,使用寿命长滤芯,减少更换频率 - 品牌推荐师
  • AI指令库:用Slash Commands固化团队开发工作流
  • TestDisk PhotoRec终极指南:如何通过5步专业流程快速恢复丢失的分区与文件
  • 2026年Q2LED显示屏交钥匙工程标杆名录:成都LED显示屏高端定制、成都京东方LED显示屏、成都会议中心LED显示屏选择指南 - 优质品牌商家
  • 2026成都货车售卖性价比解析:双流新能源冷藏车售卖/双流新能源冷藏车租赁/双流货车售卖/双流货车租赁中心/成都新能源冷藏车配件售卖/选择指南 - 优质品牌商家
  • 半导体芯片论坛推荐:汇聚行业专家学者,共议芯片产业创新发展之路 - 品牌2026
  • 用AI写脚本没问题,但你得让它同时教你
  • 从回调认识动态代理 (Java)
  • 自学网络安全的三个必经阶段(含路线图)_网络安全自学路线
  • 内存安全不是选配项:工信部《智能网联汽车软件供应链安全指引(2026试行版)》第3.2.1条强制要求C项目启用-Mmemory-safety=strict,否则不予准入
  • BepInEx游戏插件框架:3分钟解锁你的游戏无限可能 [特殊字符]
  • 你的岗位没了,但有人比你更忙
  • 优先级函数:实时系统开发的革命性范式
  • 晶圆制造行业展会哪家好?精选制造领域展会推动产业技术创新升级 - 品牌2026
  • 2026年Q2技术分享:负载车出租、静音发电机出租、高压容性负载租赁、ups不间断电源出租、中压发电车、假负载测试租赁选择指南 - 优质品牌商家
  • 【2026年美团暑期实习- 4月25日-算法岗-第三题- 小美的异或问题】(题目+思路+JavaC++Python解析+在线测试)