当前位置: 首页 > news >正文

快速制作 虚拟形象项目 MotionPNGTuber

「2026快速生成虚拟形象(简单版 日本人做)」
链接:https://pan.quark.cn/s/d68311cd48d7

MotionPNGTuber 是一个让创作者能够以相对简单的准备流程,制作出具有生动肢体动作和实时口型互动能力的虚拟形象的工具。

这是一个 MotionPNGTuber 项目 - 一个基于视频的实时口型同步系统。

🎯 项目特点

这是一个介于 PNGTuber 和 Live2D 之间的解决方案,具有以下特点:

  • 🎤 实时口型同步 - 通过麦克风输入让角色嘴部动起来
  • 🎭 情感自动识别 - 根据声音情感自动切换表情
  • 💨 头发和衣物动态 - 使用循环视频实现自然的头发和衣物摆动效果
  • 🌐 浏览器版本 - 轻量级版本,可直接在 OBS 中使用
  • 🎬 多视频切换 - 可通过按钮瞬间切换多个动作
  • 🍎 支持 macOS - 可在 Apple Silicon (M1/M2/M3/M4) 上运行

🚀 如何运行

前提条件

需要安装:

  • Python 3.10
  • uv (包管理器)

快速开始(3 步)

1. 安装依赖
uv sync
2. 启动 GUI
uv run python mouth_track_gui.py
3. 使用示例文件测试

在 GUI 中选择:

  • 视频:assets/assets03/loop.mp4
  • 口部:assets/assets03/mouth

然后按顺序操作:

  • ① 解析→校准 → 调整嘴部位置,按 Space 确认
  • ② 生成口部擦除视频
  • ③ 实时运行 → 对着麦克风说话,嘴就会动了!

说话效果

说话效果

说话效果


📁 准备的材料

1. 循环视频

  • 短视频(几秒左右)
  • 脸部不能被遮挡

2. 口部精灵图(5 张 PNG 图片)

文件说明
open.png张嘴状态
closed.png闭嘴状态
half.png半张开
e.png任意形状
u.png任意形状
  • 图片格式:PNG(支持透明)
  • 推荐尺寸:约 128px 宽度

🔧 其他可用工具

# 多视频切换 GUIuv run python multi_video_live_gui.py# 口部擦除调整器 GUIuv run python mouth_erase_tuner_gui.py# 口部精灵图提取器 GUI(从视频中自动提取 5 张 PNG)uv run python mouth_sprite_extractor_gui.py

📝 注意事项

  • 这个项目使用特定版本的依赖包组合
  • Windows 10/11 支持最好
  • macOS 支持(实验性)
  • 需要特定版本的 PyTorch 和 MMDetection 生态系统
BAT 文件功能
启动口型追踪GUI.bat主程序 - 实时口型同步(最常用)
启动多视频切换GUI.bat多视频切换系统
启动口部擦除调整器.bat调整口部擦除参数
启动口部精灵图提取器.bat从视频中自动提取口部图片

📖 快速上手指南

  1. 双击启动口型追踪GUI.bat启动主程序
  2. 在 GUI 中选择:
    • 视频文件:assets/assets03/loop.mp4
    • 口部目录:assets/assets03/mouth
  3. 按顺序操作:
    • ① 点击 "解析→校准" 按钮
    • ② 调整嘴部位置,按 Space(空格键) 确认
    • ③ 点击 "生成口部擦除视频"
    • ④ 点击 "实时运行"
    • ⑤ 对着麦克风说话,角色嘴部就会动了!

📁 项目结构

bbb-MotionPNGTuber-main/ ├── 启动口型追踪GUI.bat ← 双击运行主程序 ├── 启动多视频切换GUI.bat ├── 启动口部擦除调整器.bat ├── 启动口部精灵图提取器.bat ├── assets/ → 示例素材 │ └── assets03/ │ ├── loop.mp4 → 循环视频 │ └── mouth/ → 口部图片 ├── mouth_track_gui.py → 主程序 ├── .venv/ → 虚拟环境(已配置好) └── uv.lock → 依赖锁定文件
http://www.jsqmd.com/news/392404/

相关文章:

  • 软件测试一篇通
  • 题解:洛谷 P2822 [NOIP 2016 提高组] 组合数问题
  • 【RL+MCS】基于深度强化学习的能效链路自适应联合功率分配与调制编码方案选择【附MATLAB代码】
  • 学会正确看待自己的工作
  • ISAC波形设计新突破!概率去噪增强的PDISAC兼顾感知与通信双性能【附MATLAB+pyython代码】
  • 题解:洛谷 P1983 [NOIP 2013 普及组] 车站分级
  • 这几天的大模型圈,真的有点“卷”过头了
  • 企业H5站点升级PWA (五)
  • 题解:洛谷 P1017 [NOIP 2000 提高组] 进制转换
  • 企业H5站点升级PWA (六)
  • 企业H5站点升级PWA (七)
  • 企业H5站点升级PWA (四)
  • 题解:洛谷 P3916 图的遍历
  • 【硬盘】个人数据备份的各种方式##37
  • 题解:洛谷 P5318 【深基18.例3】查找文献
  • 题解:洛谷 P4017 最大食物链计数
  • 题解:洛谷 P1113 杂务
  • 别只会用 getData!Watcher 注册源码流程全拆解
  • Java线程解析:5种线程创建方法及应用场景 - 指南
  • 题解:洛谷 P2814 家谱
  • 题解:洛谷 P3879 [TJOI2010] 阅读理解
  • 2024 年 09 月 二级真题(1)--数位之和
  • 2026年龙岩连城长汀红白喜事鼓吹铜管乐队演出推荐:客家非遗与市场化服务的平衡之选 - 小白条111
  • 题解:洛谷 P4305 [JLOI2011] 不重复数字
  • 12:内核ROP与提权技术
  • 13:现代内核保护机制与绕过技术
  • 14:跨架构内核漏洞利用差异
  • 超市在线销售与分析|基于Python + Django超市在线销售与分析系统(源码+数据库+文档)
  • AI知识图谱构建:企业智能搜索的底层架构
  • 大数据领域数据中台的教育培训机构数据分析