当前位置：首页 > news >正文

Lite-Avatar形象库Linux安装教程：从入门到精通

news 2026/3/26 20:35:38

Lite-Avatar形象库Linux安装教程：从入门到精通

想快速拥有自己的数字人形象？Lite-Avatar让你在Linux上轻松部署实时互动的2D数字人，无需高端显卡，CPU也能流畅运行！

1. 开始前的准备

在动手安装之前，先简单了解一下Lite-Avatar是什么。它是一个开源的2D数字人形象库，能够通过音频实时驱动虚拟形象生成面部动画。简单说就是：你说话，数字人的嘴型和表情就会跟着动起来，效果相当自然。

最棒的是，它不需要昂贵的显卡，普通CPU就能跑到30帧每秒，对硬件要求很友好。无论是做视频聊天、虚拟主播，还是教育应用，都很合适。

你需要准备的东西：

一台Linux系统的电脑（Ubuntu、CentOS等都行）
Python 3.8或更高版本
至少4GB内存（8GB更流畅）
稳定的网络连接（需要下载一些模型文件）

不用担心自己是新手，只要会复制粘贴命令，就能跟着教程完成安装。

2. 环境检查与基础配置

打开你的终端，我们先检查一下基础环境是否到位。

检查Python版本：

python --version # 或者 python3 --version

如果显示Python 3.8或更高版本，那就没问题。如果版本太低，需要先升级Python。

安装Git（如果还没有）：

# Ubuntu/Debian系统 sudo apt update sudo apt install git # CentOS/RHEL系统 sudo yum install git

安装必要的编译工具：

# Ubuntu/Debian sudo apt install build-essential libssl-dev zlib1g-dev # CentOS/RHEL sudo yum groupinstall "Development Tools" sudo yum install openssl-devel zlib-devel

这些是基础开发工具，确保后续安装过程不会出错。

3. 获取Lite-Avatar项目代码

现在我们来下载Lite-Avatar的源代码。推荐使用Git来克隆项目，这样以后更新也方便。

克隆项目仓库：

git clone https://github.com/HumanAIGC-Engineering/OpenAvatarChat.git cd OpenAvatarChat

进入项目目录后，还需要下载一些子模块：

更新子模块：

git submodule update --init --recursive --depth 1

这个过程可能会花点时间，取决于你的网速。如果遇到网络问题，可以多试几次，或者换个网络环境。

4. 安装Python依赖包

Lite-Avatar需要一些Python库的支持。推荐使用虚拟环境来管理依赖，这样不会影响系统其他的Python项目。

创建虚拟环境：

python -m venv liteavatar-env source liteavatar-env/bin/activate

激活虚拟环境后，你的命令行前面会出现(liteavatar-env)的提示，表示现在在这个环境中操作。

安装核心依赖：

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cpu pip install modelscope==1.25.0 openai==1.74.0 pip install opencv-python-headless==4.11.0.86 pip install gradio==5.9.1 fastapi==0.115.0

这里安装的是CPU版本的PyTorch，因为Lite-Avatar主要在CPU上运行。如果你有NVIDIA显卡并且想用GPU加速，可以安装CUDA版本的PyTorch。

安装音频处理相关依赖：

pip install funasr==1.2.6 vocos==0.1.0 pip install edge-tts==7.0.0 pydub==0.25.1

这些库负责音频的处理和合成，是数字人能够"说话"的关键。

5. 下载模型文件

Lite-Avatar需要一些预训练的模型文件才能工作。这些文件比较大，需要耐心等待下载完成。

下载SenseVoice语音识别模型：

python -m modelscope download --model iic/SenseVoiceSmall --local_dir ./models/iic/SenseVoiceSmall

下载LiteAvatar数字人形象库：

python -m modelscope download --model HumanAIGC-Engineering/LiteAvatarGallery --local_dir ./resource/avatar/liteavatar

这个形象库包含了100个预训练的数字人形象，你可以根据需要选择使用哪个。

下载口型动画模型：

wget https://virutalbuy-public.oss-cn-hangzhou.aliyuncs.com/share/aigc3d/data/LAM/LAM_audio2exp_streaming.tar -P ./models/LAM_audio2exp/ tar -xzvf ./models/LAM_audio2exp/LAM_audio2exp_streaming.tar -C ./models/LAM_audio2exp rm ./models/LAM_audio2exp/LAM_audio2exp_streaming.tar

解压后检查一下文件是否完整，应该能看到一个pretrained_models文件夹。

6. 配置运行环境

模型下载完成后，我们需要进行一些配置才能正常运行。

创建配置文件：

cp config/chat_with_openai_compatible_bailian_cosyvoice.yaml config/my_liteavatar.yaml

编辑配置文件：用你喜欢的文本编辑器打开config/my_liteavatar.yaml，找到以下部分进行修改：

LiteAvatar: module: avatar/liteavatar/avatar_handler_liteavatar avatar_name: "20250408/sample_data" # 默认形象，可以改成其他形象 fps: 25 # 帧率，可以根据性能调整 use_gpu: false # 如果没有GPU或者想用CPU，保持false

如果你有GPU并且想使用GPU加速，可以把use_gpu改为true，但通常CPU版本已经足够流畅。

设置环境变量：

export PYTHONPATH=$PYTHONPATH:$(pwd)/src

这个设置让Python能够找到项目中的模块。

7. 运行测试

现在一切准备就绪，让我们来测试一下安装是否成功。

运行演示程序：

python src/demo.py --config config/my_liteavatar.yaml

如果一切正常，你会看到一些启动日志，最后显示类似这样的信息：

Running on local URL: http://127.0.0.1:8282

打开浏览器访问这个地址，就能看到Lite-Avatar的界面了。

测试音频驱动：在界面中点击麦克风图标，说几句话，看看数字人的嘴型是否跟着动起来。第一次运行可能会需要一些时间初始化模型，耐心等待一下。

如果看到数字人随着你的声音做出相应的口型动作，恭喜你，安装成功了！

8. 常见问题解决

安装过程中可能会遇到一些问题，这里列出几个常见的解决方法：

问题1：下载模型时网络超时

# 可以设置代理或者重试几次 python -m modelscope download --model iic/SenseVoiceSmall --local_dir ./models/iic/SenseVoiceSmall --retry 5

问题2：内存不足如果运行时报内存不足，可以尝试降低帧率：

LiteAvatar: fps: 15 # 从25降低到15

问题3：音频设备问题如果麦克风无法使用，检查系统音频设置：

# 列出音频设备 arecord -l

问题4：Python包冲突如果遇到包版本冲突，可以重新创建虚拟环境：

deactivate # 退出当前环境 rm -rf liteavatar-env # 删除旧环境 # 然后重新创建环境和安装依赖

9. 下一步学习建议

成功安装只是第一步，这里有一些建议帮助你更好地使用Lite-Avatar：

探索不同形象：形象库中有100个不同的数字人形象，尝试换几个看看效果如何。只需要修改配置文件中的avatar_name参数即可。

调整性能参数：如果觉得运行不够流畅，可以尝试调整帧率、音频采样率等参数，找到性能和效果的平衡点。

集成到自己的项目：Lite-Avatar提供了API接口，可以集成到你自己的应用程序中。查看项目文档了解如何调用。

学习自定义形象：进阶使用可以学习如何训练自己的数字人形象，这样就能创造独一无二的虚拟形象了。

记得定期查看项目更新，开发团队经常会修复bug和添加新功能。如果遇到问题，可以在项目的GitHub页面提交issue，社区很活跃，通常能得到及时的帮助。

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

查看全文

http://www.jsqmd.com/news/426733/

Ollama镜像免配置部署embeddinggemma-300m：中小企业AI基础设施新选择

比迪丽AI绘画STM32嵌入式应用：低功耗设备上的图像生成优化

PP-DocLayoutV3新手入门：从部署到API调用，完整流程解析

Cogito-V1-Preview-Llama-3B在有限上下文窗口下的长文档处理效果

Python数据分析：SenseVoice-Small语音识别结果挖掘

QwQ-32B+ollama企业落地：跨境电商合规条款自动审查与建议

Qwen3-Embedding-4B医疗应用：病历语义搜索系统搭建

Local AI MusicGen在人工智能课程中的应用

DeepSeek-R1-Distill-Qwen-1.5B模型在边缘设备上的部署：树莓派实战案例

daily_stock_analysis模型剪枝技术详解

Qwen3-TTS-12Hz-1.7B-VoiceDesign实操手册：批量文本转语音脚本编写

雪霁犹寒，樱破微丹。向阳枝、雀争偏园。柳丝未展，悄笼碧烟。有茶初沸，酒新暖，妻儿团。素妆银砌，翠纱青鬟。喏东君，慢送烂漫！欲留琼屑，又恐春阑。怕梅香褪，桃云腻，絮漫天

DAMOYOLO-S新手入门指南：3步搭建Web界面，小白也能玩转AI检测

StructBERT语义匹配系统日志分析：从错误日志定位模型推理瓶颈

随笔 #2

Qwen3-ASR-0.6B低代码平台：语音应用可视化搭建

踩坑无数后发现的宝藏库：YoloDotNet让C# YOLO开发效率提升10倍（支持检测/分割/姿态估计/.NET 8.0）

AIGlasses智能盲人眼镜5分钟快速部署：零基础搭建视障导航系统

GME-Qwen2-VL-2B-Instruct部署案例：国产昇腾910B平台适配可行性报告

Jimeng AI Studio技术亮点：Streamlit前端响应式布局与Z-Image-Turbo后端协同

Nano-Banana Studio与Vue3前端集成：服装拆解可视化平台开发

DeOldify与Unity引擎结合：为游戏历史资料片动态上色

Spring_couplet_generation 与Git版本控制：协作开发AI文化项目实践

Ostrakon-VL-8B智能运维：餐饮连锁门店的AI巡检与告警系统

MedGemma X-Ray实操手册：从上传PA视图X光片到获取多维度结构化报告

DAMOYOLO-S新手入门指南：3步搞定环境配置与模型调用

Hunyuan-MT-7B惊艳效果展示：英→维/中→蒙翻译质量对比Google/Tower-9B

Nanbeige4.1-3B实战体验：3步搞定智能问答与长文本处理

FLUX小红书V2图像生成效果展示：GitHub使用教程配图案例

GLM-4-9B-Chat-1M效果展示：输入10万行日志文件，精准定位异常模式与根因分析