当前位置：首页 > news >正文

DeEAR语音情感三维雷达图教程：用Plotly生成交互式语音情绪特征图谱

news 2026/7/10 1:28:12

DeEAR语音情感三维雷达图教程：用Plotly生成交互式语音情绪特征图谱

1. 引言：语音情感分析的价值

想象一下，你正在开发一款智能客服系统，如何判断用户的情绪状态？或者你是一位心理医生，如何客观评估患者的情绪变化？这就是语音情感分析技术的用武之地。

DeEAR（Deep Emotional Expressiveness Recognition）是一个基于wav2vec2的深度语音情感表达分析系统，它能从三个关键维度分析语音情感特征：

唤醒度：说话人是平静还是激动
自然度：语音听起来是否自然流畅
韵律：说话节奏是否富有变化

本文将手把手教你如何用DeEAR分析语音情感，并用Plotly生成直观的交互式三维雷达图，让你的分析结果一目了然。

2. 快速部署DeEAR系统

2.1 环境准备

确保你的系统满足以下要求：

Linux环境（推荐Ubuntu 20.04+）
Docker环境已安装
至少8GB内存
支持CUDA的GPU（可选但推荐）

2.2 一键启动服务

最简单的方式是使用启动脚本：

/root/DeEAR_Base/start.sh

或者直接运行Python应用：

python /root/DeEAR_Base/app.py

服务启动后，在浏览器访问：

http://localhost:7860

3. 使用DeEAR分析语音情感

3.1 上传语音文件

在DeEAR的Web界面中：

点击"上传"按钮选择语音文件（支持.wav格式）
等待系统分析（通常5-10秒）
查看分析结果

3.2 理解分析结果

DeEAR会返回三个维度的评分（0-1范围）：

{ "arousal": 0.82, # 唤醒度（0=平静，1=激动） "nature": 0.65, # 自然度（0=不自然，1=自然） "prosody": 0.73 # 韵律（0=平淡，1=富有韵律） }

4. 用Plotly创建三维雷达图

4.1 安装必要库

pip install plotly pandas

4.2 准备数据

假设我们分析了两段语音：

import pandas as pd data = { "维度": ["唤醒度", "自然度", "韵律"] * 2, "值": [0.82, 0.65, 0.73, 0.45, 0.88, 0.62], "样本": ["愤怒语音"] * 3 + ["平静语音"] * 3 } df = pd.DataFrame(data)

4.3 创建雷达图

import plotly.express as px fig = px.line_polar( df, r="值", theta="维度", color="样本", line_close=True, template="plotly_dark", title="语音情感三维特征对比" ) fig.update_traces(fill='toself') fig.show()

这段代码会生成一个交互式雷达图，可以：

鼠标悬停查看具体数值
点击图例切换显示/隐藏样本
缩放和旋转查看不同角度

5. 进阶技巧与实用建议

5.1 美化雷达图

fig.update_layout( polar=dict( radialaxis=dict( visible=True, range=[0, 1] )), showlegend=True, font=dict(size=16) )

5.2 批量分析技巧

import os results = [] for wav_file in os.listdir("audio_samples"): # 调用DeEAR API分析每个文件 result = analyze_emotion(f"audio_samples/{wav_file}") results.append(result) # 转换为DataFrame便于绘图 df = pd.DataFrame(results)