当前位置：首页 > news >正文

GCN实战：基于DEAP脑电数据的情感分类与图结构构建

news 2026/7/15 14:57:21

1. 从脑电信号到图结构：GCN的情感分类新思路

第一次接触DEAP数据集时，我被32个电极通道的脑电信号难住了——这些密密麻麻的波形图就像天书，直到发现相位同步性这个神奇的概念。想象一下演唱会现场，当观众跟着节奏同步挥舞荧光棒时，这种集体行为就像大脑不同区域间的协同工作。而GCN（图卷积神经网络）正是解读这种"脑内社交网络"的利器。

传统LSTM处理EEG信号就像用耳朵听交响乐——只能捕捉时间维度上的旋律变化。而GCN则像拥有空间听觉的超能力者，能同时感知32个乐器声部（电极通道）之间的和声关系。具体到DEAP数据集，每个电极通道就是图中的一个节点，节点特征可以是delta/theta等频段功率，而边权重则用希尔伯特变换计算的相位同步值，这种构建方式让模型能"看见"大脑区域间的信息流动。

去年帮实验室复现这个项目时，我们先用mne库读取.mat文件，发现原始数据是40个视频×32通道×8064采样点的三维数组。关键的预处理步骤在于：

# 使用Hilbert变换计算相位同步矩阵 def compute_phase_sync_matrix(eeg_data): phase_data = np.angle(hilbert(eeg_data.T)) # 转置后计算相位 sync_matrix = np.zeros((32, 32)) for i in range(32): for j in range(i+1,32): phase_diff = np.cos(phase_data[:,i] - phase_data[:,j]) sync_matrix[i,j] = sync_matrix[j,i] = np.mean(phase_diff) return (sync_matrix > 0).astype(float) # 二值化处理

2. 构建脑电图的三大关键技术细节

2.1 频段特征工程：给脑电波分"频道"

DEAP数据集的采样率是128Hz，按照临床标准我们划分了5个特征频段：

delta(0.5-4.5Hz)：深度睡眠波
theta(4.5-8.5Hz)：创意灵感波
alpha(8.5-11.5Hz)：放松闭眼波
sigma(11.5-15.5Hz)：睡眠纺锤波
beta(15.5-30Hz)：紧张思考波

用mne库计算功率谱密度时，有个容易踩坑的参数是n_overlap：

spectrum = epochs.compute_psd(method='welch', picks='eeg', fmin=0.5, fmax=30., n_fft=128, n_overlap=16) # 重叠采样避免信息丢失

实测发现，当重叠率低于25%时，频段功率特征会出现明显抖动。最终每个epoch输出60维特征（32通道×5频段相对功率），需要做标准化处理才能输入网络。

2.2 图结构优化：从全连接到稀疏化

最初的相位同步矩阵是全连接图，导致GCN计算量爆炸。我们尝试了三种剪枝策略：

阈值法：只保留同步值>0.7的边
KNN法：每个节点只连同步最强的5个邻居
区域分区法：按大脑功能区划分连接

方法	准确率	训练时间
全连接	58.2%	4.2h
阈值法	61.7%	2.1h
KNN法	63.4%	1.5h

2.3 标签重构技巧

原始DEAP的valence/arousal评分是连续值，直接回归效果不佳。我们的二分类改造方案：

# 将4-9级评分转为二进制标签 def label_trans(raw_label): high_arousal = (raw_label[:,0] > 5.5) # 唤醒度 high_valence = (raw_label[:,1] > 5.5) # 愉悦度 return (high_arousal & high_valence).astype(int) # 兴奋且愉悦=1

这种处理虽然会损失部分信息，但让分类边界更清晰。如果想做四分类，可以用笛卡尔积组合两个维度的二分结果。

3. PyG框架下的GCN模型实战

3.1 数据加载的坑与解决方案

用PyTorch Geometric处理EEG数据时，最大的挑战是batch处理。不同于图像数据，图数据的邻接矩阵尺寸不固定。我们的解决方案是：

from torch_geometric.data import DataLoader class EEGDataset(InMemoryDataset): def __init__(self, root, transform=None): super().__init__(root, transform) self.data, self.slices = torch.load(self.processed_paths[0]) def process(self): data_list = [] for i in range(len(features)): edge_index = dense_to_sparse(adj_matrices[i]) # 稠密矩阵转稀疏表示 data = Data(x=features[i], edge_index=edge_index, y=labels[i]) data_list.append(data) data, slices = self.collate(data_list) torch.save((data, slices), self.processed_paths[0])

3.2 网络架构设计心得

经过20多次调参，最终确定的网络结构如下：

import torch.nn.functional as F from torch_geometric.nn import GCNConv, global_max_pool class EmotionGCN(torch.nn.Module): def __init__(self, num_features=60, hidden_dim=32): super().__init__() self.conv1 = GCNConv(num_features, hidden_dim) self.conv2 = GCNConv(hidden_dim, hidden_dim) self.lin = torch.nn.Linear(hidden_dim, 2) def forward(self, data): x, edge_index, batch = data.x, data.edge_index, data.batch x = F.relu(self.conv1(x, edge_index)) x = F.dropout(x, p=0.5, training=self.training) x = F.relu(self.conv2(x, edge_index)) x = global_max_pool(x, batch) # 全局池化代替flatten return F.log_softmax(self.lin(x), dim=1)

关键点在于：

使用global_max_pool保留图的拓扑信息
第二层GCN保持相同维度增强特征提取
dropout率设为0.5防止过拟合

4. 效果对比与调优指南

4.1 与传统方法的性能PK

在相同的数据划分下，我们对比了三种模型：

模型类型	准确率	参数量	训练速度
LSTM	56.8%	82K	1.2h
CNN+GRU	59.3%	145K	1.8h
GCN(本文)	63.4%	54K	2.3h

虽然GCN训练稍慢，但其参数量最少，且具有更好的可解释性——通过分析邻接矩阵权重，我们发现F3-F4通道间连接对愉悦度判断最重要，这与脑科学研究的"前额叶情绪调控"理论一致。

4.2 提升准确率的七个技巧

频段优化：增加gamma波段(30-45Hz)特征，准确率提升1.2%
动态构图：用滑动窗口计算时变相位同步，提升2.4%
注意力机制：在GCN后加SE模块，提升1.8%
数据增强：添加高斯噪声和通道丢弃，提升0.9%
损失函数：改用Focal Loss处理类别不平衡，提升1.1%
融合特征：结合时域标准差和熵特征，提升1.7%
集成学习：三个不同初始化模型投票，提升2.3%

4.3 可视化诊断方法

用PyG的explain模块可以可视化重要节点和边：

from torch_geometric.explain import Explainer, GNNExplainer explainer = Explainer( model=model, algorithm=GNNExplainer(epochs=200), explanation_type='model', node_mask_type='attributes', edge_mask_type='object', ) explanation = explainer(data.x, data.edge_index) print(explanation.edge_mask) # 重要连接权重

这种可视化能直观展示哪些脑区连接对分类贡献最大，比如我们发现枕叶与额叶的连接在识别高唤醒情绪时特别活跃。

查看全文

http://www.jsqmd.com/news/506471/