当前位置：首页 > news >正文

CNN在电力消耗多步时间序列预测中的应用与实践

news 2026/4/27 21:55:38

1. 卷积神经网络在多步时间序列预测中的应用

电力消耗预测一直是能源管理领域的重要课题。随着智能电表和太阳能发电技术的普及，我们获得了大量电力消耗的时间序列数据。这些数据包含了多个与电力相关的变量，可以用来建模甚至预测未来的电力消耗情况。

在众多机器学习算法中，卷积神经网络(CNN)因其独特的优势脱颖而出：

能够自动从序列数据中学习特征
支持多变量数据输入
可以直接输出多步预测的向量

一维CNN在序列预测问题上表现优异，甚至能在一些具有挑战性的问题上达到最先进的水平。本文将深入探讨如何开发用于多步时间序列预测的一维CNN模型。

2. 数据集准备与预处理

2.1 数据集概述

我们使用的是"家庭电力消耗"数据集，这是一个多变量时间序列数据集，记录了单个家庭四年间的用电情况。数据采集于2006年12月至2010年11月，每分钟记录一次观测值。

数据集包含7个主要变量：

global_active_power：家庭消耗的总有功功率(千瓦)
global_reactive_power：家庭消耗的总无功功率(千瓦)
voltage：平均电压(伏特)
global_intensity：平均电流强度(安培)
sub_metering_1：厨房的活性电能(瓦时)
sub_metering_2：洗衣房的活性电能(瓦时)
sub_metering_3：气候控制系统的活性电能(瓦时)

此外，我们可以通过计算得到第8个变量：

sub_metering_remainder = (global_active_power * 1000 / 60) - (sub_metering_1 + sub_metering_2 + sub_metering_3)

2.2 数据清洗与转换

原始数据存在缺失值(用"?"表示)，我们需要先将其标记为NaN，然后将整个数据集转换为float32类型以提高处理效率：

dataset.replace('?', nan, inplace=True) dataset = dataset.astype('float32')

对于缺失值的处理，我们采用简单有效的方法：用24小时前的观测值填充当前缺失值：

def fill_missing(values): one_day = 60 * 24 for row in range(values.shape[0]): for col in range(values.shape[1]): if isnan(values[row, col]): values[row, col] = values[row - one_day, col]

2.3 数据重采样

由于我们的预测目标是未来一周的每日总用电量，因此将分钟级数据重采样为日级数据更为合适：

daily_groups = dataset.resample('D') daily_data = daily_groups.sum()

这样处理后，我们得到了一个更紧凑且更适合我们预测任务的数据集。

3. 模型评估框架

3.1 问题定义

我们将问题定义为：给定最近的电力消耗数据，预测未来一周的每日电力消耗。这是一个典型的多步时间序列预测问题。

3.2 评估指标

我们使用均方根误差(RMSE)作为评估指标，因为它与电力单位(千瓦)一致，且对较大误差更为敏感。对于7天的预测，我们会分别计算每一天的RMSE，并计算整体RMSE作为模型表现的总结。

评估函数实现如下：

def evaluate_forecasts(actual, predicted): scores = list() # 计算每天的RMSE for i in range(actual.shape[1]): mse = mean_squared_error(actual[:, i], predicted[:, i]) rmse = sqrt(mse) scores.append(rmse) # 计算整体RMSE s = 0 for row in range(actual.shape[0]): for col in range(actual.shape[1]): s += (actual[row, col] - predicted[row, col])**2 score = sqrt(s / (actual.shape[0] * actual.shape[1])) return score, scores

3.3 训练集与测试集划分

我们将前三年的数据(2007-2009)作为训练集，最后一年的数据(2010)作为测试集。数据按标准周(周日至周六)进行组织：

def split_dataset(data): # 分割为标准周 train, test = data[1:-328], data[-328:-6] # 重组为每周数据窗口 train = array(split(train, len(train)/7)) test = array(split(test, len(test)/7)) return train, test

最终训练集包含159个标准周，测试集包含46个标准周。

3.4 前向验证策略

我们采用前向验证(walk-forward validation)策略评估模型性能。这种方法模拟了模型在实际应用中的使用场景：

使用历史数据预测下一周
将真实观测值加入历史数据
用扩展后的历史数据预测再下一周
重复此过程直到完成所有测试周

这种策略既现实又有利于模型，因为它允许模型使用最新的可用数据进行预测。

4. CNN模型构建与实现

4.1 CNN基础概念

卷积神经网络最初是为图像处理设计的，但同样适用于时间序列数据。CNN主要由两种层组成：

卷积层：使用核(kernel)读取输入的小片段，逐步扫描整个输入场
池化层：提取特征图中的关键元素，如通过平均或最大化操作

CNN的优势在于自动特征学习和直接输出多步预测向量的能力。

4.2 单变量CNN模型

首先我们构建一个仅使用有功功率单变量的CNN模型。输入是过去7天的数据，输出是未来7天的预测。

数据需要转换为3D格式[samples, timesteps, features]。对于训练数据，我们通过滑动窗口生成更多样本：

def to_supervised(train, n_input, n_out=7): data = train.reshape((train.shape[0]*train.shape[1], train.shape[2])) X, y = list(), list() in_start = 0 for _ in range(len(data)): in_end = in_start + n_input out_end = in_end + n_out if out_end <= len(data): x_input = data[in_start:in_end, 0] x_input = x_input.reshape((len(x_input), 1)) X.append(x_input) y.append(data[in_end:out_end, 0]) in_start += 1 return array(X), array(y)

模型构建函数如下：

def build_model(train, n_input): # 准备数据 train_x, train_y = to_supervised(train, n_input) # 定义模型参数 verbose, epochs, batch_size = 0, 50, 16 n_timesteps, n_features, n_outputs = train_x.shape[1], train_x.shape[2], train_y.shape[1] # 定义模型 model = Sequential() model.add(Conv1D(filters=64, kernel_size=3, activation='relu', input_shape=(n_timesteps,n_features))) model.add(Conv1D(filters=64, kernel_size=3, activation='relu')) model.add(MaxPooling1D(pool_size=2)) model.add(Flatten()) model.add(Dense(100, activation='relu')) model.add(Dense(n_outputs)) model.compile(loss='mse', optimizer='adam') # 拟合网络 model.fit(train_x, train_y, epochs=epochs, batch_size=batch_size, verbose=verbose) return model

4.3 多通道CNN模型

接下来我们构建使用所有8个变量的多通道CNN模型。每个变量作为一个独立的输入通道：

def build_model(train, n_input): train_x, train_y = to_supervised(train, n_input) verbose, epochs, batch_size = 0, 50, 16 n_timesteps, n_features, n_outputs = train_x.shape[1], train_x.shape[2], train_y.shape[1] model = Sequential() model.add(Conv1D(filters=64, kernel_size=3, activation='relu', input_shape=(n_timesteps,n_features))) model.add(Conv1D(filters=64, kernel_size=3, activation='relu')) model.add(MaxPooling1D(pool_size=2)) model.add(Flatten()) model.add(Dense(100, activation='relu')) model.add(Dense(n_outputs)) model.compile(loss='mse', optimizer='adam') model.fit(train_x, train_y, epochs=epochs, batch_size=batch_size, verbose=verbose) return model

4.4 多头CNN模型

最后我们构建多头CNN模型，每个变量有独立的CNN子模型，最后合并：

def build_model(train, n_input): train_x, train_y = to_supervised(train, n_input) verbose, epochs, batch_size = 0, 20, 16 n_timesteps, n_features, n_outputs = train_x.shape[1], train_x.shape[2], train_y.shape[1] # 为每个变量创建子模型 input_layers = [] conv_layers = [] for i in range(n_features): inputs = Input(shape=(n_timesteps,1)) conv = Conv1D(filters=64, kernel_size=3, activation='relu')(inputs) pool = MaxPooling1D(pool_size=2)(conv) flat = Flatten()(pool) input_layers.append(inputs) conv_layers.append(flat) # 合并子模型 merged = concatenate(conv_layers) dense1 = Dense(100, activation='relu')(merged) outputs = Dense(n_outputs)(dense1) model = Model(inputs=input_layers, outputs=outputs) model.compile(loss='mse', optimizer='adam') # 准备输入数据 input_data = [train_x[:,:,i].reshape((train_x.shape[0],n_timesteps,1)) for i in range(n_features)] model.fit(input_data, train_y, epochs=epochs, batch_size=batch_size, verbose=verbose) return model

5. 模型评估与结果分析

5.1 单变量CNN结果

使用过去7天预测未来7天，单变量CNN模型的RMSE表现如下：

CNN Univariate: [381.613] 388.2, 381.3, 392.1, 386.9, 381.9, 375.8, 361.9

相比基准模型(约465千瓦的RMSE)，单变量CNN已经表现出明显的优势。

5.2 多通道CNN结果

使用所有8个变量作为输入通道，模型表现有所提升：

CNN Multichannel: [370.017] 375.7, 370.9, 375.3, 371.9, 368.5, 363.5, 358.3

5.3 多头CNN结果

多头CNN模型表现最佳：

CNN Multihead: [369.154] 374.0, 369.5, 373.9, 370.4, 368.3, 363.7, 358.4

5.4 结果对比与分析

模型类型	整体RMSE	第1天	第2天	第3天	第4天	第5天	第6天	第7天
单变量CNN	381.6	388.2	381.3	392.1	386.9	381.9	375.8	361.9
多通道CNN	370.0	375.7	370.9	375.3	371.9	368.5	363.5	358.3
多头CNN	369.2	374.0	369.5	373.9	370.4	368.3	363.7	358.4