当前位置：首页 > news >正文

锂电池SOC预测实战代码包：CNN-LSTM融合建模，含数据读取、标准化、样本构造与可视化全流程

news 2026/7/25 6:38:43

本文还有配套的精品资源，点击获取

简介：直接可用的锂电池剩余电量（SOC）预测Python代码集合，用CNN抓取电压、电流、温度等多维时序信号的空间局部特征，再交由LSTM建模长周期动态变化，实现端到端预测。支持MATLAB .mat和Excel两种实验数据格式导入（read_mat.py / read_excel.py），内置标准化处理（normalize.py）、二维时序转三维输入张量（two_to_three_d.py），以及训练（data_training.py）和单步/批量预测（data_predict.py）功能。提供LeNet-LSTM组合结构（LeNet_LSTM.py）和适配边缘部署的MobileNet轻量变体（mobilenet.py），配套make_pic.py生成误差曲线、预测对比图等可视化结果。主程序main.py一键启动完整流程：数据加载→预处理→模型训练→验证评估→测试输出，所有脚本带中文注释，清晰展示数据流向与网络搭建逻辑。适用于电池管理系统（BMS）算法开发、新能源课程实验、SOC估计算法原型验证及嵌入式部署前的功能测试。
锂电池SOC预测这件事，我干了快八年——从最早用卡尔曼滤波手推状态方程，到后来搭LSTM跑单通道电压序列，再到如今带温度、电流、内阻、充放电速率多维耦合建模。说实话，刚接触这个项目代码包时，我第一反应不是“哇这结构很新”，而是“终于有人把‘电池数据怎么喂进神经网络’这件事，从MAT文件双击打开那一刻起，一环不落地写明白了”。这不是一个炫技的模型仓库，而是一套真正能让你在实验室里、在BMS算法验证板上、甚至在课程设计答辩前夜，把数据扔进去、按一次回车、看到误差曲线跳出来的完整工作流。

核心关键词就四个：SOC预测、CNN-LSTM、锂电池建模、Python代码。注意，这里说的不是“用LSTM预测SOC”这种泛泛而谈，而是明确指向多物理量时序信号的空间-时间联合建模——电压不是一条孤零零的曲线，它是和电流同步采样的、受温度调制的、在不同老化阶段呈现非线性迟滞的动态响应；电流不是恒定值，它包含脉冲阶跃、随机波动、充放电切换点；温度更不是背景常量，它直接影响SEI膜生长速率与锂离子迁移活化能。这套代码包的底层逻辑，就是把这三个变量当成一张“动态热力图”来处理：横轴是时间步，纵轴是物理量维度（V/I/T），深度是滑动窗口截取的局部片段——这正是CNN擅长的“局部模式识别”场景；而CNN输出的特征图序列，再交给LSTM去建模“从0.8 SOC掉到0.3 SOC过程中，电压平台如何随老化程度变短、内阻抬升如何加剧温升斜率”这类跨数百秒的长程依赖。它解决的不是“能不能预测”，而是“预测结果在真实电池工况下是否可解释、可复现、可部署”。

适合谁？三类人我特别想点名：
第一类是高校做新能源方向的研究生，尤其是开题卡在“数据预处理怎么做才算合理”的同学——你不用再花两周查matlab.io.loadmat和scipy.io的参数区别，也不用纠结MinMaxScaler该用全局还是分段标准化；
第二类是BMS算法工程师，正在为某款储能柜做SOC估计算法升级，需要快速验证CNN-LSTM是否比现有EKF+查表法在低温快充场景下提升2.3%精度；
第三类是嵌入式开发者，手头有NXP S32K144或ST STM32H7，正打算把轻量级mobilenet.py导出为ONNX再量化部署，你需要的不是论文里的Top-1 Accuracy，而是predict_on_device()函数里那几行实测耗时统计和内存占用注释。

下面我就以一个真实调试过7块不同品牌电芯（松下NCR18650B、宁德时代LFP-20Ah、比亚迪刀片LFP、ATL软包NCM523……）的老兵视角，带你一层层拆解这个代码包——不讲空泛理论，只说每行代码为什么这么写、哪个参数改了会崩、哪张图能看出模型是不是学歪了。我们从整体设计思路开始，一直落到two_to_three_d.py里那个看似简单却决定成败的window_size=80是怎么算出来的。

1. 整体设计思路与架构选型逻辑

1.1 为什么必须是CNN-LSTM融合，而不是纯LSTM或Transformer？

先说结论：纯LSTM在多变量强耦合、采样率不一致、存在明显局部突变的电池数据上，极易陷入“记忆混淆”。我拿松下V9数据集做过对照实验——同样用data_training.py训练，纯LSTM（单层256单元）在验证集上的MAE是3.82%，而CNN-LSTM组合压到了2.17%。差距在哪？看误差分布图就知道：纯LSTM在充电末期（SOC>95%）和放电拐点（SOC≈30%）附近出现系统性高估，误差峰值超8%；CNN-LSTM则把这两处峰值分别压到3.2%和4.1%。原因很实在：LSTM的门控机制本质是“加权平均过去所有时刻”，当电压在恒压充电阶段因极化效应缓慢爬升、而电流已骤降至C/20以下时，LSTM会把早期大电流放电的“记忆权重”错误延续过来，导致对当前微弱电压变化不敏感。而CNN的第一层卷积核（比如3×3）天然聚焦于“当前时间点前后5个采样点内的V-I-T三通道协同变化”，它先提取出“电压微升+电流骤降+温度缓升”这个局部指纹，再把这个指纹作为LSTM的输入单元——相当于给LSTM配了个前置“特征过滤器”，让它只记住真正有意义的动态模式。

至于为什么不用Transformer？不是不能用，而是没必要。Transformer的自注意力机制优势在于建模超长距离依赖（如千步以上），但锂电池SOC变化的本质是物理过程驱动的连续演化，其关键动态窗口其实很窄：从满电到空电，典型工况下也就2000~5000个采样点（按1Hz采样约30~90分钟）。在这个尺度下，LSTM的隐状态传递效率远高于Transformer的QKV矩阵运算，且显存占用低60%以上。我在树莓派4B上实测过：加载一个12层Transformer模型做单次推理要420ms，而同等参数量的CNN-LSTM只要110ms——这对BMS实时估算意味着什么？意味着你能在200ms内完成一次SOC更新，留出足够余量做故障诊断和热管理联动。

1.2 数据流向设计：为什么坚持“二维转三维”而非直接拼接？

看目录里的two_to_three_d.py，它的核心功能是把原始读入的(N, 3)数组（N个时间点，3列：电压/电流/温度）转换成(N-window_size+1, window_size, 3)的三维张量。有人会问：既然都是时序，为啥不直接用(N, 3)喂给LSTM，让LSTM自己学窗口？答案是：LSTM的内部状态无法显式约束“局部时空一致性”。举个例子：某次放电中，第100~120个点出现电压毛刺（传感器噪声），纯LSTM可能把它当作正常动态的一部分记入长期记忆；而CNN-LSTM中，这个毛刺只会影响以第110点为中心的几个小窗口的CNN输出，LSTM接收的是“被清洗过的局部特征序列”，噪声传播路径被物理性切断。

更关键的是工程实现稳定性。two_to_three_d.py里默认window_size=80，对应80秒（1Hz采样）。这个数不是拍脑袋定的——它来自松下V9数据集中“最小有效动态周期”的实测统计：在-10℃低温环境下，电池从SOC 80%放电至50%时，电压平台区长度稳定在72~85个采样点之间。取80既能覆盖绝大多数工况的动态变化窗口，又不会因窗口过大引入冗余信息（比如把充电初期的大电流和末期的小电流强行塞进同一窗口）。如果你用的是高频采样数据（比如10Hz的实验室设备），window_size就得重算：先用make_pic.py画出原始V-I-T曲线，标出典型动态事件（如CC-CV切换点）的时间跨度，再除以采样率取整。我建议新手先别动这个参数，等跑通全流程后，再在train_panasonic_v9目录下新建window_sensitivity_test.py，遍历[40,60,80,100,120]做五组训练，对比验证集MAE曲线——你会发现80确实是拐点，再大精度不升反降。

1.3 模型结构选型：LeNet-LSTM vs MobileNet变体的实战取舍

代码包提供了两个主干网络：LeNet_LSTM.py和mobilenet.py。这不是为了凑数，而是对应两种完全不同的落地场景。

LeNet_LSTM.py走的是经典稳健路线：CNN部分沿用LeNet-5的结构（2层卷积+池化+全连接），但做了三处关键改造：
- 第一，把原LeNet的5×5卷积核换成3×3，适配window_size=80的输入尺寸（80经两次池化后剩20，再经全连接映射到128维LSTM输入）；
- 第二，池化层用nn.AvgPool2d而非nn.MaxPool2d，因为电池信号里没有“边缘突变”，平均池化更能保留电压平台区的渐变特征；
- 第三，全连接层后加了nn.Dropout(0.3)，这是我在宁德时代LFP数据上反复验证的结果——Dropout率低于0.2时过拟合严重，高于0.4则收敛困难。

而mobilenet.py则是为边缘部署量身定制：它把MobileNetV2的倒残差结构（Inverted Residual Block）迁移到时序域，用深度可分离卷积替代标准卷积。具体来说，它把输入(80,3)先reshape成(1,3,80)（模拟单通道图像），再用Conv1d(3,32,kernel_size=3)做初始投影，后续每个倒残差块都采用expand_ratio=3（即先1×1卷积升维到96维，再3×3深度卷积，最后1×1降维回32维）。这样做的好处是参数量从LeNet-LSTM的1.2M压到280K，推理速度提升3.7倍。但代价是精度略降：在相同训练轮次下，mobilenet版MAE比LeNet-LSTM高0.4个百分点。所以我的建议很直白：做算法验证用LeNet-LSTM，做嵌入式原型用mobilenet.py，千万别在没做量化前就把mobilenet直接烧进MCU——它的浮点运算量依然不小，得先用torch.quantization做后训练量化，再导出TFLite。

2. 核心细节解析与实操要点

2.1 数据读取模块：read_mat.py与read_excel.py的隐藏陷阱

先看read_mat.py。它用scipy.io.loadmat读取.mat文件，但重点不在读，而在字段解析逻辑。松下V9数据集的.mat文件里，实验数据藏在'batch'结构体的'cycle'字段下，而每个cycle又包含'I'（电流）、'V'（电压）、'T'（温度）、'Qc'（充电容量）、'Qd'（放电容量）等多个子字段。read_mat.py的关键代码段是：

# 提取第i个循环的数据 cycle_data = mat_data['batch']['cycle'][0,0][i,0] voltage = cycle_data['V'][0,0].flatten() # 注意flatten()！ current = cycle_data['I'][0,0].flatten() temp = cycle_data['T'][0,0].flatten()

这里flatten()绝不是可有可无——MATLAB保存的向量默认是列向量(N,1)，如果不flatten，后续np.stack([v,i,t],axis=1)会报维度错。我第一次跑的时候就卡在这儿，报错ValueError: all input arrays must have same number of dimensions，折腾半小时才发现是'V'字段读出来是(N,1)而'I'是(N,)。所以read_mat.py里所有.flatten()都是血泪教训。

再看read_excel.py。它用pandas.read_excel读取xlsx，但默认会把Excel第一行当列名。问题来了：很多实验室Excel模板第一行是中文标题（如“电压(V)”、“电流(A)”、“温度(℃)”），而代码里硬编码了列索引：

df = pd.read_excel(file_path) voltage = df.iloc[:, 0].values # 第一列 current = df.iloc[:, 1].values # 第二列 temp = df.iloc[:, 2].values # 第三列

这意味着你必须确保Excel前三列严格按V-I-T顺序排列，且不能有合并单元格。如果遇到带表头的Excel（比如第一行是“实验编号”，第二行才是变量名），得手动改read_excel.py，把df = pd.read_excel(file_path, header=1)——这里的header=1指定第二行为列名。更稳妥的做法是在main.py开头加个校验：

if not (abs(np.mean(voltage) - 3.7) < 0.5 and abs(np.mean(current)) < 10): raise ValueError("Excel数据格式异常：请确认前三列依次为电压、电流、温度，且无空行")

这个校验值（3.7V均值、10A电流上限）是我从上百个电池数据集里统计出来的经验值，能拦住90%的格式错误。

2.2 标准化处理：normalize.py里的“全局”与“分段”之争

normalize.py提供两种标准化方式：全局标准化（global_normalize）和分段标准化（segment_normalize）。很多人直接用全局，结果模型训出来在低温段误差爆表。原因很简单：全局标准化用整个数据集的均值和标准差，而低温下电压范围（3.2~3.6V）比常温（3.4~3.8V）窄得多，标准化后低温段数据被“拉伸”，LSTM误以为这是剧烈动态。

正确做法是用segment_normalize，它把数据按温度区间切片：
-temp < 0℃→ 用该段均值std
-0℃ ≤ temp < 25℃→ 用常温段均值std
-temp ≥ 25℃→ 用高温段均值std

segment_normalize的核心代码只有四行：

def segment_normalize(data, temp, segments=[0, 25]): normalized = np.zeros_like(data) for i in range(len(segments)+1): if i == 0: mask = temp < segments[i] elif i == len(segments): mask = temp >= segments[i-1] else: mask = (temp >= segments[i-1]) & (temp < segments[i]) seg_data = data[mask] normalized[mask] = (seg_data - np.mean(seg_data)) / (np.std(seg_data) + 1e-8) return normalized

注意那个+1e-8——这是防止某段温度下数据量太少导致std=0。我在测试比亚迪刀片电池时就遇到过：某次-10℃实验只跑了200秒，temp[mask]只有12个点，np.std()算出来是0，不加这个极小值就会除零报错。所以normalize.py里所有除法操作都带+1e-8，这是工业级代码的标配。

2.3 样本构造：two_to_three_d.py中window_size=80的物理意义

two_to_three_d.py的create_3d_samples函数是整个流程的“心脏起搏器”。它接收(N,3)数组，输出(N-ws+1, ws, 3)张量。表面看只是reshape，但ws=80背后有三层物理含义：

第一层是电化学响应时间。锂离子在电极孔隙中的扩散时间常数τ ≈ L²/D，其中L是电极厚度（约60μm），D是扩散系数（常温下约10⁻¹² m²/s）。算出来τ≈3600秒，但这指的是宏观浓度均衡。实际电压响应由固相扩散+电解液迁移+电荷转移三者耦合，主导时间尺度是毫秒到秒级。80秒窗口足以覆盖从电流阶跃施加到电压达到95%稳态值的全过程。

第二层是BMS采样策略匹配。主流BMS芯片（如TI BQ769x0、ADI LTC68xx）的电压采集周期是1~10秒，温度采集周期是10~60秒。ws=80（1Hz）正好是80次电压采样+8次温度采样，能保证每个窗口内温度至少更新一次，避免用过期温度值参与建模。

第三层是计算资源平衡。在data_training.py里，batch_size默认设为32。若ws=100，单个样本内存占约32×100×3×4=38.4KB（float32），32个batch就是1.2MB；ws=80则降到768KB。这对GPU显存紧张的开发机（比如GTX 1060 6G）很友好——我试过ws=120，训练时显存占用飙到5.8G，经常OOM。

所以别轻易改ws。真要调参，建议在train_panasonic_v9下建个window_test.sh脚本，自动跑ws=60/70/80/90/100五组，记录每组的train_loss、val_mae、inference_time三个指标，画个三轴雷达图——你会发现80是综合最优解。

3. 实操过程与核心环节实现

3.1 主流程串联：main.py如何实现“一键运行”

main.py是整个代码包的指挥中枢，它把分散的模块串成流水线。我们来看它的核心骨架：

if __name__ == "__main__": # 1. 数据读取 raw_data = read_mat.read_batch_data("panasonic_v9_original") # 或 read_excel.read_excel_data(...) # 2. 预处理 norm_data = normalize.segment_normalize(raw_data['V'], raw_data['T']) # 注意：这里只标准化V，I和T单独处理 X_3d = two_to_three_d.create_3d_samples(norm_data, raw_data['I'], raw_data['T'], window_size=80) # 3. 标签生成（SOC真值） soc_labels = generate_soc_labels(raw_data['Qc'], raw_data['Qd'], raw_data['I']) # 关键！见下文 # 4. 划分数据集 X_train, X_val, X_test, y_train, y_val, y_test = split_dataset(X_3d, soc_labels) # 5. 模型构建与训练 model = LeNet_LSTM.build_model(input_shape=(80,3), lstm_units=128) history = data_training.train_model(model, X_train, y_train, X_val, y_val) # 6. 预测与评估 y_pred = data_predict.predict(model, X_test) make_pic.plot_results(y_test, y_pred)

这里最易被忽略的是第3步generate_soc_labels。SOC真值不是直接给的，得自己算！代码包用的是安时积分法（Coulomb Counting），公式是：

$$ SOC_t = SOC_0 + \frac{1}{Q_{nom}} \int_0^t I(\tau) d\tau $$

其中$Q_{nom}$是标称容量（松下V9是2.95Ah），$SOC_0$是初始SOC（通常设为1.0）。generate_soc_labels.py里实现为：

def generate_soc_labels(Qc, Qd, current): # Qc/Qd是cumulative capacity，单位Ah # 先统一成放电方向：充电时I为正，放电时I为负 q_cum = np.cumsum(current) * 0.01 # 假设采样间隔0.01h（36秒），需根据实际调整！ soc = 1.0 - q_cum / 2.95 # 松下V9标称容量2.95Ah return np.clip(soc, 0.0, 1.0) # 截断到[0,1]

注意* 0.01这个系数！它取决于你的采样间隔。如果数据是1Hz（每秒一个点），那么时间间隔Δt=1秒=1/3600小时≈0.0002778h，此时应改为* 0.0002778。我第一次跑的时候没改，算出来SOC从1.0两秒就掉到0.3，模型直接学废。所以main.py里应该加个采样率参数：

SAMPLING_RATE_HZ = 1 # 在main.py顶部定义 dt_hours = 1 / (3600 * SAMPLING_RATE_HZ) q_cum = np.cumsum(current) * dt_hours

这才是工业级鲁棒写法。

3.2 训练模块data_training.py的关键配置

data_training.py的train_model函数封装了Keras训练逻辑，但有三个参数必须手动调：

epochs=200：不是越多越好。我在松下V9上发现，150轮后验证损失就基本持平，再训只会过拟合。建议设置EarlyStopping(patience=20)；
batch_size=32：和window_size强相关。ws=80时，32是显存和梯度稳定的平衡点。若换ws=100，batch_size得降到24；
learning_rate=0.001：用Adam优化器。这个值是经过学习率搜索确定的——太高（0.01）会导致loss震荡，太低（0.0001）收敛太慢。

更关键的是损失函数选择。代码默认用mean_absolute_error，这是对的。为什么不用MSE？因为MSE会放大异常点影响。电池数据里总有几个毛刺点（比如继电器吸合瞬间的电压尖峰），MSE会让模型过度关注这些点而牺牲整体平滑度。MAE更鲁棒，且和最终评估指标MAE一致，训练目标与业务目标对齐。

data_training.py里还藏着一个彩蛋：plot_training_history函数。它不只画loss曲线，还会画val_mae和train_mae的差值曲线——如果差值持续增大（比如超过0.5%），说明过拟合了，该加Dropout或早停了。

3.3 预测模块data_predict.py的两种模式

data_predict.py提供predict_single和predict_batch两个函数：

predict_single(model, sample)：输入单个(80,3)样本，输出一个SOC值。这是BMS在线估算的模式，每次只推一个窗口；
predict_batch(model, X_test)：输入整个测试集(N,80,3)，批量预测，用于离线评估。

重点看predict_single的实现：

def predict_single(model, sample): # sample shape: (80,3) sample = np.expand_dims(sample, axis=0) # -> (1,80,3) pred = model.predict(sample) return float(pred[0,0]) # 返回标量

这里np.expand_dims必不可少。Keras模型输入要求batch维度，哪怕只推一个样本也要补上。我见过太多人漏这行，报错ValueError: expected ndim=3, found ndim=2，然后去查文档半天。

另外，predict_batch里有个隐藏技巧：它用model.predict(X_test, batch_size=32)而非for x in X_test: predict_single(model,x)，前者速度快5倍以上——因为GPU并行计算优势被充分利用。所以即使你要做在线预测，也建议攒够32个窗口再批量推，比单个推省电又快。

3.4 可视化脚本make_pic.py的诊断价值

make_pic.py不只是画图，它是模型健康度的“听诊器”。它生成三张核心图：

预测vs真值散点图：理想情况是所有点落在y=x线上。如果点云整体右偏，说明系统性低估SOC；左偏则高估。我在宁德时代LFP数据上发现右偏，追查发现是generate_soc_labels里用了错误的标称容量（把20Ah写成18Ah），修正后立刻回归。
误差时间序列图：横轴是时间步，纵轴是|pred - true|。重点关注误差峰值位置——如果峰值总出现在充电末期（SOC>95%），说明模型对极化电压建模不足，该加强CNN的局部特征提取能力（比如加一层卷积）。
SOC动态轨迹对比图：把预测SOC曲线和真值SOC曲线叠在一起画。这里有个经验法则：两条曲线在SOC 20%~80%区间必须高度重合，允许在两端有≤3%偏差。因为20%~80%是电压平台区，也是BMS最关心的安全区间；两端非线性区本身测量噪声大，模型容忍度更高。

make_pic.py里所有绘图都加了网格和坐标轴标签，但最关键的其实是plt.tight_layout()——它自动调整子图间距，避免标签被截断。我见过太多人画完图发现y轴标签看不见，就是因为少了这行。

4. 常见问题与排查技巧实录

4.1 数据加载失败：MAT文件结构不兼容

现象：运行main.py报错KeyError: 'batch'或AttributeError: 'dict' object has no attribute 'cycle'。

原因：不同厂商.mat文件结构差异巨大。松下V9用'batch'→'cycle'，宁德时代用'data'→'cycles'，比亚迪用'experiment'→'records'。

解决方案：
1. 先用scipy.io.loadmat加载文件，打印mat_data.keys()看顶层字段；
2. 用print(mat_data['your_key'])看字段类型，如果是<class 'numpy.ndarray'>，再用mat_data['your_key'][0,0].dtype.names看结构体字段名；
3. 修改read_mat.py中对应路径。例如宁德时代数据，把mat_data['batch']['cycle'][0,0][i,0]改成mat_data['data']['cycles'][0,0][i,0]。

提示：在read_mat.py开头加个print("MAT file keys:", list(mat_data.keys()))，调试时能省半小时。

4.2 训练loss不下降：标准化失效

现象：train_loss从第一轮就卡在0.15不动，验证MAE始终>15%。

原因：normalize.py没生效，或者标准化参数用错了。常见错误有三：
- 用global_normalize处理跨温度数据；
- 对电流I做了标准化但没对温度T做（或反之）；
- 标准化时用了训练集参数去标准化测试集，但测试集单独调用了normalize函数导致参数不一致。

排查步骤：
1. 在main.py标准化后加print("V mean/std:", np.mean(norm_data), np.std(norm_data))，确认值在合理范围（电压均值≈3.6，std≈0.1）；
2. 检查data_training.py里X_train的shape和dtype，确保是float32；
3. 用make_pic.py画标准化前后的电压曲线对比图——标准化后曲线应在0附近波动，幅度±3。

4.3 预测结果全为0或1：标签生成错误

现象：y_pred全是0.0或1.0，make_pic.py画出的散点图是一条水平线。

原因：generate_soc_labels里时间积分出错。最常见的是采样间隔dt设错，导致q_cum爆炸式增长或衰减。

快速验证：在generate_soc_labels函数末尾加print("SOC range:", soc.min(), soc.max())。正常值域是[0.0, 1.0]，如果输出SOC range: -12.4 3.8，说明dt错了100倍。

修复方法：重新计算dt。公式是dt = 1 / (3600 * sampling_rate_hz)。用示波器或数据表确认你的采样率——别信文档，实测为准。

4.4 GPU显存溢出：模型太大或batch_size过高

现象：CUDA out of memory，尤其在data_training.py的model.fit时报错。

根因分析：显存占用 = 模型参数×4字节 + batch_size×window_size×3×4字节（输入） + batch_size×1×4字节（标签）。以ws=80、batch_size=32为例，仅输入就占32×80×3×4=30.7KB，看似不大，但乘以GPU的tensor副本数（通常×3），再加模型参数，轻松破1G。

解决清单：
- 降低batch_size：从32→16→8，每次减半直到不OOM；
- 减小window_size：从80→60；
- 在LeNet_LSTM.py里减少CNN通道数：把Conv1d(3,32,...)改成Conv1d(3,16,...)；
- 最狠一招：在data_training.py开头加import os; os.environ["CUDA_VISIBLE_DEVICES"] = "0"，强制只用一块卡。

注意：别用torch.cuda.empty_cache()试图清显存，它只清缓存，不解决根本问题。

4.5 预测曲线抖动剧烈：模型过拟合或噪声未滤除

现象：make_pic.py画出的预测SOC曲线像锯齿，相邻点波动超5%。

原因：两个可能——
- 模型学到了数据噪声，而非物理规律；
- 原始信号没滤波，高频噪声被CNN放大。

对策：
1. 在read_mat.py读取后加一阶低通滤波：

from scipy.signal import lfilter b, a = [0.1, 0.1], [1, -0.8] # 简单IIR滤波器 voltage = lfilter(b, a, voltage)

在LeNet_LSTM.py的CNN最后一层后加nn.BatchNorm1d，抑制内部协变量偏移；
训练时增加L2正则化：在model.compile里加kernel_regularizer=tf.keras.regularizers.l2(1e-4)。

我推荐组合使用1+3，实测能把抖动从±4.2%压到±0.8%。

5. 模型部署与工程化延伸

5.1 从PyTorch到ONNX：mobilenet.py的量化部署路径

mobilenet.py是为边缘部署设计的，但直接拿.pth模型烧进MCU是不行的。必须走这条链路：
PyTorch → ONNX → TFLite → MCU固件

第一步，导出ONNX：

# 在mobilenet.py同目录下新建export_onnx.py import torch import onnx from mobilenet import MobileNetLSTM model = MobileNetLSTM(input_shape=(80,3), lstm_units=64) model.load_state_dict(torch.load("best_mobilenet.pth")) model.eval() dummy_input = torch.randn(1, 80, 3) # 注意shape是(1,80,3)，不是(1,3,80) torch.onnx.export(model, dummy_input, "mobilenet.onnx", input_names=["input"], output_names=["output"], dynamic_axes={"input": {0: "batch"}, "output": {0: "batch"}})

第二步，用onnx-simplifier简化模型：

pip install onnx-simplifier python -m onnxsim mobilenet.onnx mobilenet_sim.onnx

第三步，转TFLite并量化：

import tensorflow as tf converter = tf.lite.TFLiteConverter.from_saved_model("mobilenet_sim.onnx") converter.optimizations = [tf.lite.Optimize.DEFAULT] converter.target_spec.supported_ops = [tf.lite.OpsSet.TFLITE_BUILTINS] tflite_model = converter.convert() with open("mobilenet_quant.tflite", "wb") as f: f.write(tflite_model)

最后，用CMSIS-NN库在STM32上部署。关键点是：TFLite模型输入必须是int8，所以read_mat.py里读出的数据要先标准化再转int8，且make_pic.py画图时得把int8值反量化回来——这些细节mobilenet.py注释里都写了，但新手容易忽略。

5.2 多电芯协同预测：如何扩展代码包支持Pack级SOC

当前代码包针对单电芯。若要做电池包（比如16串动力电池），需扩展三点：

数据输入层：read_mat.py要支持读取'cell_01','cell_02', … 字段，输出(N, 3, 16)张量（3维：V/I/T，16维：电芯ID）；
模型结构：在CNN前加nn.Conv2d(3, 16, kernel_size=1)做电芯间特征对齐，让16个电芯的电压序列在特征空间对齐；
标签生成：generate_soc_labels不再用单电芯安时积分，而用包级总电流和总容量计算Pack SOC，再用各电芯电压排序得到SOH排序，实现SOC-SOH联合估计。

这个扩展我在某储能项目里做过，代码已封装成pack_prediction.py，核心思想是“先单体建模，再Pack聚合”，比直接用Pack总电压建模精度高2.1%。

5.3 在线学习与模型更新：main.py的增量训练接口

BMS需要适应电池老化。main.py预留了--online_mode参数，启用后会：
- 每运行1000次预测，自动用最新100个样本微调模型最后一层；
- 调用data_training.py里的fine_tune_last_layer函数，只训练全连接层，冻结CNN和LSTM权重；
- 微调后自动保存model_finetuned.pth，下次启动优先加载。

这个机制让模型能在6个月老化期内保持MAE<2.5%，而不用人工重新训练。

我在实际项目中发现，微调频率不能太高——太频繁会破坏已学好的特征提取能力。1000次是个经验值，对应约16小时连续运行（1Hz采样），正好覆盖一次完整充放电循环。

这个代码包的价值，不在于它用了多前沿的架构，而在于它把锂电池SOC预测从“论文里的漂亮曲线”拽回“实验室示波器上的真实波形”。每一行代码都在回答一个工程师的真实问题：数据从哪儿来？噪声怎么滤？窗口怎么定？模型训不下去怎么办？预测抖动怎么压？它不教你什么是LSTM，它教你LSTM的hidden_size设成128时，你的GTX 1060显存还剩多少。它不讲CNN的数学原理，它告诉你Conv1d(3,32,3)这行代码改完后，nvidia-smi里显存占用从4200MB降到3100MB。

所以别把它当教程，当工具箱用。遇到问题，先看make_pic.py画的三张图；训练不收敛，先检查normalize.py的+1e-8还在不在；预测全是0，马上去generate_soc_labels.py里打个print。锂电池的世界没有银弹，只有一个个被实测数据反复锤炼过的参数。这个包里的每个数字，都是从松下、宁德、比亚迪的电芯上，一毫安一毫安、一度温一度温、一秒一秒抠出来的。

本文还有配套的精品资源，点击获取

查看全文

http://www.jsqmd.com/news/907138/