当前位置：首页 > news >正文

PyTorch实现多元线性回归：从原理到实践

news 2026/4/27 22:20:14

1. 使用PyTorch构建单输出多元线性回归模型

在深度学习实践中，线性回归是最基础也最重要的模型之一。虽然它结构简单，但包含了神经网络训练的核心要素。今天我要分享的是如何在PyTorch中实现一个单输出的多元线性回归模型，并详细讲解其中的关键实现细节。

多元线性回归与简单线性回归的主要区别在于输入特征的维度。在我们的例子中，每个样本有两个输入特征(x₁, x₂)，模型需要学习如何组合这两个特征来预测输出y。这实际上就是一个最简单的神经网络——没有隐藏层，只有输入层和输出层。

2. 数据准备与Dataset类实现

2.1 构建人工数据集

我们先创建一个包含40个样本的人工数据集，每个样本有2个特征：

import torch from torch.utils.data import Dataset class Data(Dataset): def __init__(self): self.x = torch.zeros(40, 2) self.x[:, 0] = torch.arange(-2, 2, 0.1) # 特征1: -2到2，步长0.1 self.x[:, 1] = torch.arange(-2, 2, 0.1) # 特征2: -2到2，步长0.1 self.w = torch.tensor([[1.0], [1.0]]) # 真实权重 self.b = 1 # 真实偏置 self.func = torch.mm(self.x, self.w) + self.b # 真实线性关系 self.y = self.func + 0.2 * torch.randn((self.x.shape[0],1)) # 添加噪声 self.len = self.x.shape[0] def __getitem__(self, index): return self.x[index], self.y[index] def __len__(self): return self.len

这里有几个关键点需要注意：

我们使用torch.arange创建了均匀分布的特征值
真实模型是y = 1.0x₁ + 1.0x₂ + 1，然后添加了标准差为0.2的高斯噪声
Dataset类必须实现__getitem__和__len__方法，这是PyTorch数据加载的标准接口

提示：在实际项目中，数据通常会从文件或数据库加载。这里使用人工数据是为了演示和实验的可重复性。

2.2 数据加载器(DataLoader)配置

from torch.utils.data import DataLoader data_set = Data() train_loader = DataLoader(dataset=data_set, batch_size=2)

我们设置batch_size=2，这意味着每次训练会随机抽取2个样本计算梯度并更新参数。小批量梯度下降是深度学习的标准做法，它：

比全批量训练更快收敛
比随机梯度下降(SGD)更稳定
能更好地利用GPU的并行计算能力

3. 模型构建与训练

3.1 定义模型类

class MultipleLinearRegression(torch.nn.Module): def __init__(self, input_dim, output_dim): super().__init__() self.linear = torch.nn.Linear(input_dim, output_dim) def forward(self, x): return self.linear(x) MLR_model = MultipleLinearRegression(2, 1)

这个简单的模型类包含了几个重要概念：

继承nn.Module基类，这是所有PyTorch模型的基类
在__init__中定义网络层，这里只有一个线性层
forward方法定义了数据如何流过网络

3.2 配置优化器和损失函数

optimizer = torch.optim.SGD(MLR_model.parameters(), lr=0.1) criterion = torch.nn.MSELoss()

这里选择了：

优化器：随机梯度下降(SGD)，学习率0.1
损失函数：均方误差(MSE)，这是回归问题的标准损失函数

学习率的选择很关键：

太大可能导致震荡或不收敛
太小则训练缓慢
0.1对于这个简单模型是合适的起点

3.3 训练循环实现

Loss = [] epochs = 20 for epoch in range(epochs): for x, y in train_loader: y_pred = MLR_model(x) loss = criterion(y_pred, y) optimizer.zero_grad() loss.backward() optimizer.step() Loss.append(loss.item()) print(f"epoch {epoch}: loss = {loss.item():.4f}")

训练过程中有几个关键操作：

zero_grad(): 清空上一轮的梯度，避免累积
backward(): 自动计算梯度
step(): 根据梯度更新参数

注意：loss.item()将单元素张量转换为Python数值，避免不必要的计算图保存。

4. 结果分析与可视化

4.1 训练过程监控

训练完成后，我们可以打印最终的模型参数：

print("Learned parameters:") for name, param in MLR_model.named_parameters(): print(f"{name}: {param.data}")

理想情况下，模型应该学习到接近真实值(w₁=1, w₂=1, b=1)的参数。由于数据噪声的存在，结果会有小幅偏差。

4.2 损失曲线可视化

import matplotlib.pyplot as plt plt.plot(Loss) plt.xlabel("Iterations") plt.ylabel("Loss") plt.title("Training Loss Curve") plt.show()

健康的训练过程应该显示损失单调下降(可能有小幅波动)，最终趋于平稳。如果观察到：

损失剧烈波动：可能是学习率太大
损失不下降：可能是学习率太小或模型实现有误

5. 关键知识点与常见问题

5.1 为什么使用Mini-Batch训练

Mini-Batch梯度下降结合了批量梯度下降和随机梯度下降的优点：

比SGD更稳定的收敛
比全批量更高效的内存使用
适合GPU的并行计算
引入一定噪声有助于逃离局部极小值

5.2 学习率选择技巧

学习率是最重要的超参数之一，选择时可以考虑：

常见初始值：0.1, 0.01, 0.001
使用学习率调度器动态调整
监控损失曲线判断是否合适

5.3 常见问题排查

损失不下降：
- 检查数据是否归一化
- 确认模型实现正确
- 尝试更小的学习率
损失为NaN：
- 学习率太大导致数值不稳定
- 数据包含异常值
模型性能差：
- 检查数据是否有足够的信号
- 考虑更复杂的模型结构

6. 模型扩展与应用

虽然我们实现的是最简单的线性模型，但这个框架可以轻松扩展到更复杂的场景：

多输出回归：只需修改输出维度
添加隐藏层：构建真正的神经网络
添加正则化：在优化器中设置weight_decay参数
使用其他损失函数：如Huber损失对异常值更鲁棒

在实际项目中，这个基础框架可以用于：

房价预测
销售预测
任何连续值的预测任务

我个人的经验是，即使是简单的线性模型，在特征工程得当的情况下，也能解决很多实际问题。在转向更复杂的模型前，建议先用线性模型建立baseline。

查看全文

http://www.jsqmd.com/news/710695/

PyTorch与scikit-learn无缝集成实战指南

别再只当3D摄像头用了！手把手教你用Intel RealSense D435i玩转机器人SLAM（ROS2+Python实战）

从命令行到自动化：用Python脚本批量处理whois查询结果（附代码）

蓉城家长择师手记：川大家教网用一间实体办公室与三证核验，化解“试错焦虑 - 教育快讯速递

告别熬夜改 PPT！Paperxie AI 一键搞定毕业论文答辩 PPT，从容站上讲台

3步让Mac原生支持MKV等50+视频格式预览：QuickLookVideo完全指南

Visual Studio 扩展插件

ResNeSt实战：用PyTorch复现Split-Attention模块，提升下游任务性能

终极指南：3分钟用手柄掌控Windows电脑的完整解决方案

lvgl_v8之button toggle属性代码示例

告别答辩 PPT 熬夜，PaperXie 用 15776 套模板帮你轻松通关毕业季

Zotero 7 Beta搭配这些插件，让你的文献管理效率翻倍（含Jasminum中文优化）

常用蓝牙模块介绍

知网 AIGC 率 68% 降到 4%！比话pass 帮毕业生一次过 AIGC 检测！ - 我要发一区

嵌入式C代码合规性断崖式升级（2026 RTOS新规深度拆解）

LLM情感表达机制：从Transformer架构到情感电路

TaskWeaver：企业级AI任务编排框架实战指南

Langflow可视化AI工作流编排：从RAG到多智能体系统实战指南

【数据中心（IDC）+智算中心（AIDC）合集】1300余份IDC数据中心、AIDC智算中心、数据机房、超融合、超算、算力方案资料合集

万方 AIGC 率 45% 降到 5%！0ailv 帮毕业生过万方 AIGC 检测！ - 我要发一区

答辩前知网 AI 率超标，比话pass 不达标退款一键过 AIGC 检测！ - 我要发一区

Rust的dynTrait对象与implTrait抽象在闭包返回类型中的不同语义

Golang如何忽略JSON空字段_Golang JSON omitempty教程【最新】

算法训练营第十六天｜541. 反转字符串II

LLM Open Finance：金融领域大语言模型的技术架构与应用

15分钟快速搭建Java电商平台：LiteMall开源商城系统终极指南

count(begin, end, value)：统计等于 value 的元素个数

8000 字论文 AI 率高，嘎嘎降 35 分钟一键降到 4% 过 AIGC 检测！ - 我要发一区

如何快速搭建家庭电视服务器：Tvheadend终极配置完整指南

从零实现四大智能体模式：基于Groq API的Python实战指南