当前位置: 首页 > news >正文

深度学习篇---预测模型训练过程中涉及的所有“维度”概念以及流程的动态变化

预测模型与分类模型虽然同属监督学习,但在输出维度、损失函数形态和评价体系上有本质区别。我们从“回归预测”的视角来拆解训练中涉及的维度概念及其动态演变。

一、 数学维度流:从高维空间到连续实数值的映射

预测模型的核心目标是拟合一个连续函数 y=f(X),其输出通常是无界的连续实数值(如温度、股价、年龄、销量)。这与分类模型输出“离散类别概率”有根本不同。

以下以房价预测(输入:房屋属性表格数据,Batch Size = N)为例:

阶段模块/层名称张量维度变化([Batch, Features]维度含义与预测特有关注点
1. 原始输入结构化数据[N, D]特征空间D代表特征数量(面积、卧室数、位置编码)。这是预测的信息源头。
2. 特征工程归一化/分桶[N, D]分布对齐:预测模型对数据尺度极度敏感,必须将特征缩放到相似量级,否则梯度更新会偏向大方差维度。
3. 隐层映射全连接层[N, D][N, H1][N, H2]维度升降:通过隐藏层单元数 HH 控制模型容量。不同于CNN压缩空间,这里是非线性特征交叉
4. 回归头输出层[N, H_last][N, 1]维度坍缩至标量这是与分类最本质的区别。分类输出是[N, C]的向量(C个概率),预测输出是[N, 1]单一连续值
5. 结果还原反归一化[N, 1]物理意义还原:将归一化后的预测值映射回真实量纲(如元、公斤)。

二、 流程变化:针对连续值的特殊处理机制

预测模型的训练流程中,除了通用的前向/反向传播,还有几个特有的维度概念需要处理:

1. 输出维度的物理边界约束
  • 问题:房价、销量等预测值必须 ≥0≥0。

  • 流程干预:在输出层后添加激活函数约束。例如使用ReLU强制非负,或使用exp(x)确保正值。这会改变输出张量的值域维度

2. 损失函数的空间形态变化

分类用的是交叉熵(Cross-Entropy),计算的是概率分布之间的距离;预测用的是均方误差(MSE)平均绝对误差(MAE),计算的是欧几里得空间中的几何距离

  • MSE Loss

    • 维度视角:它放大了大误差样本的梯度贡献,对离群点敏感。

  • MAE Loss

    • 维度视角:梯度恒定,对离群点鲁棒,但在零点不可导。

3. 时间维度的引入(时序预测特例)

如果是预测未来(如股票价格、天气),维度概念会进一步升级:

  • 输入维度:从 2D[N, D]升级为 3D[N, T, D],其中T是时间步长(Time Steps)

  • 流程变化:网络结构变为RNN / LSTM / Transformer,引入了隐藏状态(Hidden State)这一随时间传递的维度。


三、 分类 vs 预测:核心维度差异对照

为了更清晰地区分两者,这里整理了一个对照表:

维度对比项分类模型预测模型(回归)
输出张量形状[Batch, Num_Classes][Batch, 1]
输出值域[0, 1]概率分布连续实数 (−∞,+∞)(−∞,+∞)
最终激活函数Softmax(归一化指数)Linear / ReLU(恒等映射或截断)
核心损失函数交叉熵 (Cross-Entropy)均方误差 (MSE)/平滑 L1
评价指标准确率、F1-Score、AUCRMSE, MAE, R², MAPE
对异常值的敏感度较低 (仅影响概率微调)极高(会直接拉偏回归线)

四、 Mermaid 总结框图

下图展示了预测模型训练中数据维度流变流程特殊处理的协同关系。

五、 总结:预测模型的维度哲学

如果说分类是给数据划定疆界(找分界线),那么预测就是测量数据点与理想函数之间的物理距离

  • 维度收敛目标:分类收敛于概率单纯形;预测收敛于一维实数轴上的一个点。

  • 训练核心挑战:不是类别是否分对,而是预测值与真实值在刻度尺上差了几格

http://www.jsqmd.com/news/663559/

相关文章:

  • 2026年口碑好的外贸代理/磁铁外贸代理专业公司推荐 - 品牌宣传支持者
  • Halcon 实战指南:基于局部形变的模板匹配在柔性物体检测中的应用与参数调优
  • 5个实战技巧:用ChatGPT写编程提示词避坑指南(附Python示例)
  • OceanBase表级物理恢复
  • 告别玄学调参!基于STM32G4的PID与PFC算法调试实录:我是如何用示波器和串口把效率做到95%+的
  • Kali Linux实战:用Ettercap实现DNS劫持的5个关键步骤(附避坑指南)
  • 别再搞混了!一文讲清舵机PWM、伺服脉冲和占空比的区别(附示波器实测波形图)
  • 从条纹到机理:SAR与光学遥感如何“看见”海洋内波
  • 【2026年最新600套毕设项目分享】基于微信小程序的社区团购(30096)
  • GitHub中文界面终极指南:3分钟让英文GitHub变身中文工作台
  • Navicat导入HTML网页报错怎么跳过_忽略错误记录高级选项
  • OrCAD Capture CIS BOM导出进阶技巧:自定义属性字段全攻略
  • Oracle学工系统实战:手把手教你用SQLMAP绕过某商业WAF(附垃圾数据包脚本)
  • 从事件查看器到Log Parser:构建Windows日志自动化分析实战指南
  • 成都办公室租赁,揭秘行业领先者
  • 宝宝取名网推荐榜单权威解析:如何选择专业、可靠且助运的起名平台
  • 【2026年最新600套毕设项目分享】家具购物微信小程序(30097)
  • 2025届学术党必备的六大AI学术方案推荐
  • 深度解析抖音无水印下载器:开源工具的高效批量下载技术实战
  • PID控制中的采样时间陷阱:为什么你的STM32定时器配置总是不准?
  • 我为什么鼓励团队成员写技术博客?
  • 基于语义搜索假装图像生成
  • 京东自动评价神器:5分钟解放你的购物时间,轻松赚取评价积分
  • 【论文】监控视频中微妙抢劫检测的可解释人体活动识别
  • Elasticsearch 服务部署指南:从零启动+完整配置(流程图+避坑+生产可用)
  • AGI意识判定标准突变!2026奇点大会发布ISO/IEC AWI 27099草案,开发者必须在Q3前完成合规适配
  • 从bxCAN到FDCAN:STM32H743的CAN过滤器配置到底变了啥?一个对比教程
  • 如何设计一个不可变(Immutable)的类?
  • 5分钟从Word到LaTeX:docx2tex终极转换指南
  • vue2+element-UI表格封装