当前位置: 首页 > news >正文

[具身智能-263]:什么是回归?为啥叫回归?什么是线性回归? 分类问题为啥叫逻辑回归?

这几个问题直击了机器学习的核心概念,而且它们背后的命名故事非常有趣,甚至包含了一些历史误会。

我来为你逐一拆解:

📉 什么是回归?为啥叫“回归”?

1. 什么是回归?
在统计学和机器学习中,回归是一种用来探索变量之间关系的方法。简单来说,就是当你有一个或多个自变量( X )时,你想通过它们来预测一个连续的因变量( Y )。

  • 例子:根据房子的面积( X )来预测房价( Y );根据广告投入( X )预测销售额( YY)。

2. 为啥叫“回归”?(这是一个美丽的误会)
这个名字其实源于一个生物学现象,叫“回归均值”
19世纪,英国学者弗朗西斯·高尔顿在研究身高遗传时发现了一个有趣的现象:虽然高个子父亲生的儿子通常也比较高,但儿子的身高往往会向人口的平均身高“倒退”一点(没那么高了);反之,矮个子父亲的儿子虽然矮,但也比父亲稍微高一点,向平均值靠拢。
高尔顿把这种趋向于平均值的趋势称为“回归”。虽然后来这个方法被广泛用于各种预测(不仅仅是身高),但“回归”这个名字就一直沿用下来了。

📐 什么是线性回归?

线性回归是回归分析中最简单、最基础的一种。它的核心思想是假设变量之间的关系是直线(或超平面)。

  • 直观理解:如果你把数据画在坐标轴上(比如横轴是面积,纵轴是房价),线性回归就是试图画一条直线,让所有数据点到这条线的距离之和最小。
  • 数学公式
    • 一元线性回归(只有一个影响因素): Y=a+bX+ε
      • Y:你要预测的值(如房价)。
      • X :影响 YY 的因素(如面积)。
      • a 和 bb :模型要学习的参数(截距和斜率)。
      • ε :误差(无法被模型解释的部分)。
    • 多元线性回归(有多个影响因素): Y=a+b1X1+b2X2+...+ε(比如房价不仅受面积影响,还受楼层、房龄等影响)。

一句话总结:线性回归就是试图用一条直线去拟合数据,从而预测连续数值。

🤔 分类问题为啥叫“逻辑回归”?

这是一个非常经典的“名不副实”的例子。

1. 它是回归还是分类?
逻辑回归(Logistic Regression)本质上是分类算法,特别是用于二分类问题(比如:是/否,垃圾邮件/正常邮件,患病/健康)。它不是用来预测具体数值的回归算法。

2. 为啥名字里带“回归”?
这主要有两个原因:

  • 历史沿用:它沿用了统计学中“回归”的术语框架。
  • 数学原理:它的底层确实借用了线性回归的公式,但做了一个巧妙的“包装”。

3. 它是如何工作的?(从回归到分类的变身)
逻辑回归的运作过程可以看作三步:

  1. 先做一次“线性回归”
    它首先像线性回归一样,计算输入特征的加权和: z=wTx+b。这时候得到的 z 是一个任意大小的连续数值(可能是 -100,也可能是 +500)。
  2. 套上“Sigmoid函数”(关键一步)
    它把这个数值 z扔进一个叫Sigmoid的函数里。这个函数的神奇之处在于,无论输入多大或多小,它都能把输出压缩到0 到 1 之间
    • 公式: P=11+e−z
    • 这个输出 P 就被解释为概率(比如:属于“正类”的概率是 0.8)。
  3. 根据概率做“分类”
    设定一个阈值(通常是 0.5)。
    • 如果概率 P≥0.5P≥0.5 ,预测为“1类”(如:是垃圾邮件)。
    • 如果概率 P<0.5P<0.5 ,预测为“0类”(如:是正常邮件)。

总结对比

表格

特性线性回归逻辑回归
任务类型回归任务分类任务
预测目标预测具体的连续数值(如:房价 500万)预测类别概率(如:患病概率 80%)
输出范围任意实数 (−∞,+∞)(−∞,+∞)0 到 1 之间(概率值)
核心函数线性函数 Y=a+bXY=a+bX线性函数 +Sigmoid函数

所以,逻辑回归之所以叫“回归”,是因为它借用了线性回归的数学外壳,通过Sigmoid函数将其转化为概率,最终实现分类的目的。

http://www.jsqmd.com/news/602742/

相关文章:

  • 避开SNP芯片分型的3个大坑:GenomeStudio聚类分析常见问题解决方案
  • 2026年福建靠谱美术校考培训机构排名,福州纵横美术艺考口碑出众 - 工业品网
  • 收藏!小白程序员必看:轻松入门AI Workflow与Agent,解锁智能自动化新技能!
  • 解锁创意自由:Adobe-GenP工具的7大突破性功能解析
  • 突破数字版权枷锁:NCMDump解放加密音乐文件全解析
  • WINDOWS11 + VS2022 下.NET 4.0兼容性问题的终极解决方案
  • Lattice Diamond中Verilog未连接输入引脚的三种工程级修复策略
  • 基于SAC强化学习算法的ROS2机器人运动控制实战解析
  • 春招数据复盘 | 40+面试经验总结 | 高频题汇总 | 手撕代码 | AI Agent 面经 | 建议收藏慢慢看
  • 2026成都实验学校评测报告,这些学校值得家长关注,目前实验学校推荐精选国内优质品牌分析 - 品牌推荐师
  • DW_apb_uart(1): 深入解析AMBA2.0兼容UART的FIFO与DMA协同设计
  • 让Windows 11跑出火箭速度:Win11Debloat系统清理优化完全指南
  • 外卖系统订单模块设计避坑指南:地址簿管理与状态流转实战
  • 2023年数字图像处理实战:从噪声滤除到图像恢复的八大核心考题解析
  • 2026年宁波婚纱摄影公司排行,这些企业值得选 - mypinpai
  • 有效除湿直膨机组选购,国内口碑好的品牌推荐 - 工业品牌热点
  • mPLUG-Owl3-2B多模态工具生产环境部署:Nginx反向代理+HTTPS+用户鉴权配置
  • U-Net++模型剪枝指南:用TensorFlow实现参数压缩90%仍保持98%准确率
  • Onekey:智能Steam清单配置工具,让游戏管理效率提升10倍
  • 别再用红外了!用STM32F103RCT6驱动TSL1401线性CCD做循迹,效果和成本到底怎么样?
  • GHelper深度解析:华硕笔记本硬件控制的终极开源解决方案
  • 毫米波雷达监测呼吸心跳:在智慧养老与睡眠监测中的落地实践与挑战分析
  • 终极电脑静音指南:如何用FanControl 264版告别风扇噪音烦恼
  • 选博泰科创的合作企业,怎样判断其实力好不好 - 工业设备
  • 2026 知名的博大力华空压机联系方式哪家靠谱,永磁变频空压机/无油螺杆空压机/工频型 厂家选择指南 - 海棠依旧大
  • 【小沐学AR】ARCore实战:从零构建Android增强现实应用
  • 心电图AI分类终极指南:如何用深度学习实现94.5%准确率的心律失常检测
  • 2025新版机器视觉软件开发框架|Halcon+WPF插件源码(含完整算子库)
  • PHY芯片的MDIO接口和I2C总线有何区别?
  • 讲讲有消防认证的空气源热泵企业,山东艾科集团口碑如何 - myqiye