当前位置: 首页 > news >正文

实用指南:逻辑回归解释

实用指南:逻辑回归解释

一、介绍:

逻辑回归主导是二分类的算法,给定一组(x1、x2...)输出该样本预测类别结果为1的概率值:y=P(y=1|x)。

二、原理:

z=w1x1+w2x2+...wnxn+b

1、x1、x2...是输入的特征

2、w1、w2...是模型学习到的每个特征的权重

3、b是偏置,模型学习的

4、z是计算结果,属于(-∞,+∞)

然后是sigmoid函数部分

由于z属于(-∞,+∞),输出的不是离散的1和0,所以使用sigmoid函数把z压缩到(0,1)之间。

公式:y = 1 / (1 + e^(-z))

性质:

  • 无论 z 是多少,y 的输出值永远在 0 和 1 之间。

    • z 为 0 时,y = 0.5

    • z 非常大时,y 无限接近 1。

    • z 非常小时,y 无限接近 0。

例子:

假设我们构建一个更完善的河流洪水预测模型,现在使用三个特征

  1. X₁: 过去24小时流域降雨量 (mm)

  2. X₂: 河流上游监测站的水位 (m)

  3. X₃: 土壤饱和指数 (0-1之间,1表示完全饱和)


第一步:训练好的模型

假设模型训练后,学到的参数如下:

  • 权重 W₁ (降雨量): 0.08

  • 权重 W₂ (水位): 1.5

  • 权重 W₃ (土壤饱和度): 4.0

  • 偏置项 b: -10

线性组合 z 的公式为:
z = (0.08 * X₁) + (1.5 * X₂) + (4.0 * X₃) - 10

概率 P 的公式(Sigmoid函数)不变:
P(洪水) = 1 / (1 + e^(-z))

这个模型可以理解为:

  • 土壤饱和度 (X₃) 的权重最大 (4.0)引发洪水的最关键因素。基于已经饱和的土壤无法再下渗,雨水会直接转化为径流。就是,说明它

  • 水位 (X₂) 的权重也很大 (1.5),表示当前河道的底水情况非常重要。

  • 降雨量 (X₁) 的权重相对较小 (0.08),但这不代表它不重要,只是基于它的数值通常远大于其他特征(比如降雨量是几十,水位是几,土壤饱和度是零点几)。


第二步:多场景分类决策(阈值仍设为0.5)

现在我们分析三种不同的气象水文组合。

场景一:台风过境,强降雨但底水低
  • X₁ (降雨量): 120 mm (很大)

  • X₂ (水位): 1.2 m (较低)

  • X₃ (土壤饱和度): 0.4 (因为前期干旱,土壤较干)

  1. 计算 z:
    z = (0.08 * 120) + (1.5 * 1.2) + (4.0 * 0.4) - 10
    z = 9.6 + 1.8 + 1.6 - 10 = 3.0

  2. 计算 P:
    P = 1 / (1 + e^(-3.0)) ≈ 1 / (1 + 0.05) ≈ 0.95

  3. 决策:
    P = 0.95 > 0.5预测:发生洪水 (1)
    解读:尽管初始水位低、土壤不算饱和,但极端降雨量本身足以导致洪水。

场景二:持续阴雨,高水位且土壤饱和
  • X₁ (降雨量): 25 mm (小雨)

  • X₂ (水位): 3.0 m (已接近警戒水位)

  • X₃ (土壤饱和度): 0.95 (土壤已经完全饱和)

  1. 计算 z:
    z = (0.08 * 25) + (1.5 * 3.0) + (4.0 * 0.95) - 10
    z = 2.0 + 4.5 + 3.8 - 10 = 0.3

  2. 计算 P:
    P = 1 / (1 + e^(-0.3)) ≈ 1 / (1 + 0.74) ≈ 0.57

  3. 决策:
    P = 0.57 > 0.5预测:发生洪水 (1)
    解读少量降雨也会几乎全部汇入河道,导致水位超过临界点。就是:这就是典型的“最后一根稻草” scenario。虽然雨不大,但河道底水高,加上土壤饱和,即使

场景三:普通降雨,各项指标正常
  • X₁ (降雨量): 15 mm

  • X₂ (水位): 1.5 m

  • X₃ (土壤饱和度): 0.6

  1. 计算 z:
    z = (0.08 * 15) + (1.5 * 1.5) + (4.0 * 0.6) - 10
    z = 1.2 + 2.25 + 2.4 - 10 = -4.15

  2. 计算 P:
    P = 1 / (1 + e^(-(-4.15)))) ≈ 1 / (1 + 63.5) ≈ 0.015

  3. 决策:
    P = 0.015 < 0.5预测:不发生洪水 (0)
    解读:所有指标都在安全范围内,系统综合判断风险极低。


第三步:引入更精细的决策阈值(多级预警)

在实际水文预警中,单一的“是/否”决策太粗糙了。我们会使用多个阈值来建立多级预警系统,这更能体现逻辑回归输出概率的优势。

  • 蓝色预警 (关注级): P >= 0.3

    • 通知水务部门和相关人员保持警惕,加强监测。

  • 黄色预警 (警示级): P >= 0.6

    • 向公众发布预警信息,提醒远离河道。

  • 橙色预警 (行动级): P >= 0.8

    • 启动应急响应预案,准备疏散低洼地区人员。

  • 红色预警 (紧急级): P >= 0.95

    • 立即执行疏散命令,采取一切必要措施。

现在,大家用该多级预警系统重新审视上面的场景:

  • 场景一 (P=0.95): 直接触发红色预警。模型非常有把握,需要立即采取最高级别的应急行动。

  • 场景二 (P=0.57): 触发黄色预警。模型认为风险显著,需要提醒公众注意,但尚未达到需大规模疏散的程度。

  • 场景三 (P=0.015): 无预警。一切正常

三、逻辑回归的损失函数

平方差损失函数:不适用--产生多个局部最小值

这里的损失函数:

如果 y=1,损失为 -log(ŷ),那么要想损失越小,ŷ 的值必须越大,即越趋近于或者等于 1
如果 y=0,损失为 -log(1-ŷ),那么要想损失越小,那么 ŷ 的值越小,即趋近于或者等于 0

这个损失函数关注单个样本的预测误差

而多个样本的预测误差的算数平均为代价函数:

四、梯度下降

通过损失函数找到了预测值与目标值之间的误差,那么我们怎么优化呢,找到最合适的参数部署使损失达到最低。因此这里需要应用梯度下降算法:使损失函数达到最小值。

参数w和b的更新公式:

http://www.jsqmd.com/news/369394/

相关文章:

  • FORTIFY_SOURCE(编译时安全检查)
  • 万爱通礼品卡回收必看!靠谱平台与快速交易流程全攻略 - 团团收购物卡回收
  • 2026年知名的玉溪全屋定制,丽江全屋定制厂家新品推荐榜 - 品牌鉴赏师
  • 低烟无卤电力电缆怎么挑?2026年口碑佳选来袭,通信电缆/YJV22高压电力电缆,低烟无卤电力电缆直销厂家排行榜单 - 品牌推荐师
  • AI违规输出防护:监管与风险双重驱动下的刚性需求
  • 2026年重庆杀虫剂厂家哪家可靠?从技术到服务 全维度实用参考手册 - 深度智识库
  • 2026年专业的红外理疗灯珠,红光理疗灯珠厂家选购参考指南 - 品牌鉴赏师
  • 基于MATLAB 多算法雷达一维恒虚警检测CFAR可视化界面
  • 应用安全 --- 安卓加固 之 RELRO(RELocation Read-Only)
  • 全屋定制品牌哪个靠谱?2025年-2026年全屋定制品牌推荐与排名,解决材料环保性与售后无保障痛点 - 十大品牌推荐
  • 2026年靠谱的链板输送机,皮带转弯输送机厂家行业精选名录 - 品牌鉴赏师
  • 2026年可靠的隧道盾构管片,地铁盾构管片,管廊盾构管片厂家优质供应商榜单 - 品牌鉴赏师
  • 基于Matlab实现和相等的两个不相交子集
  • 10325_基于SpringBoot的二手图书系统
  • 最受家装设计师欢迎的展会有哪些?2026五大权威展会深度解析|助你抢占先机 - 匠言榜单
  • 2026年优秀的市政检查井,混凝土检查井厂家口碑推荐清单 - 品牌鉴赏师
  • Sa-Token(一)之简介及入门:告别鉴权内耗,让每一位Java开发者都能轻松上手
  • 【股票】【股票的量化交易是什么】【股票的量化交易优点是什么】【股票的量化交易缺点是什么】
  • 膏体灌装机生产厂家推荐,山东地区有哪些好用又实惠的品牌? - mypinpai
  • 分析扬州板式换热器选购要点,玖耀换热产品价格贵不贵? - 工业推荐榜
  • MoE架构十年演进
  • USB总线和协议
  • GEO优化公司价格差异大,北京哪家费用更合理? - 工业品牌热点
  • 2026年口碑好的药店AI健康管理,中医馆AI健康管理公司采购优选指南 - 品牌鉴赏师
  • Transformer十年演进
  • 2026年大连地区神八五苔复合肥质量排名新鲜出炉 - 工业设备
  • 【Hadoop+Spark+python毕设】基于大数据的大众点评美食数据分析与可视化系统、计算机毕业设计、包括数据爬取、数据分析、数据可视化、实战教学
  • 2026年河南激光除锈机品牌推荐,适合锰合金除锈且口碑好的有哪些 - 工业推荐榜
  • Triton十年演进
  • 2026年新疆、内蒙古等地实力强的暖气片公司年度排名及选购指南 - 工业品牌热点