当前位置：首页 > news >正文

2. 一元/多元线性回归之正规方程求解法

news 2026/6/19 8:21:26

1. 一元线性回归 – 正规方程法求解

（一元线性回归先对 k求偏导，再对b求偏导，将得到的两个式子进行计算，得到二元一次方程的解。不需要像前面的案例，对b进行假设(假设b=100)）

2. 多元线性回归 – 正规方程法求解

（1️⃣ 图示：特征为x即横着，竖着的1234分别为x的几个特征列，横着的x1、x2…分别为数据1、数据2等第几条数据，每一列都有自己的系数w1、w2…：即w1是第1列的权重、w2是第二列的权重…；2️⃣ 第1个样本预测值：(即x1这行)数据的预测值（如图文字公式）： y = w的转置 * x + b = w1乘以x1这一行的第一列即w1乘以11 ＋ w2乘以x1这一行的第二列即w2乘以12 ＋ w3 乘以 x1这一行的第三列即w3乘以13 + …即可算出第一行（第1个样本）即x1这行数据的预测值；

损失函数（如图公式）

3️⃣第1个样本的损失：（如图文字公式）符号：伊普西龙。等号前：(预测值 - 真实值)即误差，算平方；等号后：w1x11+w2x12+w3x13…，这是第一个样本的损失；(第二个样本的损失：w1x21+w2x22+w3x23+…wdx2d+b-y1再平方)；式子变形：()括号内是预测值减去真实值y1，j表示当前样本的每一列特征：从1开始，j=1时是第一列，j=2是第二列；d表示一共有d列特征；当前算出的是第一个样本的损失；第二个样本的损失：如图，1的位置换成2；第三个样本的对应位置换成3…多个，前面用∑，d代表一共有d列特征，j代表当前样本的每一列特征，i从1开始，到m结束，m代表一共有m个样本，此为多原线性回归的损失函数；
想让损失函数的值最小即要对损失公式进行求导；“只要让多元线性回归损失函数取最小值，此时的权重W(w就是一个向量)就是最优解!” 为什么w就是一个向量?：假如有(w1, w2, w3, w4)4列特征，这4列可看作是Pandas中的Series对象，那么它充当的角色就是向量；）

2.1 损失函数普通方式转成矩阵方式

（可将损失函数的普通方式转为矩阵方式：损失J(w) = 第一个样本的预测h(x1) - 真实值y1）+ 第二个样本的预测h(x2) - 真实值y2 + …+ 第m
个样本的预测h(xm) - 真实值ym == i从1开始到m个，()括号里面是(预测值-真实值)误差；等价于上面的公式：里面是wx的转置加上b；
铺垫知识：X的转置成语x = x范数的平方；证明：
①举例：L2范数：有一个元素坐标是(1, 2)，求其向量模：x轴坐标为1，y轴坐标为2，模长为1的平方+2的平方，再开平方；即为2范数。假设元素坐标为(1, 2, -3)，模长为1方+2方+3方，再开平方根；即为2范数。
如不开平方根，则为2范数的平方；②举例 X的转置 * X：例如有一个x(1, 2, -3), x的转置乘以x：对应11 + 22 + (-3)(-3)。
(x的转置)可写成X乘以w减去y。求公式的最小值即针对w进行求导，因为x代表特征、y代表标签，将公式看作一个复杂函数求导(先对外求导，再对内求导)：得到第(1)步，在第(2)步：两边都乘以x的转置—(3)假设逆存在，两边都乘以(x的转置x)的逆(矩阵乘以矩阵的逆矩阵得到单位矩阵，单位矩阵就是1)—(4)消掉2
—(6)两边都乘以x的转置—(7)再乘以(x的转置*x)的逆…）