当前位置: 首页 > news >正文

Chapter 002. 线性回归

这个数据集可以帮助你估算客户可以卖多少钱

房子尺寸为1250平方英尺
从这个数据集中建立一个线性回归模型

Data has “Right Answers
Regressionmodel -> Predictsnumbers

  • 问题场景:用房屋面积(单位:平方英尺)预测房价(单位:千美元)

  • 模型输出:连续的数值结果(如面积 1250 平方英尺时,预测房价约为 220K 美元)

  • 关键特点

    • 预测目标是数值(Numbers)
    • 存在无限多可能的输出值
    • 模型通过拟合趋势线(线性回归),建立输入特征与连续输出的映射关系
      监督学习的共性

回归与分类都属于监督学习,其核心定义为:

数据中自带 “正确答案”(标签),模型通过学习输入与标签的对应关系,实现预测。

分类模型

聚焦于预测离散类别的任务,图中给出两类典型场景:

  • 二分类示例:区分 “猫” 和 “狗”,仅存在 2 种可能的输出结果

  • 多分类示例:疾病诊断,可输出 10 种不同的疾病类别

  • 关键特点

    • 预测目标是类别 / 标签(Categories)
    • 输出为有限个固定的离散值
对比维度回归模型分类模型
预测目标连续数值(如房价、销量、温度)离散类别(如物种、疾病类型、用户等级)
输出空间无限多可能的结果有限个固定的结果
典型场景房价预测、销量预测、股票价格预测图像识别、垃圾邮件过滤、疾病诊断

数据表格和可视化散点图


术语表

  • Training set(训练集):Data used to the model

  • Notation

    • x = “input” variable & feature
    • y = “output” variable & “target” variable
    • m = number of training examples
    • (x , y) = single training example
    • (x(i)x^{(i)}x(i),y(i)y^{(i)}y(i)) =i(th)i^{(th)}i(th)training example

Process Of How Supervised Learning Works

fw,b(x(i))=wx(i)+bf_{w,b}(x^{(i)}) = wx^{(i)}+bfw,b(x(i))=wx(i)+b
这个公式就是一条直线方程,它的作用是:

  • 用 w 控制直线的斜率(面积对房价的影响程度)
  • 用 b 控制直线的上下平移(调整整体预测的基准)
  • 最终目标是找到合适的 w 和 b,让这条直线尽可能贴近所有训练数据点,从而实现对新数据的预测。

单变量线性回归(一元线性回归)

importnumpyasnpimportmatplotlib.pyplotasplt plt.style.use('./deeplearning.mplstyle')# x_train is the input variable (size in 1000 square feet)# y_train is the target (price in 1000s of dollars)x_train=np.array([1.0,2.0])y_train=np.array([300.0,500.0])print(f"x_train ={x_train}")print(f"y_train ={y_train}")# m is the number of training examplesprint(f"x_train.shape:{x_train.shape}")m=x_train.shape[0]print(f"Number of training examples is:{m}")# m is the number of training examplesm=len(x_train)print(f"Number of training examples is:{m}")i=0# Change this to 1 to see (x^1, y^1)x_i=x_train[i]y_i=y_train[i]print(f"(x^({i}), y^({i})) = ({x_i},{y_i})")# Plot the data pointsplt.scatter(x_train,y_train,marker='x',c='r')# Set the titleplt.title("Housing Prices")# Set the y-axis labelplt.ylabel('Price (in 1000s of dollars)')# Set the x-axis labelplt.xlabel('Size (1000 sqft)')plt.show()w=100b=100print(f"w:{w}")print(f"b:{b}")defcompute_model_output(x,w,b):""" Computes the prediction of a linear model Args: x (ndarray (m,)): Data, m examples w,b (scalar) : model parameters Returns y (ndarray (m,)): target values """m=x.shape[0]f_wb=np.zeros(m)foriinrange(m):f_wb[i]=w*x[i]+breturnf_wb tmp_f_wb=compute_model_output(x_train,w,b)# Plot our model predictionplt.plot(x_train,tmp_f_wb,c='b',label='Our Prediction')# Plot the data pointsplt.scatter(x_train,y_train,marker='x',c='r',label='Actual Values')# Set the titleplt.title("Housing Prices")# Set the y-axis labelplt.ylabel('Price (in 1000s of dollars)')# Set the x-axis labelplt.xlabel('Size (1000 sqft)')plt.legend()plt.show()# Prediction for a house with 1200 sqftw=200b=100x_i=1.2cost_1200sqft=w*x_i+bprint(f"${cost_1200sqft:.0f}thousand dollars")
http://www.jsqmd.com/news/672930/

相关文章:

  • AI Agent Harness Engineering 在金融:风控、合规与可解释性挑战
  • 大厂Java面试实录:Spring Boot/Cloud、Kafka、Redis、K8s 与 Spring AI(RAG/Agent)三轮连环问
  • 告别黑盒子:给你的树莓派/香橙派LCD屏加上内核调试终端(含fbcon配置与inittab修改)
  • 景区气象监测站
  • Go并发架构下的漫画批量下载引擎:comics-downloader深度技术解析
  • 用 Agent 自动化数据处理:从 2 小时到 15 分钟的效率革命
  • Ryzen SDT终极指南:免费开源工具实现AMD处理器深度调试与超频
  • 3步解锁加密音频:实现全平台自由播放的终极方案
  • AI印象派艺术工坊提速技巧:图像分块处理部署优化教程
  • 告别重复劳动:青龙面板自动化签到工具解放你的数字生活
  • UDS诊断协议(十六)详解故障码DTC的重要参数-故障检测计数器FDC
  • 从PS2.0数据集出发:聊聊自动驾驶中停车位检测的‘脏活累活’与工程挑战
  • Steam成就管理器:5分钟掌握游戏成就自由掌控的终极指南
  • 长沙金海中学答题:中天电子实现精准调控
  • C# 14 AOT部署Dify客户端,你还在用dotnet publish --self-contained?这6个被微软文档隐藏的--aot选项正在重构企业交付标准
  • 百度网盘秒传链接网页工具:3步搞定全平台文件极速分享
  • C# Blazor面试必考TOP12题型深度拆解(含MAUI互操作、JS隔离沙箱、SignalR流式响应全场景代码)
  • OpenCore Auxiliary Tools:3步搞定黑苹果配置的终极图形化工具
  • 从‘浪费生命’到‘轻松驾驭’:我的NRF24L01/SI24L01调试心路与替代方案盘点
  • STM32 RTC实战:从GPS模块获取UTC时间,自动校准并显示北京时间的全流程指南
  • 百度网盘下载加速全攻略:3步解锁满速下载的免费开源方案
  • DeepSeek总结的DuckDB internals 的 设计与实现 (DiDi)
  • 从π的无穷乘积到‘点火失败’:Wallis公式背后的数学简史与思想演变
  • Android14 Launcher3开发实战:用SurfaceControl实现跨进程动画的5个关键技巧
  • MusicBee歌词同步神器:3步解锁网易云音乐海量歌词库的专业指南
  • 文献管理工具四强争霸:EndNote、Zotero、Scholaread、NoteExpress 功能横评
  • D3KeyHelper终极指南:如何构建暗黑3智能战斗自动化系统
  • Windows Defender 四层防护解除技术深度解析:defender-control 开源项目完全指南
  • 4.16日志
  • 2026届必备的降AI率网站推荐榜单