当前位置: 首页 > news >正文

机器学习深度学习beginning1

1.机器学习:就是让机器具备找函式(寻找规律)的能力。
2.不同类型的函式:
回归:函数输出一个数值,输入可能是多种能够判断输出结果的指标,预测连续数值。
分类:给定选项类,函式输出正确的选项,预测离散类型。

如何找到函式:a.假设函数y(y就是模型,可带有未知参数);b.根据训练数据定义损失L(判断模型的好坏,实际也是一个函数);c.优化(Optimiztion),找最佳的y中的未知参数,使得损失最小。
MAE:均值绝对误差,e=|y-y'|(y'为预测值,y为真实值)
MSE:均方差,e=(y-y')²(y'为预测值,y为真实值)
:学习率,寻找未知参数的最佳值时用到

3.模型分为:线性模型、非线性模型
liner function:(会具有模型偏差)

Sigmoid function:(w改变斜率、b改变左右位置、c改变上下高度)

Rectified Liner Unit(RLU)

4.深度学习:由多个神经元组成神经层,从而构成深度神经网络的机器学习。
神经元 (Neuron):基本计算单元,接收输入,加权求和,通过激活函数输出(相当于过滤器)。
层:输入出、隐藏层(进行特征提取和变换)、输出层。
激活函数:让网络拟合出复杂的曲线。(ReLU、Sigmoid)

5.常见的网络架构:
CNN(卷积神经网络):处理网络状数据。(图像)
RNN(循环神经网络):处理序列数据,具有“记忆”特点。(文本)
GAN(生成对抗网络):生成内容。

6.(AI生成)

术语解释通俗理解
特征 (Feature)输入数据的属性比如预测房价,特征就是“面积”、“地段”、“房龄”。
标签 (Label)想要预测的目标值比如预测房价,标签就是具体的“价格”。
模型 (Model)经过训练后的算法文件就像学生学完知识后的大脑,可以用来做题。
训练集/测试集用于训练和验证的数据划分训练集是“课本”,测试集是“期末考试题”。
损失函数 (Loss)衡量预测值与真实值差距的公式考试扣了多少分,分数越低越好。
优化器 (Optimizer)用于更新模型参数的算法老师根据错题指导学生如何改进学习方法(如 SGD, Adam)。
梯度下降 (Gradient Descent)寻找损失函数最小值的方法下山的过程,一步步往坡度最陡的地方走,直到谷底。
过拟合 (Overfitting)模型在训练集表现好,测试集表现差“死记硬背”,课本题都会,考试换个题就不会了。
欠拟合 (Underfitting)模型在训练集和测试集表现都差“没学懂”,课本题都不会。
超参数 (Hyperparameter)训练前人工设定的参数如学习率、网络层数(类似于“每天学几小时”)。

7.训练损失

8.过拟合
表现:训练集准确率很高,但测试集/验证集准确率很低)。
本质:模型太复杂,记住了数据中的“噪声”而不是“规律”。
解决方法:
增加训练数据
数据增强(没有足够的数据,需要对原数据进行变换)
给模型进行限制:减少参数、使用共享参数、去掉不相关或冗余的特征、早停法(early stopping)、正则化技术(Regularization)、Dropout。

9.欠拟合
表现:训练集准确率低,测试集/验证集准确率很低。
本质:模型太简单。
解决方法:
增加模型复杂度
减少正则化
增加新特征
增加训练时间(epoch)

注:所有的机器学习深度学习系列的博客都来自于B站:
https://www.bilibili.com/video/BV1TAtwzTE1S?spm_id_from=333.788.videopod.sections&vd_source=4106df216615f53c8d3e6469d4c06be8

http://www.jsqmd.com/news/577643/

相关文章:

  • Unity Shader Alpha Test 与 Alpha Blend:透明度测试与混合的实现及排序问题
  • 黑马点评-day03-秒杀笔记
  • Wan2.2-I2V-A14B显存优化教程:xFormers+FlashAttention-2配置与验证
  • 别再让AI瞎猜了!5个实战案例教你写出让Vibe Coding一次成功的提示词
  • 3步解锁抖音直播回放下载开源工具:告别录屏时代的高效解决方案
  • XSS攻击通用工具类
  • Python自然语言处理实战:从基础到应用
  • CUDA环境混乱导致bitsandbytes安装失败?3步彻底清理残留驱动(附A100实测)
  • 新手福音:通过快马平台ai生成可运行的spring项目快速入门
  • GLM-4-9B-Chat-1M企业级部署:vLLM算力适配方案与GPU利用率提升50%
  • 二极管基础全解(从原理、计算到选型应用)
  • 建筑工程环境检测迈入AI报告审核时代:IACheck实现全要素智能校验与质量升级
  • Android Navigation组件实战:从零构建高效Fragment导航系统
  • 2026年 防微振系统/平台/基台/装置/设备厂家推荐排行榜:精密主动与被动隔振技术,洁净室防微振解决方案深度解析 - 品牌企业推荐师(官方)
  • LightOnOCR-2-1B实战体验:11种语言混排图片识别效果实测
  • 法律AI助手调参实战:为什么我把temperature设为0.3,而不是0.7或0.1?
  • 利用快马AI快速生成xshell8风格终端管理界面原型
  • 全志T527以太网吞吐率上不去?别只调delay,这份性能排查指南帮你定位真凶
  • php方案 碎片化诊断
  • 数据工程师必备:DataX全量迁移与Flink CDC增量同步的黄金组合方案
  • 文脉定序系统一键部署教程:Ubuntu环境快速搭建指南
  • PyG安装踩坑实录:从CUDA版本冲突到ModuleNotFoundError,我的PyTorch Geometric环境搭建血泪史
  • 3个高效步骤:使用开源工具tchMaterial-parser下载国家中小学智慧教育平台电子课本
  • 2026年4月怎么搭建OpenClaw?云端部署OpenClaw、配置百炼APIKey、集成Skill喂饭级流程
  • 别再死磕逐位计算了!用C语言手撸一个CRC32查表函数(附完整代码和表格生成)
  • AI驱动的视频硬字幕精准修复技术:从痛点解决到行业革新
  • 2026年公交站台厂家推荐排行榜:智慧公交站台、综合公交站台、城市快速路公交站台、枢纽型公交站台、TOD配套公交站台、智能系统与升级改造方案深度解析 - 品牌企业推荐师(官方)
  • 别再只会用pywt.cwt了!手把手教你从零实现Python连续小波变换(附完整代码与调参避坑指南)
  • Oracle EBS FA 比例分摊惯例设置实例
  • 用JK触发器搭个10进制计数器:从真值表到自启动检查,手把手带你走一遍