当前位置: 首页 > news >正文

从机器学习到深度学习,从CNN到Transformer再到LLM

前记

前段时间偶然看到一位同学发了一个朋友圈,大意是:TA作为经历了上一波(2017年左右)深度学习浪潮的“老登”,现在又遇到了生成式人工智能,潮起潮落,坐看几度夕阳红。
虽然我还没理解“老登”这个Token是啥意思,也没好意思查下,但是这位同学在校时代确实比较厉害,我深感自愧不如。现在生成式人工智能的浪潮,随时有可能把饭碗拍在沙滩上,所以重拾下2017年开始接触到的深度学习,看下这快10年间,学术和技术的演进历史。
(20年面试MindRay时,面试官问我如果给你一个输入图像,再给你一个卷积网络,你能算出网络第n层输出的图像大小吗?作为一个0 论文在手的小登,我说算不出来,然后就…)
(20年面试UnionImage时,一个老登面试官出了一道图像题,请写出将一个图像旋转theta度的代码,我交了一张白卷。老登对我说,我就不给你面试机会了,不过你简历做的不错…)
言归正传,下来梳理下AI的演进历史,知道来龙去脉,才知道以后要往哪里走。

Machine Learning && Deep Learning

高中时代,隐约记得学过一篇英文课文,大意是一个老外雕刻家,花了很大的心思雕刻了一个类似胜利女神像的雕塑,结果雕刻完,自己对自己的作品爱的深沉,爱上了自己所雕刻的女神。一个伟大的哲学命题是:我是谁,我从哪里来,我要到哪里去。人类具有无可比拟的智慧,进化论呈现了人类从Monkey到人的过程,Monkey没有思想,人有思想,知道自己是谁了。
技术发展的演进历史,和哲学命题类似,人类的终极发展,就是人造就出了AI(Artifial Intelligence)。AI的概念很广,但是技术的起步,并不是一步到位的,AI的早期发展理论,就是机器学习。
机器学习简单说就是人帮机器提炼特征,机器自己学规律,代表算法有SVM(Support Vector Machine,支持向量机)等。
2017年前后,在机器学习理论基础上,衍生出了基于卷积神经网络的深度学习。深度学习概括来说,就是提供训练集,通过卷积神经网络,让机器自己提炼卷积特征,学习规律。典型算法是各种CNN。这一阶段,典型的应用就是基于CNN的图像识别。
如果机器学习和深度学习是AI的范畴,那CNN、Transformer和LLM,就是深度学习的具体方法论。

Convolutional Neural Network to Transformer to Large Language Model

  1. CNN
    卷积神经网络距今发展已经快10年了,下次再更新下复习情况,主要是原理、关键代码实现。

  2. Transformer
    CNN之后,2017年划时代的论文《Attention is all you need》提出了Transformer模型,论文免费下载路径:https://arxiv.org/abs/1706.03762。同步出的论文注释链接:https://nlp.seas.harvard.edu/annotated-transformer/

  3. LLM

先写到这里,持续更新中。

http://www.jsqmd.com/news/738824/

相关文章:

  • 别再手动写Select了!Vben Admin的ApiSelect组件,5分钟搞定后台数据远程搜索
  • 让Xbox 360控制器在macOS上完美运行:360Controller驱动完全指南
  • 二刷 LeetCode:215. 数组中的第 K 个最大元素 347. 前 K 个高频元素 复盘笔记
  • 嵌入式固件防篡改测试失效真相(92%工程师忽略的CRC32校验盲区与SHA-256硬件加速陷阱)
  • 2026年Turnitin AI检测升级深度解读:新版本对留学生论文降AI影响完整分析 - 还在做实验的师兄
  • H5Maker开源编辑器:3步搭建你的专属H5创作平台
  • HuixiangDou:专为群聊场景设计的智能知识助手部署与实战
  • 网络卡顿排查不求人:5分钟用iperf3定位是带宽瓶颈还是延迟问题(Windows/Mac/Linux全平台指南)
  • SABnzbd(二进制新闻阅读器) 5.0
  • 2026年体育学论文降AI工具推荐:运动科学研究4.8元极速降AI完整指南 - 还在做实验的师兄
  • AI智能体安全审计:基于密码学账本与策略引擎的EctoClaw实践
  • 解锁Mac游戏控制新境界:360Controller让你的Xbox手柄重获新生
  • 观察 Taotoken 在不同网络环境下 API 调用的延迟表现与容灾感受
  • 【工业级C语言OTA配置标准V2.3】:基于STM32+FreeRTOS的12项强制校验清单(附可审计配置表)
  • 抖音下载器终极指南:三步实现批量无水印下载,效率提升90%
  • 面试必问!MySQL 事务到底是怎么实现的?这篇文章讲透了
  • 为什么你的YOLOv5在树莓派跑不动?Python轻量化不是“简单剪枝”——资深边缘架构师拆解4层冗余消除机制(含热力图可视化诊断)
  • 如何高效解放双手:绝区零一条龙智能自动化助手实战指南
  • 2026年公共管理论文降AI工具推荐:行政管理政策研究答辩前知网达标方案 - 还在做实验的师兄
  • C语言OTA固件差分升级调试实录(基于bsdiff+ed25519签名验证的端到端调试日志还原)
  • 别再死记硬背Nash均衡了!用Python模拟‘囚徒困境’和‘性别战’,5分钟搞懂博弈论核心
  • 学术研究中事实陈述提取的技术实现与应用
  • 【Python低代码平台插件化开发实战指南】:20年架构师亲授5大核心设计模式与3个工业级落地案例
  • AKShare金融数据接口库:Python量化分析的完整高效解决方案
  • 刷蛋机哪家好:企业选购核心标准标准与策略深度解析
  • 告别Outlook!Foxmail 7.2.25保姆级配置教程,手把手教你同步Gmail和企业微信
  • 解锁Switch游戏新境界:3步掌握大气层整合包安装与优化
  • 智能作业车辆路径规划【附ROS仿真】
  • 如何在普通PC上安装macOS:OpenCore完整配置方案指南
  • 2026年农业科学论文降AI工具推荐:农学园艺畜牧研究亲测99.26%达标指南 - 还在做实验的师兄