当前位置: 首页 > news >正文

【通俗易懂告诉你什么是人工智能/CNN/RNN/DL......】

文章目录

  • 前言
  • 一、人工智能就是一辆车
  • 二、机器学习:不给规则,让它自己学
  • 三、人工神经网络:给车装个假脑子
  • 四、深度学习:把脑子做深一点
  • 五、CNN:看图专家
  • 六、RNN:看连续剧的哲学家
  • 七、GAN:真假美猴王之战
  • 八、Transformer:新的革命
  • 九、它们到底是什么关系?
  • 十、总结

前言

前段时间我特别焦虑。因为我发现身边所有人都在聊AI:什么CNN、RNN、GAN、Transformer……每个词我都认识,但连在一起我就不知道他们在说什么了。于是我花了一些时间,看了很多文章查了很多资料,现将一些个人总结分享给大家。


一、人工智能就是一辆车

人工智能就是你想造一辆自己跑的自动驾驶的车。我们希望它看到红灯会停,看到行人会刹车,希望它能安全驾驶,带我们从A地到B地。
这个梦想很美好,但怎么实现呢?最早的科学家是这样设想的,他们想:我直接把所有交通规则都写进车里不就行了?看到红灯就停,看到绿灯就走,看到黄灯就……犹豫一下?结果发现路况太复杂了,根本写不完。这就是早期的"符号主义/逻辑主义"AI,靠着写规则来模拟智能。

二、机器学习:不给规则,让它自己学

后来科学家发现,规则太多了,与其写规则,不如让车自己看视频学。
想象一下,你让这辆车看一万个小时的行车记录仪,它自己就慢慢明白了:哦,前面那个两条腿走路的叫"人",得让着;前面看起来黑黑的是一个小水洼,可以过,但需要慢一点。
这种从数据里学规律的方法,就叫机器学习(ML)。

一句话总结:机器学习就是不告诉你规则,但让你看一万遍例子,你自己总结规则。

三、人工神经网络:给车装个假脑子

那机器学习具体怎么学呢?科学家想了个招:模仿人脑。
人脑有几百亿个神经元,互相连接,信号传来传去,我们就学会了思考。那能不能造一个简化版的"人工大脑"?这就是人工神经网络(ANN)。
可以理解为:给这辆车装了一个"假脑子"。虽然这个脑子最开始可能不太好使,看到狗喊猫,看到猫喊"四脚兽",但只要多训练,它会慢慢变聪明。

四、深度学习:把脑子做深一点

大家发现,这个"假脑子"如果只有一两层,学东西很慢,像个“不太灵光”的小学生。但如果把层数做得特别多,比如几百层,效果就突然爆炸了!
这就叫深度学习(DL)——其实就是层数很多的神经网络。
但是请注意:深度学习≠人工神经网络×10,而是人工神经网络的一种特殊情况。

五、CNN:看图专家

有了深度学习的框架,科学家开始针对不同任务设计不同领域的"专家"。
第一个专家是卷积神经网络(CNN)。这东西是干什么的?就是专门处理图像的。

具体CNN是怎么处理呢?
打个比方,假设你有一张照片,照片里有只猫。CNN的工作方式是这样的:

  • 先用放大镜扫一遍照片,找边缘、找纹理
  • 再把这些边缘组合起来,找到耳朵、眼睛
  • 最后综合判断:哦,这是猫!

这个过程特别像我们在实验室里用显微镜看样品:先低倍镜看整体,再高倍镜看细节。CNN做的就是类似的事,只不过它用的是数学卷积。

CNN的经典名言:“给我一张图,我还你一个分类。你问我中间发生了什么?……其实我也不太懂,但反正结果是准的。”

六、RNN:看连续剧的哲学家

CNN虽然会看图,但不会看连续的视频。比如你想让它理解一句话:“我昨天吃了一顿饭,今天肚子疼。“如果你只看最后一个字"疼”,你根本不知道为啥疼。但如果你记住了前面"昨天吃了饭”,就能推测可能是吃坏肚子了。
这就是循环神经网络(RNN)的专长——它有一个记忆。
RNN的工作方式特别像一个写日记的人:每看一个新词,都会结合前面记住的内容,再更新自己的记忆。这样处理句子、时间序列、股票预测这类任务就很擅长。
但RNN有个致命缺点:能记住,但记不多。如果你跟它说一篇五千字的长文,它可能看到后面就忘了开头。这个问题在学术界叫"梯度消失"。
后来科学家发明了它的升级版LSTM(长短期记忆网络),相当于给RNN装了个"记事本"和"备忘录",可以记住更长的东西。

七、GAN:真假美猴王之战

接下来这个模型特别有意思,叫生成对抗网络(GAN)。
你可以把它想象成一个"画家"和一个"鉴定师"在打架。

GAN的工作方式:
画家(生成器)的任务是画假画,目标是让鉴定师看不出来
鉴定师(判别器)的任务是分辨真假,目标是揪出画家的破绽
两人一开始都很菜:画家画的画像幼儿园涂鸦,鉴定师一眼就能看出假,并告诉画家为什么觉得假。但随着一次次PK,画家的画功越来越好,鉴定师的眼光也越来越毒。到最后,画家画的画连鉴定师都分不清真假了——这时候,GAN就训练成功了。

八、Transformer:新的革命

最后就是当前AI界的顶流——Transformer。
这东西是什么?你可以把它理解为RNN的超级升级版。
RNN是"一句话挨着看":先看第一个词,再看第二个,再看第三个……虽然能记住前面的,但速度很慢,像我们实验室排队做测试一样。
Transformer是"一眼扫过全看":它把所有词同时输入,然后用一种叫"自注意力"的机制,瞬间找出每个词之间的关系。这就像你去食堂打饭,还没进门发现人已经排到门口了,RNN是选择老老实实排队,Transformer是直接进去把所有窗口扫一遍看哪个窗口人少。
结果就是:Transformer又快又准。它能处理更长的文本,训练速度更快,效果更好。ChatGPT、文心一言这些大模型,核心都是Transformer。

九、它们到底是什么关系?

它们的包含关系是:

  • 人工智能(AI)包含机器学习(ML)
  • 机器学习(ML)包含人工神经网络(ANN)
  • 人工神经网络(ANN)包含深度学习(DL)
  • 深度学习(DL)包含CNN, RNN, GAN, Transformer。

十、总结

好了,说了这么多,我们来画个重点。
记住以下类比:
AI是梦想的车,ML是学开车
ANN装个假脑子,DL把脑子做深点
CNN是看图专家,RNN是看剧高手
GAN是双人对战,Transformer是蜕变的革命军

http://www.jsqmd.com/news/459351/

相关文章:

  • 智能AI裂缝识别 裂缝图像分割识别 建筑物裂缝识别 建筑结构裂缝自动检测模型训练 道路桥梁病害识别算法10529期
  • Unreal Engine 4核心概念解析:Character——专为人形角色设计的终极“游戏化身”
  • 毕业设计:基于SpringBoot Ai和Vue的旅游攻略小程序(源码)
  • OpenClaw霸榜,Agent正悄无声息地干掉传统“App”!
  • Mac病毒清除过程, SimulatorTrampoline,提醒事项APP伪装 XcodeGhost,XCSSET类型
  • 刷题笔记:力扣第18题-四数之和
  • 华为 MetaERP 的内部交易协同,是基于元数据驱动的多组织模型 + 事件驱动的服务总线 + 分布式事务 + 智能对账引擎,实现内部交易从发起、协同、确认到对账、抵消的全链路自动化、数据同源、零差异
  • STM32CubeMX配置串口采集超声波传感器数据(四)
  • Android BLE 稳定连接管理器(Kotlin版)完整代码骨架(下篇)
  • 动态规划之背包问题详解(从入门到实战)
  • Kubernetes中的网络策略(Network Policies)
  • 华为 MetaERP 已成为核电行业国产替代的核心方案,以全栈自主可控为基础,通过联合共建模式深度适配核电高安全、强管控、长周期的行业特性,已在中核、中广核等龙头企业落地标杆项目
  • SAP(以 S/4HANA 为代表)通过多组织建模、多分类账(多账套)、多币种引擎、多会计准则并行四大核心机制,在统一数据模型(ACDOCA)上实现集团化、全球化、多准则的财务核算架构
  • 3.5 数据管线、损失函数与分布式训练如何配合
  • Python 源文件默认编码是 **UTF-8**(推荐使用),如果文件包含非 ASCII 字符(如中文),无需额外声明;若需使用其他编码(如 GBK),需在文件第一行/第二行声明
  • SAP 利润中心Profit是如何实现跨法人、穿透式管理的?
  • 基于堆叠自动编码器(SAE)的人脸图像识别:Matlab 实现
  • 第10章 移动平台着色器优化实战:从简化到高级技巧
  • schoober-ai-sdk:核心ReAct 引擎的实现
  • SAP 利润中心 + 分部报告 + 集团合并 + 多准则 是怎么联动成一套集团财务架构的
  • 基于 CAN 总线的 DSP280049C 升级方案全解析
  • OpenClaw Mac本地部署保姆级教程:手把手教你“养龙虾”
  • 不是烤串故事【牛客tracker 每日一题】
  • 探索三相并网逆变器LCL逆变之控制策略与仿真实践
  • AI-Native的定义与特征
  • 华为 MetaERP 的多组织、多帐套、多币种、多会计准则核算架构,核心是元数据驱动 + 云原生微服务 + 实时核算引擎 + 分布式数据底座,实现 “交易即核算、单账套多准则、全球实时合并”
  • MATLAB Simulink 中的 BCH 编码译码:穿越 AWGN 与 BSC 信道之旅
  • 手把手教你用ZYNQ打造一款便携式多通道频谱分析仪
  • 威纶通MT8071iE触摸屏宏指令程序:清晰注释下的开机页面与产量统计功能
  • OpenClaw 本地部署教程(Windows)| GitHub 爆火 AI Agent 框架安装指南