AI70年就绕不开150个概念?其实核心就这几类
AI70年就绕不开150个概念?其实核心就这几类
你有没有这种感觉:AI行业每几个月就冒出一堆新名词——Transformer、Diffusion、RAG、Agent、MCP、CoT、RLHF……每次看到新词都觉得自己"又落后了"。
这种焦虑很真实,但也大可不必。
AI虽然看起来概念爆炸,但底层只需要一张"认知坐标图"就能看懂。这个坐标图把AI的所有概念分成几大类,每一类你只需要理解"它要解决什么问题"和"它怎么解决",就够了。
一、一个简单的分类框架
AI从1956年达特茅斯会议发展到今天,70年的演进可以归纳为四个阶段:
符号主义 → 机器学习 → 深度学习 → 大模型重要的是:这些不是替代关系,是递进关系。每一波浪潮都解决了前一波的某些问题,但也带来了新的挑战。
| 阶段 | 时间范围 | 核心方法 | 解决了什么 | 局限是什么 |
|---|---|---|---|---|
| 符号主义 | 1956-1980s | 人手写规则 | 形式化推理 | 规则写不完,遇到例外就崩 |
| 机器学习 | 1980s-2010s | 从数据中找规律 | 自动发现模式 | 需要人工设计"特征" |
| 深度学习 | 2010s-2020s | 神经网络自动特征提取 | 不需要手工特征 | 需要大量数据和算力 |
| 大模型 | 2020s-现在 | Transformer+海量数据 | 零样本、少样本泛化 | 幻觉、可控性差、成本高 |
一个重要的洞察:被淘汰的不是"AI"这个目标,而是"上一种实现AI的方法"。
二、AI核心概念分类
把150多个概念按类别拆分,其实就六大类:
| 类别 | 包含哪些概念 | 核心问题 |
|---|---|---|
| 模型架构 | RNN、CNN、Transformer、Mamba | 模型怎么设计? |
| 训练方法 | 监督学习、自监督、RLHF、强化学习 | 模型怎么学? |
| 数据技术 | RAG、向量数据库、上下文压缩、知识图谱 | 模型怎么获取信息? |
| 推理策略 | CoT(思维链)、ToT(思维树)、MoC | 模型怎么思考? |
| 评估对齐 | Benchmark、红队测试、价值观对齐 | 模型做得对不对? |
| 应用框架 | Agent、MCP、Function Calling、Workflow | 模型怎么用? |
理解每个类别的"核心问题",比记忆所有概念名称重要100倍。
2.1 模型架构类——模型怎么搭?
| 架构 | 出现时间 | 核心想法 | 主要局限 |
|---|---|---|---|
| RNN | 1990s | 按顺序处理序列,有记忆 | 长序列时前面的会"遗忘" |
| CNN | 2000s | 用滑动窗口提取局部特征 | 不适合序列任务 |
| Transformer | 2017 | 自注意力机制:同时看所有位置 | 计算量随序列长度平方增长 |
| Mamba | 2024 | 状态空间模型,线性复杂度 | 生态不够成熟 |
Transformer为什么是里程碑?
Transformer之前,主流的架构(RNN/LSTM)是从左到右逐字处理文本。这个顺序依赖带来了两个致命问题:
- 不能并行——处理第100个字之前必须处理完前99个
- 长距离遗忘
