当前位置：首页 > news >正文

AI 术语入门指南

news 2026/4/16 1:33:41

AI 术语入门指南

文章目录

AI 术语入门指南
- 一、先搞懂这些概念
- - 1.1 LLM —— 大语言模型
  - 1.2 Token —— 文字的"计量单位"
  - 1.3 Context —— 对话的记忆
  - 1.4 Temperature —— 回答的"创造力"
  - 1.5 Hallucination —— 幻觉
- 二、Agent 智能体
- - 2.1 什么是 Agent？
  - 2.2 RAG —— 检索增强生成
- 三、Embedding —— 把文字变成坐标
- 四、Fine-tuning —— 给AI做"特训"
- 五、常见AI架构图解
- - 5.1 聊天机器人架构
  - 5.2 RAG 系统架构
- 六、名词速查表
- 七、学习路径
- 八、Claude Code 是什么？

从零认识大模型，说人话，不废话 —— Claude Code 学习方法论·第一篇

一、先搞懂这些概念

1.1 LLM —— 大语言模型

LLM = Large Language Model

把它想象成一个"读完了整个图书馆的人"，它不会真的"思考"，而是根据见过的内容，猜下一个最可能出现的字。

你输入："今天天气真" 它猜："好"（最可能） 或 "糟糕"（也可能） 哪个更合理？它根据学习过的内容判断

常见LLM一览：

模型	爸爸公司	一句话特点
GPT-4	OpenAI	公认最强，收费
Claude 3	Anthropic	长文本、代码强
Gemini	Google	谷歌出品
通义千问	阿里	中文友好
文心一言	百度	中文友好

1.2 Token —— 文字的"计量单位"

大模型不看字，看 Token。Token 是它处理信息的最小单元。

1个中文汉字 ≈ 1-2个 Token 1个英文单词 ≈ 1.5个 Token 1段话 ≈ 3-10个 Token

为什么重要？

API 按 Token 收费
输入+输出都算 Token
上下文窗口有上限（GPT-4 ≈ 128K tokens）

1.3 Context —— 对话的记忆

就像人的短期记忆，大模型在一次对话中能记住的内容有限。

你：第一天上班好累 它：加油！ 你：昨天也是 它：连续上班确实辛苦 （它记住了"上班"这件事）

1.4 Temperature —— 回答的"创造力"

低温度（0-0.3）：保守、精确 → "1+1=2" 高温度（0.7-1.0）：创意、随机 → "1+1=2=王=爱"

写代码、问事实 → 低温
写小说、头脑风暴 → 高温

1.5 Hallucination —— 幻觉

大模型一本正经地"胡说八道"。它追求的是"听起来对"，不是"真的对"。

为什么会这样？

训练数据有错
没找到答案时瞎编
它觉得这样说"合理"

如何避免？

要求提供来源
用 RAG 检索验证
重要信息交叉确认

二、Agent 智能体

2.1 什么是 Agent？

如果 LLM 是"大脑"，Agent = 大脑 + 手脚 + 记忆

┌─────────────────────────────────────┐ │ Agent 三件套 │ ├─────────────────────────────────────┤ │ 🧠 规划 (Planning) │ │ 把大任务拆成小步骤 │ ├─────────────────────────────────────┤ │ 🔧 工具 (Tools) │ │ 能调用搜索、计算、代码等 │ ├─────────────────────────────────────┤ │ 📝 记忆 (Memory) │ │ 记住之前做过什么 │ └─────────────────────────────────────┘

打个比方：

LLM = 只会出主意的军师
Agent = 军师 + 能自己出去打仗的将军

2.2 RAG —— 检索增强生成

先查资料，再回答—— 解决大模型"知识过时"的问题

传统：靠脑子里记的（可能过时） RAG： 先查资料库，再回答（更准确）

三、Embedding —— 把文字变成坐标

让电脑理解"哪些词意思相近"

苹果 → (0.8, 0.2, 0.1...) 香蕉 → (0.7, 0.3, 0.2...) 电脑 → (0.1, 0.9, 0.5...) 苹果和香蕉"距离近" → 意思相近 苹果和电脑"距离远" → 意思不同

应用场景：

相似文章推荐
智能客服理解问题
内容自动分类

四、Fine-tuning —— 给AI做"特训"

通用大模型（什么都会一点）→ 特训 → 专业模型（垂直领域专家）

Fine-tuning	Prompt Engineering
成本	高（要重新训练）	低（改文字即可）
效果	永久改变行为	每次对话要重复
适用	大量相似场景	灵活多变的场景

五、常见AI架构图解

5.1 聊天机器人架构

┌──────────┐ │ 用户提问 │ └────┬─────┘ ↓ ┌──────────┐ │ 对话管理 │ ← 记住上下文 └────┬─────┘ ↓ ┌──────────┐ │ Prompt │ ← 组装指令 └────┬─────┘ ↓ ┌──────────┐ │ LLM │ ← 生成回答 └────┬─────┘ ↓ ┌──────────┐ │ 返回答案 │ └──────────┘

5.2 RAG 系统架构

┌──────────┐ │ 用户问题 │ └────┬─────┘ ↓ ┌──────────┐ │ Embedding│ ← 变成向量 └────┬─────┘ ↓ ┌──────────┐ │ 向量数据库│ ← 检索相关文档 └────┬─────┘ ↓ ┌──────────┐ │ 组装Prompt│ ← 问题+文档 └────┬─────┘ ↓ ┌──────────┐ │ LLM │ ← 生成答案 └────┬─────┘ ↓ ┌──────────┐ │ 返回答案 │ └──────────┘

六、名词速查表

缩写	全称	人话
LLM	Large Language Model	大语言模型
AI	Artificial Intelligence	人工智能
AGI	Artificial General Intelligence	像人一样聪明的AI
NLP	Natural Language Processing	自然语言处理
GPT	Generative Pre-trained Transformer	生成式预训练模型
API	Application Programming Interface	程序接口
Token	-	文字计量单位
Prompt	-	给AI的指令
Agent	-	能自主行动的AI
RAG	Retrieval-Augmented Generation	先查后答
Embedding	-	文字变坐标
Fine-tuning	-	给AI特训
Temperature	-	创造力开关
Hallucination	-	AI胡说八道

七、学习路径

第一阶段：会用 ↓ 会写 Prompt，会调温度 第二阶段：会做 ↓ 搞懂 Agent、RAG 能做什么 第三阶段：理解原理 ↓ 搞懂大模型怎么工作 第四阶段：深度应用 ↓ Fine-tuning、架构设计

八、Claude Code 是什么？

重点来了！Claude Code 就是 Agent 的一种实现

┌─────────────────────────────────────────────────┐ │ Claude Code │ ├─────────────────────────────────────────────────┤ │ 🧠 LLM 大脑（Claude） │ │ 理解你的需求，生成代码 │ ├─────────────────────────────────────────────────┤ │ 🔧 工具集（Tools） │ │ 读写文件、执行命令、搜索代码 │ ├─────────────────────────────────────────────────┤ │ 📝 记忆（Memory） │ │ 记住项目上下文、之前的操作 │ ├─────────────────────────────────────────────────┤ │ 🎯 规划（Planning） │ │ 自动拆解任务步骤 │ └─────────────────────────────────────────────────┘

简单说：Claude Code = Claude（会思考）+ 工具（会执行）