当前位置：首页 > news >正文

AI相关术语及开发技术路线详解

news 2026/6/30 4:07:02

大模型（LLM）通过海量数据训练，能理解和生成自然语言，但存在“幻觉”问题。文章介绍了LLM的核心能力与局限，并深入解析了Embedding、RAG、MCP、Function Calling、AI Agent等关键技术，同时探讨了自监督学习、强化学习、微调、Prompt Engineering、量化、上下文窗口等训练与优化方法。这些技术共同推动了AI应用的发展，为企业知识库、AI客服等领域提供了强大支持。

大模型

大模型是用海量文本数据训练出来的深度神经网络，参数量通常在百亿到千亿级别。参数可以理解为模型在训练过程中学到的"知识"的存储单元，数量越多，模型能记住和处理的模式越复杂。

LLM 的核心能力是理解和生成自然语言。它不是在检索答案，而是在根据上下文预测"接下来最合理的内容是什么"。这个机制决定了它的优势——灵活、泛化能力强，也决定了它的局限——可能一本正经地生成错误内容（幻觉）。

现在主流的 LLM 分两类：闭源 API（GPT-4o、Claude、Gemini）和开源模型（Llama、Qwen、Mistral）。前者开箱即用，后者可以本地部署、私有化。

Embedding（向量嵌入）

Embedding 是把文本转换成数字向量的技术。一段文字经过 Embedding 模型处理后，变成一个高维空间里的坐标点，语义相近的内容在这个空间里距离也更近。

这个技术是语义搜索和 RAG 的底层基础。传统关键词搜索只能匹配字面，Embedding 能理解"苹果手机"和"iPhone"说的是同一件事。

不同的 Embedding 模型输出的向量维度不同，精度和速度也有差异。OpenAI 的 text-embedding-3-small 是常用选择，开源的 BGE 系列在中文上表现更好。

RAG（检索增强生成）

LLM 的训练数据有截止日期，也不知道你的私有文档里写了什么。RAG 解决的就是这个问题。

流程是：用户提问 → 把问题转成向量 → 在向量数据库里找相关文档 → 把检索结果拼进 prompt → LLM 基于这些内容生成回答。这样 LLM 的回答有了实际的信息来源，不再完全依赖训练时学到的知识，也能处理实时数据和私有数据。现在大多数企业知识库、AI 客服底层都是这套架构。

RAG 的效果很大程度上取决于检索质量，而不只是生成模型的能力。检索到的内容不相关，LLM 再强也没用。

MCP（Model Context Protocol）

MCP 是 Anthropic 2024 年底推出的开放协议，定义的是 AI 应用和外部工具之间的通信标准。

在 MCP 之前，每个 AI 应用想接入工具（数据库、文件系统、第三方 API）都要自己实现一套对接逻辑，格式不统一，工具也没法复用。MCP 把这套接口标准化了,工具提供方实现 MCP Server，AI 应用实现 MCP Client，两边按协议通信。

对普通用户来说，最直观的体验是 Claude Desktop 或 Cursor 接入 MCP Server 之后，AI 可以直接读写本地文件、查询数据库、操作 GitHub，不需要手动复制粘贴。社区已经有大量现成的 MCP Server 可以直接用。

Function Calling / Tool Use

让 LLM 在对话过程中调用外部函数的机制。你定义好函数的名称、参数和描述，LLM 判断什么时候需要调用，输出结构化的调用请求，你的代码执行后把结果返回给 LLM，它再基于结果继续回答。

有个常见误区：LLM 并不直接执行函数，只是输出"我需要调用什么、参数是什么"。执行权始终在调用方代码里，LLM 看不到也碰不到真实系统。

Function Calling 是 LLM API 层面的能力，MCP 是工具集成的协议标准，两者不是同一层的东西。MCP Server 对外暴露的工具，最终也是通过 Function Calling 机制被 LLM 调用的。

AI Agent

Agent 是能自主规划、调用工具、多步执行任务的系统，不是单次问答。

最基础的运行模式是 ReAct：思考当前状态 → 决定下一步行动 → 执行工具调用 → 观察结果 → 再思考，循环直到任务完成。LLM 在每一步充当"大脑"，决定做什么，工具负责实际执行。

Agent 的核心组件是四个：Planning（任务拆解）、Memory（上下文和历史记忆）、Tools（搜索、代码执行、数据库查询等）、Action（执行并反馈）。

Agent 的能力上限取决于工具集和底层模型的推理能力。能力越强、权限越大，安全风险也越高——攻击者可以在工具返回的内容里嵌入恶意指令，让 Agent 执行非预期操作，这类攻击叫 prompt injection。

自监督学习（Self-supervised Learning）

一种不依赖人工标注数据的训练方式。模型从数据本身构造训练目标，不需要人告诉它"这个是对的，那个是错的"。

LLM 的预训练就是自监督学习的典型应用——给模型一段文字，遮住后面的词，让它预测被遮住的部分，预测对了就是正反馈。整个互联网的文本都可以用来训练，不需要任何人工标签，这是 LLM 能做到如此大规模训练的根本原因。

理解这个机制有助于理解 LLM 的本质：它学到的是"在什么上下文后面应该接什么内容"，而不是真正"理解"了语言的含义。

强化学习（Reinforcement Learning，RL）与 RLHF

强化学习让模型通过与环境交互、获得奖励信号来优化行为策略。模型每次行动后得到正向或负向反馈，逐渐学会怎么做能拿到更高的奖励。

在 LLM 领域，RL 主要用于对齐阶段，最常见的形式是 RLHF（基于人类反馈的强化学习）。流程是：让人类标注员对模型的多个输出排序 → 训练一个奖励模型学习人类偏好 → 用 RL 算法让 LLM 朝奖励更高的方向优化。ChatGPT 和 Claude 都用了这套方法，它解决的是预训练模型输出流畅但可能有害、不诚实的问题。

更新的方向是 DPO（Direct Preference Optimization），绕过奖励模型直接优化，流程更简单，很多开源模型在用。

微调（Fine-tuning）

在预训练模型的基础上，用特定领域的数据继续训练，让模型在这个领域表现更好。

预训练模型见过大量通用文本，但对医疗、法律、安全这类垂直领域的理解深度有限，输出格式也不一定符合业务需求。微调可以注入领域知识，也可以固定输出格式和风格。

全量微调成本高，需要大量 GPU。现在更常用的是 LoRA——只训练模型中少量新增的低秩矩阵，参数量大幅减少，消费级显卡也能跑，效果接近全量微调。

实际开发中，大多数场景先用 RAG 解决，效果不够再考虑微调。微调的数据质量比数量重要。

Prompt Engineering

不改模型参数，通过优化输入来提升输出质量。听起来像技巧，但背后有实际的原理支撑。

几个有效的方向：Few-shot 是在 prompt 里给几个示例，让模型照着格式输出；Chain of Thought 是让模型先把推理过程写出来再给结论，复杂问题准确率明显提升；结构化输出是要求模型返回 JSON，减少解析成本。

System prompt 和 User prompt 要分开用——System prompt 放角色设定和约束，User prompt 放具体问题，混在一起会降低遵循度。

Prompt Engineering 的天花板是模型本身的能力，模型不具备的推理能力，再好的 prompt 也补不上。

量化（Quantization）

把模型参数的数值精度从高压缩到低，比如从 32 位浮点数压缩到 8 位或 4 位整数。

压缩之后显存占用大幅降低，推理速度也会提升，代价是精度略有损失。一个原本需要 80GB 显存才能跑的模型，量化到 4-bit 之后可能 16GB 就够了。

对想在本地跑模型的人来说，量化是绕不开的概念。GGUF 格式加上 llama.cpp 是目前本地部署开源模型的主流方案，Ollama 把这套流程进一步封装，几行命令就能跑起来。

上下文窗口（Context Window）

模型单次能处理的最大文本长度，单位是 token。超出这个限制，多出来的内容会被截断或导致报错。

Token 不等于字符，英文大约 1 token 对应 0.75 个单词，中文一个汉字大约 1-2 个 token。

早期模型的上下文窗口只有 4K token，现在主流模型普遍在 128K 以上，Claude 支持到 200K，Gemini 1.5 Pro 支持 1M。窗口变大让长文档处理、长对话成为可能，但也要注意：窗口越长，推理成本越高，而且模型对窗口中间位置内容的注意力会有所下降。

最后

我在一线科技企业深耕十二载，见证过太多因技术更迭而跃迁的案例。那些率先拥抱 AI 的同事，早已在效率与薪资上形成代际优势，我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。

我整理出这套 AI 大模型突围资料包：

✅AI大模型学习路线图
✅Agent行业报告
✅100集大模型视频教程
✅大模型书籍PDF
✅DeepSeek教程
✅AI产品经理入门资料

完整的大模型学习和面试资料已经上传带到CSDN的官方了，有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇

为什么说现在普通人就业/升职加薪的首选是AI大模型？

人工智能技术的爆发式增长，正以不可逆转之势重塑就业市场版图。从DeepSeek等国产大模型引发的科技圈热议，到全国两会关于AI产业发展的政策聚焦，再到招聘会上排起的长队，AI的热度已从技术领域渗透到就业市场的每一个角落。

智联招聘的最新数据给出了最直观的印证：2025年2月，AI领域求职人数同比增幅突破200%，远超其他行业平均水平；整个人工智能行业的求职增速达到33.4%，位居各行业榜首，其中人工智能工程师岗位的求职热度更是飙升69.6%。

AI产业的快速扩张，也让人才供需矛盾愈发突出。麦肯锡报告明确预测，到2030年中国AI专业人才需求将达600万人，人才缺口可能高达400万人，这一缺口不仅存在于核心技术领域，更蔓延至产业应用的各个环节。

资料包有什么？

①从入门到精通的全套视频教程⑤⑥

包含提示词工程、RAG、Agent等技术点

② AI大模型学习路线图（还有视频解说）

全过程AI大模型学习路线

③学习电子书籍和技术文档

市面上的大模型书籍确实太多了，这些是我精选出来的

④各大厂大模型面试题目详解

⑤ 这些资料真的有用吗?

这份资料由我和鲁为民博士共同整理，鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位，在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利，同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。

所有的视频教程由智泊AI老师录制，且资料与智泊AI共享，相互补充。这份学习大礼包应该算是现在最全面的大模型学习资料了。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目，无论你是小白还是有些技术基础的，这份资料都绝对能帮助你提升薪资待遇，转行大模型岗位。

智泊AI始终秉持着“让每个人平等享受到优质教育资源”的育人理念‌，通过动态追踪大模型开发、数据标注伦理等前沿技术趋势‌，构建起"前沿课程+智能实训+精准就业"的高效培养体系。

课堂上不光教理论，还带着学员做了十多个真实项目。学员要亲自上手搞数据清洗、模型调优这些硬核操作，把课本知识变成真本事‌！

如果说你是以下人群中的其中一类，都可以来智泊AI学习人工智能，找到高薪工作，一次小小的“投资”换来的是终身受益！

应届毕业生‌：无工作经验但想要系统学习AI大模型技术，期待通过实战项目掌握核心技术。

零基础转型‌：非技术背景但关注AI应用场景，计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能 ‌突破瓶颈：传统开发者（Java/前端等）学习Transformer架构与LangChain框架，向AI全栈工程师转型‌。