当前位置：首页 > news >正文

程序员转大模型，从入门到精通，完整学习路线图直接抄

news 2026/7/5 17:45:23

文章目录

- 前言
- 一、先搞懂：转大模型，你到底要转什么岗？
- - 1.1 大模型岗位金字塔，别站错队
  - 1.2 不同背景程序员，最优转岗方向
- 二、零基础入门阶段（1-2个月）：别被高数劝退，先跑通第一个模型
- - 2.1 你需要的前置知识，真的没那么多
  - 2.2 Python：只学这5个模块就够了
  - 2.3 机器学习核心：3个概念搞定入门
  - 2.4 神经网络：不用懂数学，懂这个类比就行
- 三、核心技能阶段（2-3个月）：掌握这4招，就能找到第一份大模型工作
- - 3.1 大模型基础：Transformer不用啃推导，懂结构就够
  - 3.2 框架选型：2026年最值得学的3个框架，优先这个
  - 3.3 提示词工程：不是写句子，是给大模型下指令
  - 3.4 RAG系统：企业用得最多的技术，必须吃透
- 四、进阶提升阶段（3-4个月）：拉开差距的关键，从“会用”到“用好”
- - 4.1 LoRA微调：一张显卡就能搞定的低成本微调
  - 4.2 AI工程化：让模型从“能跑”到“能扛住10万并发”
  - 4.3 多智能体开发：2026年最大的技术红利
- 五、求职准备阶段（1个月）：学完这些，直接投简历
- - 5.1 简历怎么写：把CRUD经验转化为AI经验
  - 5.2 2026年大模型面试高频题，背完这些足够
  - 5.3 项目准备：这2个项目，HR看了直接约面试
- 六、转大模型最容易踩的5个坑，别再走弯路了

P.S. 目前国内还是很缺AI人才的，希望更多人能真正加入到AI行业，共同促进行业进步，增强我国的AI竞争力。想要系统学习AI知识的朋友可以看看我精心打磨的教程 http://blog.csdn.net/jiangjunshow，教程通俗易懂，高中生都能看懂，还有各种段子风趣幽默，从深度学习基础原理到各领域实战应用都有讲解，我22年的AI积累全在里面了。注意，教程仅限真正想入门AI的朋友，否则看看零散的博文就够了。

前言

兄弟们，先问个扎心的问题：你最近投简历的时候，是不是发现一个特别离谱的现象？哪怕是面个最基础的Java后端CRUD岗，HR看完简历第一句话不是问你SpringBoot用得熟不熟，而是“有没有大模型相关的项目经验？”

上周我参加长沙本地的程序员线下聚会，一个做了8年Java后端的兄弟拍着桌子吐槽，说自己面了20多家公司，一半以上薪资直接砍半，剩下的HR直接灵魂拷问：“你只会写CRUD，凭什么要25K？我们现在用GPT-5.4写CRUD，一天能生成100个接口，还没bug。”

这话听着扎心，但2026年的程序员圈，这就是赤裸裸的现实。智联招聘最新的数据摆在这：2026年国内大模型相关岗位缺口已经飙到47万，初级工程师平均月薪28K，比同经验传统开发高出30%以上。一边是传统开发岗卷到30岁就面临失业，一边是大模型岗招不到人，薪资水涨船高。

很多兄弟都跟我说，想转大模型，但不知道从何下手。有人觉得自己数学不好，高数都忘光了，肯定学不会；有人买了一堆课，从吴恩达的机器学习开始啃，啃到梯度下降就放弃了；还有人跟着网上的教程调了几个API，就觉得自己会大模型了，结果投简历连面试机会都没有。

我搞AI22年了，见过太多人转大模型走了弯路。其实转大模型根本没你想的那么难，大部分人根本不需要去搞什么算法研发，不用懂什么复杂的数学推导。只要你有基本的编程基础，跟着我给的这个路线图一步步走，6个月就能从零基础转成合格的大模型开发工程师，找到一份薪资不错的工作。

这篇文章我把整个学习路线拆成了5个阶段，每个阶段该学什么、该做什么项目、该避什么坑，都给你写得明明白白。你不用自己去整理资料，不用自己去规划路线，直接照着抄就行。

一、先搞懂：转大模型，你到底要转什么岗？

很多人转大模型之前，连大模型有哪些岗位都搞不清楚，上来就去啃Transformer的数学推导，去学什么反向传播，结果学了半年，发现自己根本做不了算法岗，白白浪费了时间。

1.1 大模型岗位金字塔，别站错队

大模型行业的岗位就像一个金字塔，从上到下分为四层，不同层级的门槛和薪资天差地别：

塔尖：大模型算法研究员：负责大模型的预训练、架构设计、核心算法优化。门槛极高，基本要求是985/211计算机相关专业硕士以上学历，要有扎实的数学和机器学习基础，还要有顶会论文或者大厂核心项目经验。年薪基本在80万以上，但全国也就几千个岗位，普通人根本不用想。
第二层：大模型微调工程师：负责在开源大模型的基础上，针对垂直领域进行微调，优化模型效果。门槛比算法研究员低一些，本科以上学历就行，需要懂大模型的基本原理和微调方法。年薪大概在40-80万，岗位数量也不多。
第三层：AI工程化工程师：负责大模型的部署、性能优化、并发处理、运维监控。门槛中等，只要有后端开发基础，学一下大模型部署相关的技术就能转。年薪大概在30-60万，岗位数量比较多。
塔基：大模型应用开发工程师：负责基于大模型开发各种应用，比如智能客服、知识库助手、AI写作工具、多智能体系统等。门槛最低，只要会Python，懂基本的大模型API调用和框架使用就能转。年薪大概在25-50万，岗位数量最多，占了大模型岗位的80%以上。

我可以负责任地说，99%的普通程序员转大模型，都应该优先考虑大模型应用开发工程师这个岗位。这个岗位不需要你懂复杂的数学，不需要你有高学历，只要你能干活，能做出能用的产品，企业就愿意要。

打个比方，大模型就像现在的智能手机。算法研究员是造手机芯片的，微调工程师是给手机装系统的，AI工程化工程师是建手机基站的，而应用开发工程师是做手机APP的。你不用会造芯片，不用会装系统，只要会做APP，就能赚到钱。现在微信、抖音、淘宝这些最赚钱的应用，不都是APP吗？

1.2 不同背景程序员，最优转岗方向

不同技术背景的程序员，转大模型的最优方向也不一样，别盲目跟风：

Java/C#后端开发：优先转AI工程化工程师，其次是大模型应用开发工程师。你们有丰富的后端开发经验，懂分布式、高并发、数据库这些，转AI工程化非常有优势。2026年微软的Semantic Kernel 3.0已经非常成熟了，C#开发者可以无缝对接，不用重新学Python。
前端开发：优先转大模型应用开发工程师，专注于AI前端交互。现在很多AI应用都需要复杂的前端界面，比如AI绘图、AI视频编辑、智能对话系统等，懂前端的大模型开发工程师非常抢手。
测试/运维：优先转AI工程化工程师，专注于大模型测试和运维。你们有丰富的测试和运维经验，懂自动化测试、监控告警、容器化这些，转大模型测试和运维非常合适。
Python开发：可以转任何方向，优先转大模型应用开发工程师，其次是微调工程师和AI工程化工程师。Python是大模型的主流语言，你们有天然的优势。

二、零基础入门阶段（1-2个月）：别被高数劝退，先跑通第一个模型

很多人一听说要学AI，第一反应就是“我数学不好，学不会”。其实我可以明确告诉你，对于大模型应用开发工程师来说，你根本不需要懂什么高数、线性代数、概率论。只要你上过高中，会基本的加减乘除，就足够了。

我写的AI教程，高中生都能看懂，就是因为我从来不会上来就给你讲一堆复杂的数学公式。我会用最通俗的类比，让你先理解技术的本质，然后再去做项目，在做项目的过程中，遇到需要数学的地方，再去补对应的知识。

2.1 你需要的前置知识，真的没那么多

入门阶段，你只需要掌握以下3个方面的知识，其他的都可以先不用学：

基本的计算机常识：知道什么是CPU、GPU、内存、硬盘，知道什么是操作系统，会用命令行操作电脑。
Python基础语法：不用学太全，掌握核心语法就行。
机器学习和神经网络的基本概念：不用懂数学推导，懂是什么意思就行。

就这么多，是不是比你想象的少多了？很多人一开始就去啃西瓜书、啃统计学习方法，啃到一半就放弃了，完全没必要。那些书是给算法研究员看的，不是给应用开发工程师看的。

2.2 Python：只学这5个模块就够了

Python是大模型的主流语言，所以你必须先学会Python。但很多人学Python的时候，走了一个很大的弯路：把Python的所有东西都学了一遍，从爬虫到Web开发，从数据分析到自动化测试，结果学了一堆没用的，真正用到大模型开发的没几个。

其实对于大模型应用开发来说，你只需要掌握Python的以下5个模块就够了：

核心语法：变量、数据类型、条件语句、循环语句、函数、类、异常处理。
数据结构：列表、字典、元组、集合。
文件操作：读写文本文件、CSV文件、JSON文件。
requests库：用来调用大模型的API。
numpy库：用来处理基本的数值计算，不用学太深入，会用基本的数组操作就行。

就这5个模块，每天学2个小时，两个星期就能学完。学完之后，你就可以开始写第一个大模型程序了：调用OpenAI或者DeepSeek的API，写一个简单的聊天机器人。

当你看到自己写的程序能和你对话的时候，那种成就感是无与伦比的，这会给你继续学下去的动力。千万不要等把Python学精通了再去做大模型项目，边学边做才是最快的学习方式。

2.3 机器学习核心：3个概念搞定入门

机器学习的概念非常多，但入门阶段，你只需要搞懂3个最核心的概念就行：过拟合、欠拟合、梯度下降。

我用最通俗的话给你解释一下：

欠拟合：就像一个学生，上课根本没听讲，连课本上的例题都不会做，考试肯定考不好。对应到模型上，就是模型太简单了，连训练数据都学不好，准确率很低。
过拟合：就像一个学生，死记硬背把课本上的所有例题都背下来了，考试的时候只要是课本上的原题，他都能做对，但只要稍微变一下题型，他就不会了。对应到模型上，就是模型太复杂了，把训练数据里的噪声都学进去了，训练集准确率很高，但测试集准确率很低。
梯度下降：就像你在一个山坡上，想要走到山谷的最低点。你每次都朝着最陡的方向走一步，走一步看一下，再朝着最陡的方向走下一步，直到走到最低点。对应到模型上，就是不断调整模型的参数，让损失函数的值越来越小，直到达到最小值。

就这3个概念，搞懂了之后，机器学习的入门你就过了。其他的什么决策树、随机森林、支持向量机这些，入门阶段都可以先不用学，等以后用到了再补。

2.4 神经网络：不用懂数学，懂这个类比就行

神经网络是大模型的基础，很多人一看到神经网络的结构图就头大，一看到反向传播的数学公式就想放弃。其实根本没必要，对于应用开发工程师来说，你不用懂神经网络内部是怎么工作的，只要知道它是干什么的就行。

我在之前的教程里说过，神经网络就像一个小孩的大脑。你教小孩认猫，你不用给他讲猫的生物学结构，不用给他讲什么是猫的耳朵、什么是猫的尾巴。你只要给他看很多猫的图片，告诉他“这是猫”，他自己就会在脑子里学习猫的特征。

等他学完之后，你再给他看一张他从来没见过的猫的图片，他就能认出来这是猫。但你问他“你是怎么认出来这是猫的？”，他也说不清楚，他脑子里的分析过程是一个黑盒子。

神经网络也是一样的。我们给它输入很多训练数据，它自己就会在内部调整参数，学习数据的特征。训练完成之后，它就能对新的数据进行预测。但我们不知道它内部的分析过程，不知道它是怎么识别出猫的，也不知道它是怎么写出文章的。

这就是神经网络的神奇之处，也是它能实现真正人工智能的根本原因。

三、核心技能阶段（2-3个月）：掌握这4招，就能找到第一份大模型工作

入门阶段结束之后，你就进入了核心技能阶段。这个阶段是整个学习路线中最重要的阶段，只要你掌握了我下面说的这4个核心技能，你就已经具备了找到第一份大模型工作的能力。

3.1 大模型基础：Transformer不用啃推导，懂结构就够

现在所有的大模型，不管是GPT、文心一言还是DeepSeek，都是基于Transformer架构的。所以你必须要懂Transformer的基本结构。

但我还是那句话，不用啃数学推导，不用懂什么自注意力机制的公式，只要懂它的基本结构和工作原理就行。

Transformer的结构其实很简单，就分为两部分：编码器（Encoder）和解码器（Decoder）。

编码器：负责理解输入的内容。比如你输入“今天天气怎么样？”，编码器就会把这句话转换成一个向量，理解这句话的意思。
解码器：负责生成输出的内容。编码器把理解后的向量传给解码器，解码器就会根据这个向量，生成对应的回答“今天天气晴朗，温度25度，适合出门游玩。”

而自注意力机制，其实就是让模型在处理输入内容的时候，能够关注到重要的信息。比如你输入“我喜欢吃苹果，它很甜”，模型在处理“它”这个字的时候，就会自动关注到前面的“苹果”，知道“它”指的是苹果。

就这么简单，懂了这些，你就已经懂了Transformer的核心。至于那些复杂的数学公式，等你以后想往算法方向发展的时候再去学也不迟。

3.2 框架选型：2026年最值得学的3个框架，优先这个

现在大模型开发的框架有很多，比如LangChain、Semantic Kernel、LLamaSharp等等。很多人不知道该选哪个，今天我就给大家分析一下2026年这几个框架的现状：

LangChain v0.3：最老牌的大模型开发框架，生态最丰富，资料最多。但缺点是更新太快，兼容性不好，很多旧版本的代码在新版本上都跑不通，而且代码比较复杂，新手不容易上手。
LLamaSharp：基于.NET的大模型开发框架，专门为C#开发者设计。优点是性能好，支持本地部署大模型，和.NET生态无缝对接。缺点是生态不如LangChain丰富，资料相对少一些。
Semantic Kernel 3.0：微软推出的大模型开发框架，2026年更新到3.0版本之后，已经非常成熟了。优点是跨语言支持（Python、C#、Java），和微软的生态（Azure、Office 365）无缝对接，代码简洁，新手容易上手，而且性能比LangChain好很多。

我个人的建议是，2026年入门大模型开发，优先学Semantic Kernel 3.0。这个框架是微软亲儿子，未来的发展潜力巨大，而且非常适合新手。如果你是C#开发者，那Semantic Kernel就是你的不二之选；如果你是Python开发者，学Semantic Kernel也比学LangChain简单很多。

3.3 提示词工程：不是写句子，是给大模型下指令

很多人以为提示词工程就是写句子，只要把自己的需求说清楚就行。其实根本不是，提示词工程是一门技术，是大模型应用开发的核心。同样的需求，不同的提示词，得到的结果天差地别。

举个例子，如果你想让大模型写一个客服回复，你直接说“写一个客服回复”，大模型可能会给你写一个非常通用、非常生硬的回复。但如果你用CRISPE框架来写提示词，结果就会完全不一样：

C（Capacity）：指定大模型扮演的角色。比如“你是一个经验丰富的电商客服，有5年的客服经验，擅长处理客户的投诉和退换货问题。”
R（Role）：指定用户的角色。比如“用户是一个在我们店铺买了衣服的消费者，收到衣服之后发现衣服有质量问题，非常生气。”
I（Instruction）：明确告诉大模型要做什么。比如“请你给用户写一个回复，安抚用户的情绪，向用户道歉，并告诉用户我们的退换货流程。”
S（Style）：指定回复的风格。比如“回复要亲切、真诚、有耐心，不要使用官方话术，要像朋友一样和用户沟通。”
E（Example）：给大模型一个例子。比如“例如：‘亲，非常抱歉给您带来了不好的体验！您说的衣服质量问题我们已经了解了，您别生气，我们一定会给您一个满意的解决方案。您可以先申请退换货，我们会在24小时内审核通过，然后您把衣服寄回来，我们收到之后会立即给您退款或者换货，来回的运费都由我们承担。’”

用这个框架写出来的提示词，得到的结果会比你直接写“写一个客服回复”好10倍都不止。

提示词工程是大模型应用开发工程师最基础也是最重要的技能，一定要多练。你可以每天花半个小时，写不同场景的提示词，对比不同提示词的效果，慢慢就会找到感觉。

3.4 RAG系统：企业用得最多的技术，必须吃透

RAG（检索增强生成）是2026年企业用得最多的大模型技术，没有之一。几乎所有的企业在接入大模型的时候，第一个要做的就是RAG系统。

什么是RAG系统？我还是用通俗的类比给你解释一下：

大模型就像一个非常聪明的学生，他脑子里记住了互联网上所有的公开知识。但他有两个缺点：第一，他的知识是有截止日期的，比如GPT-4的知识截止到2025年10月，2025年10月之后发生的事情他都不知道；第二，他不知道企业的私有数据，比如你们公司的规章制度、产品手册、客户资料这些。

而RAG系统，就是给这个学生装了一个专属的图书馆。当你问他问题的时候，他不会直接从自己的脑子里找答案，而是先去这个专属图书馆里查相关的资料，然后再根据查到的资料回答你的问题。

这样一来，不仅解决了大模型知识截止的问题，还解决了大模型不知道企业私有数据的问题，而且还能有效减少大模型的幻觉（胡说八道）。

RAG系统的原理其实很简单，就分为三步：

文档处理：把企业的各种文档（PDF、Word、Excel、PPT等）转换成文本，然后切成一个个小块。
向量存储：把这些文本小块转换成向量，存储到向量数据库中。
检索生成：当用户提问的时候，先把用户的问题转换成向量，然后在向量数据库中检索出最相关的几个文本小块，把这些文本小块和用户的问题一起传给大模型，让大模型根据这些文本小块生成回答。

现在用Semantic Kernel 3.0搭一个RAG系统非常简单，只需要几十行代码就能搞定。你可以自己找一些文档，比如你公司的产品手册，搭一个个人知识库助手，这是一个非常好的实战项目。

四、进阶提升阶段（3-4个月）：拉开差距的关键，从“会用”到“用好”

掌握了核心技能之后，你已经能找到一份大模型工作了。但如果你想拿到更高的薪资，想在行业里有更好的发展，你就需要进入进阶提升阶段，从“会用”大模型变成“用好”大模型。

4.1 LoRA微调：一张显卡就能搞定的低成本微调

很多人以为大模型微调需要很多钱，需要很多高端的GPU，其实不是。2026年LoRA微调技术已经非常成熟了，你只需要一张消费级的显卡（比如RTX 4090），就能对开源大模型进行微调。

什么是LoRA微调？简单来说，就是在大模型的基础上，只训练一小部分参数，而不是训练整个模型。这样一来，微调的成本就大大降低了，而且微调的效果也非常好。

什么时候需要用微调呢？当RAG系统满足不了你的需求的时候，你就需要用微调。比如你想做一个垂直领域的大模型，比如医疗大模型、法律大模型，需要大模型掌握这个领域的专业知识和术语，这时候用RAG系统的效果就不如微调。

入门阶段，你可以用LLamaSharp或者Semantic Kernel，对DeepSeek R2或者Llama 3这些开源大模型进行LoRA微调，做一个简单的垂直领域助手，比如客服助手、编程助手。这个项目放到简历上，会非常有竞争力。

4.2 AI工程化：让模型从“能跑”到“能扛住10万并发”

很多大模型应用，在本地跑的时候好好的，一上线就崩了，并发稍微高一点就响应超时。这就是因为AI工程化做得不好。

AI工程化是大模型应用落地的关键，也是拉开普通开发者和优秀开发者差距的重要因素。AI工程化主要包括以下几个方面：

模型部署：把训练好的模型部署到服务器上，提供API接口。常用的部署工具有FastAPI、Triton Inference Server等。
性能优化：优化模型的推理速度，降低内存占用。常用的优化技术有量化、剪枝、蒸馏等。
并发处理：提高系统的并发能力，让系统能同时处理更多的请求。常用的技术有异步处理、负载均衡、缓存等。
监控告警：监控系统的运行状态，及时发现和解决问题。

对于有后端开发经验的兄弟来说，AI工程化是你们的优势。你们可以把之前后端开发的经验用到AI工程化上，比如用Redis做缓存，用Kafka做消息队列，用Kubernetes做容器编排等等。

4.3 多智能体开发：2026年最大的技术红利

2026年AI圈最火的词，毫无疑问是多智能体。智联招聘的数据显示，春节后前三周，AI智能体相关职位数同比增速直接飙到了455%，初级智能体开发工程师年薪40-60万，资深架构师年薪轻松破百万。

什么是多智能体？简单来说，就是让多个大模型智能体分工协作，共同完成一个复杂的任务。就像一个公司，有CEO、产品经理、开发工程师、测试工程师，大家分工协作，才能完成一个大的项目。

比如你想写一篇技术文章，你可以创建三个智能体：一个策划智能体，负责写文章的大纲；一个写作智能体，负责根据大纲写文章的内容；一个校对智能体，负责检查文章的错别字和语法错误。这三个智能体自动协作，就能写出一篇高质量的技术文章。

现在多智能体开发的框架也很多，比如微软的AutoGen、Semantic Kernel的多智能体功能等。用这些框架，你只需要几十行代码，就能搭一个简单的多智能体系统。

多智能体是未来大模型发展的方向，也是2026年最大的技术红利。如果你能提前掌握多智能体开发技术，你就能在未来的竞争中占据优势。

五、求职准备阶段（1个月）：学完这些，直接投简历

学完上面的内容之后，你就可以开始准备求职了。很多人学了一堆东西，但是不会写简历，不会面试，结果投了很多简历都没有回音。下面我就给大家讲一下求职准备的要点。

5.1 简历怎么写：把CRUD经验转化为AI经验

很多兄弟说，我之前都是做CRUD的，没有大模型相关的项目经验，简历怎么写？其实很简单，你可以把你之前的CRUD项目，转化为AI赋能的项目。

比如你之前做了一个用户管理系统，你可以改成：“基于Semantic Kernel和RAG技术，开发了智能用户管理系统，实现了用户画像自动生成、个性化内容推荐、智能客服等功能，提升了用户活跃度30%，降低了客服成本50%。”

再比如你之前做了一个电商后台管理系统，你可以改成：“基于大模型技术，对电商后台管理系统进行了AI赋能，实现了商品描述自动生成、订单智能处理、库存智能预警等功能，提升了运营效率40%。”

这样一来，你的简历就有了大模型相关的内容，HR看到之后就会给你面试机会。当然，你要真的懂这些技术，不然面试的时候被问住就尴尬了。

5.2 2026年大模型面试高频题，背完这些足够

2026年大模型应用开发工程师的面试，其实不会问你太多复杂的数学和算法问题，主要问的都是一些实际应用的问题。我整理了一下2026年面试最常问的10个问题，你把这些问题背下来，基本上面试就没问题了：

什么是RAG？RAG的工作原理是什么？
RAG和微调的区别是什么？什么时候用RAG，什么时候用微调？
什么是过拟合和欠拟合？怎么解决过拟合和欠拟合？
什么是提示词工程？你常用的提示词框架有哪些？
Semantic Kernel和LangChain的区别是什么？你为什么选择Semantic Kernel？
什么是向量数据库？常用的向量数据库有哪些？
大模型的幻觉是什么？怎么减少大模型的幻觉？
什么是LoRA微调？LoRA微调的优点是什么？
什么是多智能体？多智能体的应用场景有哪些？
你做过的最满意的大模型项目是什么？你在项目中遇到了什么问题？怎么解决的？

5.3 项目准备：这2个项目，HR看了直接约面试

简历上至少要有2个大模型相关的项目，这2个项目是HR最看重的。我给大家推荐2个最适合放在简历上的项目：

个人知识库助手：基于Semantic Kernel和RAG技术开发，支持上传PDF、Word、Excel等多种格式的文档，支持自然语言问答。这个项目能体现你对RAG技术的掌握程度。
多智能体写作助手：基于Semantic Kernel的多智能体功能开发，包含策划、写作、校对三个智能体，能自动生成高质量的文章。这个项目能体现你对多智能体技术的掌握程度。

这两个项目都不难，一个星期就能做完。做完之后放到GitHub上，写好README，把GitHub链接放到简历上，HR看了之后基本都会约你面试。

六、转大模型最容易踩的5个坑，别再走弯路了

最后，我给大家总结一下转大模型最容易踩的5个坑，希望大家能避开这些坑，少走弯路：

不要一开始就啃数学：很多人转大模型，上来就去啃高数、线性代数、概率论，结果学了半年，连一个大模型程序都没写过，最后放弃了。对于应用开发工程师来说，数学真的没那么重要，先做项目，再补数学。
不要学太多框架：很多人今天学LangChain，明天学LLamaSharp，后天学Semantic Kernel，结果每个框架都只懂一点皮毛，哪个都不精通。其实只要精通一个框架就行，其他框架都是相通的，学会一个之后，再学其他的就很简单了。
不要只学理论，不做实战：很多人看了很多教程，背了很多概念，但是从来没有自己动手做过项目。企业要的是能干活的人，不是会背概念的人。一定要多做项目，在做项目的过程中学习。
不要盲目追求算法岗：算法岗门槛高，岗位少，竞争激烈，普通人根本进不去。大部分人适合做应用开发岗，应用开发岗门槛低，岗位多，薪资也不低。
不要相信什么“7天学会大模型”的培训班：那些说7天就能学会大模型的培训班，都是割韭菜的。大模型是一个需要长期学习的技术，不可能7天就学会。与其花几万块钱报培训班，不如自己跟着免费的教程学，多做项目。

查看全文

http://www.jsqmd.com/news/799174/