大语言模型开发的工作岗位都有哪些?
参与大语言模型(LLM)开发,而不是简单调用API做应用,那么岗位大致分成5条路线,每条路线需要的技能差异很大。
1. LLM应用工程师(最容易进入)
这是目前招聘最多的岗位。
主要工作:
- 调用模型API
- Agent开发
- RAG知识库
- Prompt Engineering
- 工作流编排
- MCP工具调用
- 企业AI应用开发
典型技术栈:
- Python
- FastAPI
- LangChain
- LangGraph
- LlamaIndex
- MCP
- 向量数据库
例如:
- LangChain
- LlamaIndex
需要掌握:
Python REST API 数据库 向量数据库 Embedding RAG Agent Prompt 部署数学要求:
低很多公司实际上招的就是这个。
2. Agent工程师(非常适合你)
未来两年需求可能增长最快。
工作内容:
- 多智能体系统
- Agent规划
- Tool Use
- Memory
- 长任务执行
- 工作流优化
例如:
AutoGPT OpenManus DeepResearch Claude Code Cursor Agent核心知识:
强化学习
你已经有基础。
包括:
- MDP
- POMDP
- 策略优化
- 多智能体协同
规划算法
A* MCTS GOAP HTN世界模型
你最近聊的人胚概念其实和这个方向很接近。
相关领域:
Yann LeCun 提出的世界模型路线。
3. LLM算法工程师(门槛高)
这是真正训练模型的人。
主要工作:
- 预训练
- 微调
- RLHF
- Alignment
- 模型优化
需要:
数学
- 线性代数
- 概率论
- 信息论
- 优化理论
深度学习
- Transformer
- Attention
- Position Encoding
- MoE
例如:
Transformer
核心论文:
Attention Is All You Need
4. 大模型基础设施工程师
很多人忽略这一块。
工作内容:
- 分布式训练
- 推理加速
- GPU集群
- KV Cache
- 推理服务
技术栈:
CUDA PyTorch NCCL DeepSpeed vLLM TensorRT例如:
- PyTorch
- vLLM
这个方向工资通常很高。
因为懂GPU的人很少。
5. LLM研究员(最难)
这类岗位一般出现在:
- OpenAI
- Anthropic
- Google DeepMind
- Meta AI
工作内容:
研究:
- 推理能力
- 长上下文
- 世界模型
- Agent
- RLVR
- Alignment
要求:
顶会论文 科研能力 数学能力 代码能力通常博士居多。
如果你只有6个月时间来学
我建议按下面顺序学习:
第一阶段(1个月)
掌握:
- Python高级开发
- PyTorch
推荐:
PyTorch Tutorials
第二阶段(2个月)
掌握:
- Transformer
- Attention
- LLM原理
重点复现:
nanoGPT
你会第一次真正看懂模型训练。
第三阶段(2个月)
掌握:
- RAG
- Agent
- MCP
- LangGraph
做项目
第四阶段(1个月)
阅读:
- ReAct
- Toolformer
- Voyager
- Deep Research
- OpenAI Agent论文
做多Agent系统
