当前位置: 首页 > news >正文

收藏必备!小白程序员轻松入门大模型,社招Offer拿到手软!

本文作者分享了在大模型领域的社招经历,从职业规划出发,详细介绍了面试流程中的简历关、面试问题(涵盖SFT、RAG、Agent、Deepseek&Qwen3&RL等大模型关键技术)、业务方向等。作者针对面试中常见的问题进行了深入剖析,为想要进入大模型领域的小白程序员提供了宝贵的参考和指导,助你轻松入门并提升求职竞争力。

一、职业道路规划


在国企工作即将六年的我,终于下定决心走出来。

每当HR面问到我跳槽的原因,我总是机械地回答两个点,一是平台、技术、项目深度没有发展空间,二是薪资。

但当我扪心自问时,离开国企我会失去什么?

我会失去工作的相对稳定性,也会失去这悠闲一些的工作节奏,近些年的一些降薪、工作时长改变和业绩指标改革,也让我觉得国企并不一定是铁饭碗,变革时刻在进行,身如孤船在国企这片大海只能随波逐流,不受个人意志所改变。

性格使然,太过闲散的工作对我是种折磨,在无聊中寻找乐趣简直太难受了。国企也如温水煮青蛙,不进行自我驱动的学习和改变,心气都将被消磨殆尽。

这些年也尝试过一些副业的想法,只收获了一些编程能力的锻炼,随着市场的不景气,收入也逐渐归零。投身股市,自认没有这个本领和抗风险能力。

所以,我还是选择出来看看。既希望进去大模型的风口一搏,也有中年危机的步步紧逼。

二、面经总结


一堆废话感想略过,直接上干货。相对于去年看机会的浅尝辄止,拿了几个中厂offer,今年目标更新为互联网大厂。

1、简历关

今年大模型的行情还不错,凭借本硕学历+国企背景,除了预训练的岗位约不到面试外,各个大中厂过简历毫无问题。

简历内容说实话,没什么发挥空间,保证写上去的所有内容都如数家珍即可,我也没有针对不同厂修改过不同简历。但是可以随着面试节奏和问题热点,补充你的简历内容,比如一开始agent我做的比较浅就没写,但是问的很多+热门,后续我把这块也进行了补充,这样agent的一些岗位也都可以有面试。

2、面试问题

基本以项目细节拷打+穿插大模型八股+代码考察为主,我总结了不同项目遇到的一些常见考察点和自己浅薄的思考,供大家参考。

(1)SFT

  • 各种微调技术原理(高频):基本以LoRA考察为主,包括作用原理、初始化方法、参数、其他变种等。
  • 原理可以从增量权重矩阵的本征维度出发,解析解SVD的不可行性,从而引出秩r作为超参+模型学习的方法;
  • 初始化方法是AB之一全0初始化,并可以介绍LoRA-GA和LoRA-Pro的方法(一般面试官对初始化的变种了解不深);参数有alpha和r;其他变种问的频率较低。 如何评估微调效果?通用能力+生成能力+人工通用能力是否下降?通用数据集测评,解决方法?训练集加入通用数据集,更换不同size基模,全参微调
  • 幻觉?从欠拟合和过拟合的角度分析,有尝试过自动化识别幻觉的方法吗?RAG+LLM评估

(2)RAG

  • Retrival 检索源:数据的收集、清洗,可说的内容不多
  • 索引优化: 分块策略:固定、overlap、递归分割、small2big等方法,从句子和语义截断的思路分析优缺点
  • chunk的原数据附加:源文档提取,人工构造(反向HyDE,上下文编码)
  • 查询优化:HyDE等方法
  • 向量数据库:选型,如何更新数据,问的很少
  • Embedding BM25+Embedding混合检索:BM25的原理,为什么有效果(统计词频TF-IDF角度)
  • 使用的Embedding model原理(M3E,XiaoBu,BGE等):三类任务的InfoNCE+CoSENT混合损失训练,其他对比损失介绍 MRL:混合动态维度,问的很少
  • Generation Reranker Model(mMARCO/MiniCPM/Jina等):原理,为什么需要重排(从原始语义空间的信息完整性出发),和Embedding区别,效果有提升吗
  • LLM SFT 评估指标
  • Embedding model:Recall
  • ReRanker modell:MRR、NDCG
  • End-to-End:Accuracy(LLM基于query、ground truth和生成answer评估)

(3)Agent

  • ReAct prompt的构造方法:prompt构造CoT,我做的比较早,并写在简历上了,所以会问Function call怎么训练的:Function call数据集SFT+强化学习
  • MCP:比较新,可以体现对前沿技术的追踪和理解
  • Agent一些成熟框架:我做的比较浅,没怎么用过

(4)Deepseek&Qwen3&RL

这块单独拿出来说,问的太多了,考察对新技术的追踪和掌握。

  • R1/Qwen3预训练和后训练方法:参考相关技术报告,三/四阶段训练,由于我不做pretraining方向,所以基本能回答上各阶段方法和目标即可。
  • MLA、MoE、PPO/DPO/GRPO:原理+公式,GRPO的改进点和如何实现,大部分面试官的关注点到这结束,个别的会问到critic model损失和训练方法,如何理解未来收益

(5)大模型基础

  • Transformer及其进化
  • Encoder-Decoder架构介绍
  • Positional Encoding
  • Tokenizer:WordPiece、BPE,问的不多
  • Attention(高频):还是常规问题,公式、除以 /sqrt{d_{k}} 原因(方差一致+梯度消失)
  • MHA:动机,不同语义子空间和不同位置提取信息,MQA、GQA、MLA变种,参考上文
  • Normalization:LayerNorm和BatchNorm区别(维度意义+分布假设),具体实现,为什么需要gamma和beta参数
  • FFN:为什么需要,Attention捕捉序列内部,FFN增强单个位置的特征表达
  • Activation Function:介绍几种,ReLU、GELU、GLU、Swish、SwiGLU等掌握几种即可
  • Optimizer:基本没人问
  • BERT
  • 预训练任务:MLM+NSP
  • 变种基本没人问了
  • Decoder-only:泛化性+注意力退化+KV cache+轨迹依赖
  • 多轮对话训练:损失如何计算,只计算最后一轮回答
  • 梯度消失(链式法则和激活函数特性):更换激活函数、归一化、残差、权重初始化
  • 怎么处理长文本:RoPE+bias+长上下文预训练
  • 二分类、多分类的损失函数和评估指标:交叉熵,查准、召回、F1
  • 计网基础:点击url到网页渲染过程发生了什么?get post区别和其他HTTP方法?只有抖音二面问到了,一脸懵,给我搞成web开发了

(6)代码题

统计看来动态规划考察最多,绝大多数集中在Leetcode中等难度。

  • 美团:编辑距离、层次遍历、删除倒数第n个节点、平方根
  • 快手:最长递增子序列、旋转数组最小值(有无重复)
  • 滴滴:最少平方数、最长无重复子串
  • 拼多多:最长特殊子序列
  • 携程:最长无重复子串
  • 阿里云:分词最大概率乘积、层次遍历变种
  • 抖音:跳跃一次的最大连续子数组和
  • 作业帮:最长fib子序列
  • 腾讯:中序后序重建二叉树
  • 百度:旋转数组查找,两个栈实现队列,最长公共子数组
  • 蚂蚁:ip寻址

三、业务方向


  • 安全合规
  • 智能客服/助手
  • 传统搜推

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套AI 大模型突围资料包

  • ✅ 从零到一的 AI 学习路径图
  • ✅ 大模型调优实战手册(附医疗/金融等大厂真实案例)
  • ✅ 百度/阿里专家闭门录播课
  • ✅ 大模型当下最新行业报告
  • ✅ 真实大厂面试真题
  • ✅ 2026 最新岗位需求图谱

所有资料 ⚡️ ,朋友们如果有需要《AI大模型入门+进阶学习资源包》下方扫码获取~

① 全套AI大模型应用开发视频教程

(包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点)

② 大模型系统化学习路线

作为学习AI大模型技术的新手,方向至关重要。 正确的学习路线可以为你节省时间,少走弯路;方向不对,努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划,带你从零基础入门到精通!

③ 大模型学习书籍&文档

学习AI大模型离不开书籍文档,我精选了一系列大模型技术的书籍和学习文档(电子版),它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。

④ AI大模型最新行业报告

2025最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

⑤ 大模型项目实战&配套源码

学以致用,在项目实战中检验和巩固你所学到的知识,同时为你找工作就业和职业发展打下坚实的基础。

⑥ 大模型大厂面试真题

面试不仅是技术的较量,更需要充分的准备。在你已经掌握了大模型技术之后,就需要开始准备面试,我精心整理了一份大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余

以上资料如何领取?

为什么大家都在学大模型?

最近科技巨头英特尔宣布裁员2万人,传统岗位不断缩减,但AI相关技术岗疯狂扩招,有3-5年经验,大厂薪资就能给到50K*20薪!

不出1年,“有AI项目经验”将成为投递简历的门槛。

风口之下,与其像“温水煮青蛙”一样坐等被行业淘汰,不如先人一步,掌握AI大模型原理+应用技术+项目实操经验,“顺风”翻盘!

这些资料真的有用吗?

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。

以上全套大模型资料如何领取?

http://www.jsqmd.com/news/644171/

相关文章:

  • 人脸识别安全升级:如何用反射分量分离技术防止翻拍攻击(附Python代码)
  • AI智能证件照工坊值得部署吗?隐私安全+离线运行实测分析
  • 补钙兼护关节!氨糖营养补充品推荐,温和养护身体机能 - 速递信息
  • 一张玻片,多个样本:空间转录组“拼片”实验的利与弊
  • 梳理有实力的智能太空舱生产商,小型太空舱怎么选择 - 工业设备
  • WMIC命令全解析:从硬件序列号到进程管理的Windows系统管理技巧
  • Rust 宏系统的可组合性设计
  • 避开Halcon 3D建模的坑:关于Pose顺序、坐标系的那些‘反直觉’设置
  • 3分钟快速部署Python自动化抢票脚本:告别手动刷票的终极指南
  • 探寻2026权威婚纱照推荐,热门风格和靠谱商家选购攻略 - 工业推荐榜
  • FAST:解锁GNSS数据并行下载的开源利器
  • (避坑指南篇) PyTorch与PyTorch3D环境配置:从版本对齐到一键部署
  • 在Ubuntu上从零部署BEVFormer:避开Windows的坑,用50x50网格跑通NuScenes mini数据集
  • 暗黑3鼠标宏终极指南:D3KeyHelper从入门到精通完整教程
  • CefFlashBrowser:如何在2026年继续畅玩经典Flash游戏的全方位指南
  • 四月十五日上午总结
  • AI绘画神器Z-Image-Turbo效果展示:看看这些用文字生成的电影级大片
  • 2026年3月有名的泛光照明公司找哪家,led线条灯/楼体亮化/led投光灯/景观照明/文旅灯光,泛光照明厂商口碑推荐 - 品牌推荐师
  • UJCMS 重要版本升级:架构优化、体验提升,多项技术亮点助力网站管理
  • STM32c8t6与激光雷达的串口通信实战(一)
  • 从微基准到宏基准:现代性能测试工具选型与实践指南
  • Flux.1-Dev深海幻境辅助学术创作:自动生成LaTeX论文插图与图表
  • 深聊有实力的产业互联网平台开发机构,权威供应链金融平台开发靠谱吗 - mypinpai
  • Qwen3-VL-WEBUI新手入门:快速部署阿里最强视觉语言模型
  • 2026年福州GEO优化公司top5:主流服务商能力分析与选型参考 - 商业小白条
  • Face Fusion性能优化:如何提升融合速度并降低显存占用
  • 2706基于51单片机的温度LCD闹钟电子钟系统设计
  • PlotNeuralNet进阶技巧:如何美化你的卷积神经网络结构图
  • Clawdbot整合Qwen3:32B保姆级教程:AI代理网关5分钟快速部署与管理平台搭建
  • 如何在Windows资源管理器中预览iPhone照片:5步快速实现HEIC缩略图显示