研一死磕大模型,预备进厂拧螺丝
总结一下最近的学习生活,一共三条支线:科研,大模型,刷题。
科研:目前的任务目标是写一篇综述,主要论述ai在某一领域的应用。虽然没跑实验,但是在论文写作上学到不少。一是明确了综述的写作顺序:定主题—查文献—列框架—补充内容,其中查文献的时候需要找一篇与目标主题一致的优秀论文,按照对标—模仿—优化—超越的路径,很快就会有新的思路供我们创作。二是如何高效率地把大模型赋能在论文创作上,在筛选引用论文上,推荐grok,一定是deeper research,查找出来的文献百分百真实;在内容润色上,推荐Google ai studio的Gemini 2.5 pro。三是论文绘图,我在平台上查阅了大量acl论文的配图,偏卡通风,是近几年审稿人比较偏好的。图标常在flaticon这个网站寻找,配色可以在colorspace这个网站生成。
大模型:学习了qwen2的理论和代码,复习了vit。最近被推荐了一个博主:猛猿。准备在某蓝色软件上继续追更她的大模型系列文章,很多的技术细节在我前期自己学习的过程中遗漏了,猛猿的文章起了很好的补齐作用。下周从复习clip,学习gan、swin transformer、deformable detr开始。
刷题:从代码随想录转到了灵茶山艾府这里,因为他github上的题单比较清晰明确。先刷一个主题的视频,再完成课后的作业,保证每天完成3-4道。刷一遍肯定是不够的,一定要轮番多来个五六次,当然这是后话了,我现在没有到质变的阶段,还在积累数量不积跬步,无以至千里,所以慢慢来吧!
因为知道自己要什么,所以很难被周围的噪音干扰。因为能力与野心不匹配,所以时常内耗。不过一路走过来,有不少的贵人相助,这一点我保持感恩与知足。我庆幸自己在舒适的圈子里选择了勇敢破圈,虽然还没有达到一定的深度、高度,但我相信自己在物质匮乏的时候可以通过不断积累子弹,终有一天会在高光时期走t台,低谷时期上战场。
学AI大模型的正确顺序,千万不要搞错了
🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!
有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!
就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋
📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇
学习路线:
✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经
以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!
我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~
