当前位置: 首页 > news >正文

AI Infra 后端开发工程师 — 学习路线

AI Infra 后端开发工程师 — 学习路线

目标:3个月可切换到AI Infra后端岗位


能力迁移地图

AI Infra 对应迁移成本
Goroutine调度/并发控制思维直接复用
Agent会话生命周期管理设计模式相同
SSE/WebSocket流式协议实时系统思维
GPU显存管理/KV-cache资源约束优化思维
推理延迟优化/负载均衡时延敏感系统经验
Go微服务/K8s后端架构相通
Python推理网关开发直接可用

3个月学习计划

Month 1:Go语言 + 云原生基础

目标:能用Go写生产级后端服务,理解容器化部署

周次主题内容产出
W1Go基础速成goroutine/channel/interface/error处理写过C的人Go基础1周够
W2Go并发实战context/sync/semaphore/worker pool实现一个RTOS-task-scheduler的Go版
W3gRPC + Protobufservice定义/流式RPC/拦截器/超时重试写一个EtherCAT从站协议的gRPC版
W4Docker + K8s入门Dockerfile/Pod/Service/Deployment/ConfigMap把W3的服务容器化部署到minikube

关键资源

  • 《Go程序设计语言》前8章
  • gobyexample.com— 每天刷20个例子
  • github.com/grpc/grpc-go/examples— 官方gRPC示例

Month 2:消息中间件 + 推理网关理解

目标:理解AI推理服务的后端基础设施

周次主题内容产出
W5Redis深度Stream/发布订阅/分布式锁/Lua脚本用Redis Stream实现一个任务队列
W6消息队列Kafka/NATS基础、消费者组、消息可靠性用NATS实现多Agent消息总线
W7vLLM推理网关源码阅读:API server/调度器/显存管理写vLLM架构分析笔记
W8HTTP流式协议SSE实现/WebSocket/长连接管理实现一个SSE推送服务

关键资源

  • redis.io/docs— Redis Stream教程
  • github.com/vllm-project/vllm— 重点看vllm/entrypoints/openai/api_server.pyvllm/core/scheduler.py
  • nats.io— NATS官方文档(比Kafka更适合Agent场景)

Month 3:实战项目 — 自建Agent推理网关

目标:从0搭建一个可运行的多模型推理网关

项目:Mini Hermes Gateway
┌──────────────────────────────────────────┐ │ API Gateway (Go) │ │ /v1/chat/completions (SSE streaming) │ │ /v1/models │ │ /v1/health │ └──────────────┬───────────────────────────┘ │ gRPC ┌──────────────▼───────────────────────────┐ │ Model Router (Go) │ │ 负载均衡 / 模型选择 / 队列管理 │ └──────┬──────────────┬────────────────────┘ │ │ ┌──────▼──────┐ ┌─────▼──────┐ │ vLLM node 1 │ │ vLLM node 2│ │ (GPU 0) │ │ (GPU 1) │ └─────────────┘ └────────────┘
周次模块技术点
W9API GatewayOpenAI兼容API、SSE流式、速率限制
W10Model Router轮询/最少连接/显存感知路由
W11会话管理Redis会话存储、多轮对话状态机
W12压测+优化wrk/vegeta压测、pprof分析、部署文档

简历项目清单(按优先级)

🥇 Mini Hermes Gateway(核心项目)

  • Go实现OpenAI兼容推理网关
  • 支持多模型路由 + SSE流式 + Redis会话管理
  • Docker Compose一键部署
  • 面试价值:直接对应AI Infra日常工作的80%

🥈 RTOS Scheduler in Go(展示并发功底)

  • 用Go实现一个抢占式调度器
  • 支持优先级反转检测、deadline调度
  • 面试价值:证明并发编程深度理解,嵌入式背景正确定价

🥉 gRPC Bridge(展示协议设计能力)

  • 协议栈用gRPC重新实现
  • 支持流式数据传输、从站配置协议
  • 面试价值:证明能从0设计通信协议,这是AI Infra核心能力

4️⃣ vLLM源码分析笔记

  • 推理引擎架构、KV-cache管理、PD分离
  • 公开发在技术博客/GitHub
  • 面试价值:证明你对AI推理系统有深度理解,不是只会调API

每周时间分配

时段内容时长
工作日晚上 20:00-22:00理论学习 + 阅读源码2h×5=10h
周六 9:00-12:00项目实战 + 代码3h
周六 14:00-17:00项目实战 + 代码3h
周日 10:00-12:00整理笔记 + 复盘2h
每周总计~18h

关键里程碑

时间里程碑检验标准
第2周末Go gRPC服务能跑EtherCAT-gRPC Bridge v0.1
第4周末K8s部署自己的服务minikube上3个pod互访
第6周末vLLM架构吃透能给别人讲清楚调度器+显存管理
第8周末SSE流式推送服务100并发稳定推送
第10周末Mini Hermes v0.1单模型推理网关跑通
第12周末Mini Hermes v1.0多模型路由+压测报告+部署文档

http://www.jsqmd.com/news/869329/

相关文章:

  • ZKZ-3T转速监控装置
  • 基于 Python + LangChain + React 的 AI 流式对话与历史存储实战
  • 【2026.5.19 更新】 Win11 25H2 26200.8521 镜像下载
  • 2026西安市最新黄金 白银 铂金 彩金回收收门店实力排行榜及联系方式推荐 - 大熊猫898989
  • 那个被Temu查重复铺货的夜晚,我用凌风10分钟救回了三个店[特殊字符]
  • 2026年Jupyter期货研究接实盘:主流量化平台环境衔接对比
  • 前端html字体包体积压缩,网站工程下字体压缩裁剪工具
  • 2026清远市最新黄金 白银 铂金 彩金回收收门店实力排行榜及联系方式推荐 - 大熊猫898989
  • 有没有前端的“牛人”哇,自己公司招募伙伴
  • PP 蜂窝板模具流道仿真与出料均匀性优化实践
  • 软件开发为什么很多人学一半放弃
  • 育秧基质的标准化:为什么同一盘苗的秧苗可以长得一样齐?
  • DRAM内存计算中的高效移位操作设计与实现
  • 2026 年北京本土 GEO 优化服务商权威第三方测评
  • 基于 Python + LangChain + React 的 AI 流式对话与历史存储实战(拓展图片上传)
  • 龙讯新产品
  • 2026庆阳市最新黄金 白银 铂金 彩金回收收门店实力排行榜及联系方式推荐 - 大熊猫898989
  • Arm Development Studio静默安装与自动化部署指南
  • spring boot 11
  • 从钻孔记录到三维模型:Grapher与Surfer应用实践
  • 小程序上线需要的资质证书汇总
  • 2026曲靖市最新黄金 白银 铂金 彩金回收收门店实力排行榜及联系方式推荐 - 大熊猫898989
  • 人员定位系统技术方案:主流定位技术对比与选型到架构方案
  • UHF-RFID多普勒运动检测技术解析与应用
  • 为什么高级的棕色,永远是大自然原创,而非工厂复刻?
  • SMMU事务属性转换机制与调试实践
  • Arm Development Studio中手动注册Arm Compiler for Embedded指南
  • 2026淮南市最新黄金 白银 铂金 彩金回收收门店实力排行榜及联系方式推荐 - 大熊猫898989
  • 2026衢州市最新黄金 白银 铂金 彩金回收收门店实力排行榜及联系方式推荐 - 大熊猫898989
  • Python安装与环境变量配置