当前位置：首页 > news >正文

LLM 大模型技术原理与应用实践专栏

news 2026/3/27 1:15:39

目录
AI 基础设施
- GPU 硬件芯片
- RDMA 通信协议
- CUDA 编程
- NCCL 通信库
- 超节点技术解析
- 大模型训推平台
AI 模型
- 深度学习发展史
- Transformer 结构解析
- 大模型预训练与微调
- 大模型推理框架
AI 程序开发
- GPU 程序性能优化
- AI 智能体开发技术
AI 编程与提效实践

AI 基础设施

GPU 硬件芯片

《GPU 基本运行原理》
《GPU 芯片架构发展史》
《GPU 虚拟化技术原理》
《8 卡 GPU 服务器与 NVLink/NVSwitch 互联技术》
《GPU 数据类型》
《联想 ThinkStation PGX 专为 AI 开发者设计的桌面级 AI 超级计算机》

RDMA 通信协议

《NVIDIA InfiniBand AI 高性能网络》
《RDMA 高性能通信技术原理》
《RoCEv2 高性能传输协议与 Lossless 无损网络》
《大规模 RDMA AI 组网技术创新：算法和可编程硬件的深度融合》

CUDA 编程

《GPU/CUDA 发展编年史：从 3D 渲染到 AI 大模型时代（上）》
《GPU/CUDA 发展编年史：GPGPU 芯片架构和 CUDA 软件架构（中）》
《win11 安装 WSL2 Ubuntu 并支持远程 SSH 登录》
《在 Windows GPU 机器上运行 Linux CUDA》

NCCL 通信库

《MPI 分布式并行计算通讯库技术》
《NCCL 分布式并行计算通讯库技术》

超节点技术解析

《从 re:Invent 2024 看 AWS 最前沿的 AI 基础设施架构》
《GPU 超级节点：NVIDIA NVL72 v.s. HUAWEI CloudMatrix 384》
《GPU 超级节点：AWS Trainium2 UltraServer》

大模型训推平台

《大模型预训练 AI Infra 基础设施技术综述》

AI 模型

深度学习发展史

《人工智能发展历程》
《人工智能神经网络基本原理》
《AI 数理逻辑基础之统计学基本原理（上）》
《人工智能发展史 — MP 模型和感知机模型的数学模型与编程应用》
《人工智能发展史 — 物理学诺奖之 Hopfield 联想和记忆神经网络模型》
《人工智能发展史 — 物理学诺奖之 Hinton 玻尔兹曼机模型》
《人工智能发展史 — RNN/LSTM/GRU/Transformer 序列模型发展历程》

Transformer 结构解析

《Transformer 大模型架构深度解析（1）NLP 自然语言处理文本表示方法》
《Transformer 大模型架构深度解析（2）RNN 循环神经网络模型在 NLP 中的应用》
《Transformer 大模型架构深度解析（3）注意力机制的发展历程》
《Transformer 大模型架构深度解析（4）详解 Transformer 架构》
《Transformer 大模型架构深度解析（5）GPT 与 LLM 大语言模型技术解析》

大模型预训练与微调

《大模型调优训练技术解析（1）训练方法与数据集技术》
《大模型调优训练技术解析（2）前提准备阶段》
《大模型调优训练技术解析（3）自监督的继续预训练阶段》
《大模型调优训练技术解析（4）有监督的微调》
《大模型调优训练技术解析（5）RLHF 强化学习微调》

《大模型预训练分布式并行技术（DP/PP/TP/EP/SP）基本原理》
《大模型分布式训练框架 DeepSpeed》
《大模型分布式训练框架 Megatron-LM》
《LLaMA-Factory 大模型微调平台》
《大模型性能优化方向》

大模型推理框架

《vLLM 大模型推理实践》

AI 程序开发

GPU 程序性能优化

《GPU 性能分析工具综述》
《使用 Nsight Systems 来优化 CUDA 程序性能》
《使用 Nsight Compute 来优化 CUDA 程序性能》
《CUDA 性能分析器实现技术》
《PerfTracker 论文解析与实践》

AI 智能体开发技术

《智能体综述：从 Agentic AI 到 AI Agent》
《AI Agent 软件工程关键技术综述》
《AI Agent 的体系化分类与产品形态分析》
《OpenManus 通用智能体实践与代码分析》
《AI Workflow v.s. AI Agent v.s. Agentic Workflow 与应用建议》
《LangChain Model I/O 与 Chain 核心技术原理与智能问答机器人编程实例》
《LangChain Agent Tooling 技术原理与 Workflow 编程实例》

《Google 提示词工程最佳实践白皮书解读》
《智能体 MCP 协议技术原理与应用实践》
《智能体 Skills 技术原理分析和应用》

《将 OpenClaw 安全的运行在 MacOS 主力机上最大化提效》
《OpenClaw 指令大全》
《OpenClaw 总体架构技术拆解》
《OpenClaw 的企业职工个人效率提升场景》
《OpenClaw 的软件研发项目提效场景》
《OpenClaw 的安全方案》
《企业级 OpenClaw 架构设计》

《OpenClaw 的自动化能力实践案例》

《AI Agent 与 Agentic AI 企业实践》
《AI Agent 与 Agentic AI 实现技术框架》