当前位置: 首页 > news >正文

LLM 大模型技术原理与应用实践专栏

目录

文章目录

  • 目录
  • AI 基础设施
    • GPU 硬件芯片
    • RDMA 通信协议
    • CUDA 编程
    • NCCL 通信库
    • 超节点技术解析
    • 大模型训推平台
  • AI 模型
    • 深度学习发展史
    • Transformer 结构解析
    • 大模型预训练与微调
    • 大模型推理框架
  • AI 程序开发
    • GPU 程序性能优化
    • AI 智能体开发技术
  • AI 编程与提效实践

AI 基础设施

GPU 硬件芯片

《GPU 基本运行原理》
《GPU 芯片架构发展史》
《GPU 虚拟化技术原理》
《8 卡 GPU 服务器与 NVLink/NVSwitch 互联技术》
《GPU 数据类型》
《联想 ThinkStation PGX 专为 AI 开发者设计的桌面级 AI 超级计算机》

RDMA 通信协议

《NVIDIA InfiniBand AI 高性能网络》
《RDMA 高性能通信技术原理》
《RoCEv2 高性能传输协议与 Lossless 无损网络》
《大规模 RDMA AI 组网技术创新:算法和可编程硬件的深度融合》

CUDA 编程

《GPU/CUDA 发展编年史:从 3D 渲染到 AI 大模型时代(上)》
《GPU/CUDA 发展编年史:GPGPU 芯片架构和 CUDA 软件架构(中)》
《win11 安装 WSL2 Ubuntu 并支持远程 SSH 登录》
《在 Windows GPU 机器上运行 Linux CUDA》

NCCL 通信库

《MPI 分布式并行计算通讯库技术》
《NCCL 分布式并行计算通讯库技术》

超节点技术解析

《从 re:Invent 2024 看 AWS 最前沿的 AI 基础设施架构》
《GPU 超级节点:NVIDIA NVL72 v.s. HUAWEI CloudMatrix 384》
《GPU 超级节点:AWS Trainium2 UltraServer》

大模型训推平台

《大模型预训练 AI Infra 基础设施技术综述》

AI 模型

深度学习发展史

《人工智能发展历程》
《人工智能神经网络基本原理》
《AI 数理逻辑基础之统计学基本原理(上)》
《人工智能发展史 — MP 模型和感知机模型的数学模型与编程应用》
《人工智能发展史 — 物理学诺奖之 Hopfield 联想和记忆神经网络模型》
《人工智能发展史 — 物理学诺奖之 Hinton 玻尔兹曼机模型》
《人工智能发展史 — RNN/LSTM/GRU/Transformer 序列模型发展历程》

Transformer 结构解析

《Transformer 大模型架构深度解析(1)NLP 自然语言处理文本表示方法》
《Transformer 大模型架构深度解析(2)RNN 循环神经网络模型在 NLP 中的应用》
《Transformer 大模型架构深度解析(3)注意力机制的发展历程》
《Transformer 大模型架构深度解析(4)详解 Transformer 架构》
《Transformer 大模型架构深度解析(5)GPT 与 LLM 大语言模型技术解析》

大模型预训练与微调

《大模型调优训练技术解析(1)训练方法与数据集技术》
《大模型调优训练技术解析(2)前提准备阶段》
《大模型调优训练技术解析(3)自监督的继续预训练阶段》
《大模型调优训练技术解析(4)有监督的微调》
《大模型调优训练技术解析(5)RLHF 强化学习微调》

《大模型预训练分布式并行技术(DP/PP/TP/EP/SP)基本原理》
《大模型分布式训练框架 DeepSpeed》
《大模型分布式训练框架 Megatron-LM》
《LLaMA-Factory 大模型微调平台》
《大模型性能优化方向》

大模型推理框架

《vLLM 大模型推理实践》

AI 程序开发

GPU 程序性能优化

《GPU 性能分析工具综述》
《使用 Nsight Systems 来优化 CUDA 程序性能》
《使用 Nsight Compute 来优化 CUDA 程序性能》
《CUDA 性能分析器实现技术》
《PerfTracker 论文解析与实践》

AI 智能体开发技术

《智能体综述:从 Agentic AI 到 AI Agent》
《AI Agent 软件工程关键技术综述》
《AI Agent 的体系化分类与产品形态分析》
《OpenManus 通用智能体实践与代码分析》
《AI Workflow v.s. AI Agent v.s. Agentic Workflow 与应用建议》
《LangChain Model I/O 与 Chain 核心技术原理与智能问答机器人编程实例》
《LangChain Agent Tooling 技术原理与 Workflow 编程实例》

《Google 提示词工程最佳实践白皮书解读》
《智能体 MCP 协议技术原理与应用实践》
《智能体 Skills 技术原理分析和应用》

《将 OpenClaw 安全的运行在 MacOS 主力机上最大化提效》
《OpenClaw 指令大全》
《OpenClaw 总体架构技术拆解》
《OpenClaw 的企业职工个人效率提升场景》
《OpenClaw 的软件研发项目提效场景》
《OpenClaw 的安全方案》
《企业级 OpenClaw 架构设计》

《OpenClaw 的自动化能力实践案例》

《AI Agent 与 Agentic AI 企业实践》
《AI Agent 与 Agentic AI 实现技术框架》

AI 编程与提效实践

《Harness Engineering:AI 时代的工程师职业画像》
《AI Coding 新范式与方法和工具》
《Cursor 编程实践 — 开发环境部署》
《Claude Code 高级特性和应用实践》
《Claude Code 最佳实践》

《常用 AI 工具集》

http://www.jsqmd.com/news/520795/

相关文章:

  • PHP-Resque工作者管理:如何高效运行多进程和信号处理
  • Z-Image-Turbo-rinaiqiao-huiyewunv快速上手:3步完成本地化二次元绘图工具启动与首图生成
  • CogVideoX-2b实战案例:用‘futuristic city at night, flying cars’生成视频
  • 二维码工具:浏览器集成与本地处理的高效解决方案
  • V4L2框架里的‘俄罗斯套娃‘:深入拆解video_device与v4l2_subdev的交互逻辑
  • nomic-embed-text-v2-moe部署案例:中小企业低成本搭建多语言向量检索系统
  • 经典算法动画演示与代码生成:Qwen3-14B-Int4-AWQ助力算法学习
  • NEURAL MASK 效果量化评估:使用PSNR、SSIM等指标科学对比模型优劣
  • 如何突破百万序列分析瓶颈?CD-HIT的极速聚类解决方案
  • cv_resnet101_face-detection_cvpr22papermogface部署教程:阿里云PAI-EAS模型服务封装
  • 从0到1打造专属音乐中心:开源音乐工具MusicFree的自定义体验指南
  • APICloud初使用记录
  • 【核心复现】模拟风电不确定性——拉丁超立方抽样生成及缩减场景研究附Matlab全代码
  • NXP KL46Z SLCD段式LCD控制器深度解析与低功耗驱动
  • Volley源码剖析:理解Android网络请求的底层机制
  • iter-tools:嵌入式C++零开销迭代器封装库
  • 深圳本凡科技的小程序开发服务是什么?
  • 分层开发介绍
  • 基于RexUniNLU的Java企业级文本分析系统搭建指南
  • 腾讯优图视觉模型实测:Youtu-VL-4B在电商场景的应用案例
  • 【白话神经网络(一)】从函数到神经网络
  • 自动驾驶硬件选型终极指南:为Udacity项目选择完美计算平台
  • STM32 GPIO(8 种模式,端口 配置 寄存器)
  • KX123加速度计嵌入式C++驱动设计与I²C HAL实现
  • ANSYS模态分析后,如何用MATLAB把导出的HB格式刚度矩阵变回普通矩阵?
  • 企业级AI入侵检测系统落地避坑指南:从数据采集到模型部署的7个关键决策点
  • 如何用novideo_srgb解决显示器色彩偏差问题?免费开源工具让你的屏幕显示更准确
  • LLamaSharp快速入门:5分钟搭建本地AI聊天机器人
  • python+flask+vue3框架的仓储管理系统 仓库进销存管理系统
  • 2026年靠谱的烘干机公司推荐:河沙烘干机品牌厂家推荐 - 品牌宣传支持者