当前位置：首页 > news >正文

AMD Nitro-E：304M轻量AI绘图，4步39.3张/秒极速体验

news 2026/3/27 1:33:34

AMD Nitro-E：304M轻量AI绘图，4步39.3张/秒极速体验

【免费下载链接】Nitro-E项目地址: https://ai.gitcode.com/hf_mirrors/amd/Nitro-E

AMD近日发布了一款突破性的轻量级文本到图像生成模型Nitro-E，以仅304M的参数量实现了高效AI绘图能力，尤其在推理速度上展现出惊人表现——其蒸馏版本在单张AMD Instinct MI300X GPU上可达到每秒39.3张图像的生成速度，且仅需4步推理即可完成，为AI图像生成领域带来了效率革命。

当前AI图像生成领域正面临着模型规模与性能之间的平衡难题。主流模型如Stable Diffusion系列参数量普遍在数十亿级别，不仅对硬件资源要求高，且生成速度难以满足实时应用需求。行业正迫切寻求轻量化、高性能的解决方案，以推动AI绘图技术在边缘设备、实时交互等场景的普及应用。在此背景下，AMD Nitro-E的推出恰逢其时，以"轻量高效"为核心定位，重新定义了轻量级文本到图像模型的性能标准。

Nitro-E的核心优势体现在三大维度：极致轻量化架构、突破性推理速度与创新技术设计。该模型采用全新的Efficient Multimodal Diffusion Transformer（E-MMDiT）架构，通过多重创新技术实现了效率突破。其采用高度压缩的视觉tokenizer和多路径压缩模块，显著减少了计算令牌数量；创新的Alternating Subregion Attention（ASA）技术通过子区域内注意力计算降低开销；而AdaLN-affine模块则实现了transformer块中调制参数的高效计算。这些技术共同造就了仅304M参数的轻量化模型体量。

在性能表现上，Nitro-E创造了新的效率纪录：基础版本在单张MI300X GPU上实现18.8张/秒的吞吐量（512px图像，批处理大小32），而蒸馏版本更是将这一数字提升至39.3张/秒，且将推理步骤从标准的20步大幅缩减至仅需4步。更值得关注的是其训练效率，Nitro-E从 scratch 训练仅需1.5天，在配备8张AMD Instinct MI300X GPU的单节点上即可完成，显著降低了模型开发成本。该模型系列包含三个版本：基础版Nitro-E-512px（20步推理）、蒸馏版Nitro-E-512px-dist（4步推理）以及采用Group Relative Policy Optimization (GRPO)策略优化的Nitro-E-512px-GRPO版本，满足不同场景需求。

Nitro-E的推出将对AI图像生成领域产生多重影响。首先，其极致的推理效率为实时图像生成应用铺平道路，有望推动AI绘图在直播、游戏、AR/VR等交互式场景的深度集成。其次，304M的轻量化模型为边缘设备部署提供了可能，使智能手机、嵌入式系统等终端设备也能运行高质量AI绘图模型。对于企业用户而言，Nitro-E极低的训练和推理成本将显著降低AI图像生成技术的采用门槛，尤其利好内容创作、设计、广告等行业的中小企业。

从技术趋势看，Nitro-E印证了AI生成模型"轻量化、高效率"的发展方向。AMD通过创新架构设计而非单纯增加参数量来提升性能的思路，可能成为未来模型优化的主流路径。该模型采用MIT开源许可，并已开放源代码和技术博客，这将加速高效扩散模型技术的研究与应用。随着硬件与软件协同优化的深入，我们有理由期待轻量级AI生成模型在保持质量的同时，实现更惊人的速度突破，推动AI创意工具向实时化、普及化方向加速发展。

【免费下载链接】Nitro-E项目地址: https://ai.gitcode.com/hf_mirrors/amd/Nitro-E

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

查看全文

http://www.jsqmd.com/news/179558/