当前位置: 首页 > news >正文

关于 AMD Ryzen AI Max+ 395 / Radeon 8060S 核显能否跑通 ComfyUI 的初步调查报告(对比 Intel 核显现状)

目录

  • 背景
  • 结论
  • 测试
  • 展望
  • 后记
  • 更新(2025.05.30)
  • 再更新(2026.05.03)

背景

近期购买了华硕 ROG 幻X 2025 64GB 版本,其搭载的 AMD Ryzen AI Max+ 3951APU(以下简称 395),除了和 NVIDIA GeForce RTX 4060 相接近的游戏性能,相信还有不少朋友关注其生产力表现,这里我会进行一些测试。

结论

关于 AMD 395 的核显能否成功运行 ComfyUI 这个问题,我做了一些尝试,最后得出的结论是:全都跑不通

测试

方案状态细节
Windows + ROCm (HIP SDK) + pytorch❌ pytorch 安装1. pytorch 现阶段并不支持 Windows OS2
2. 有望在 2025Q3 支持3
3. 相关工作进行中4,疑似AMD工程师分享进展5
Windows WSL2 + ROCm v6.3 + pytorch 2.8 nightly✅ pytorch 安装
❌ pytorch 使用 ROCm
1.rocminfo看似正常运行,实际 ROCm 在 WSL2 或 Linux 下不支持 RDNA3.5 及以上6(RDNA4 可能支持,有人跑通7
2. 运行pytorch会报错"RuntimeError: No HIP GPUs are available"
Windows + pytorch-directml✅ pytorch-directml
✅ ComfyUI
❌ 模型
1.python main.py --directml正常启动 ComfyUI 前端
2. 实际运行 SD1.5 模型时出现蓝屏、自动重启系统的问题8

展望

至此,我暂时放弃本地机器跑 ComfyUI 和 SD,同时也开始好奇 LLM 为什么能在 395 上跑起来。做了一些简单的搜索,我将目光放在了 Vulkan 后端跑 LLM 这样的关键词上。下一步我或许会调查为什么 LLM 能运行在 395 上,以及我们能用本地模型来做些什么切实有用的事情。

后记

我后续更换 Intel Core Ultra 9 285H9机器,也尝试了用其 Intel 核显 Arc 140T 跑 ComfyUI,结果还算比较顺利地能跑。跟着官方 XPU 教程中 Windows 的部分安装特殊版本 p y t o r c h 即可10( L i n u x / WSL2 暂时官方还未支持),ComfyUI 需要加上--use-split-cross-attention启动,否则会出现UR_RESULT_ERROR_OUT_OF_DEVICE_MEMORY问题。

附上两张跑成功的结果:


我大致测了一下,在跑 ComfyUI 官方图生图模板时,使用默认的v1-5-pruned-emaonly-fp16.safetensors模型,Intel XPU 模式下,运行 KSampler 时 GPU 负载高,CPU 负载很低,占用 vGPU 约 12GB,速度约为用--cpu启动时的 9 倍,还是有一定加速效果的。

没想到 Intel 宣传 AIPC 是真的能用;AMD 在这方面支持就差不少,不仅是核显不支持,连最新的 90 系列显卡上市几个月了都没有官方支持 ROCm……准备观望下 Intel 的新独显,如果价格和显存合适或许可以入手一个玩玩。那么,值此 AMD 中国市场份额上涨到 50% 之际11,或许我们可以改口喊一句:Intel, YES!

更新(2025.05.30)

国内玲珑星核在内测自家 395 主机,宣传支持 pytorch12
AMD 官方推出项目支持自己编译 ROCm 和 pytorch13,有人跑通 395 运行 pytorch14,有兴趣的同学可以尝试一下。

再更新(2026.05.03)

rocm 7.12 现在能很方便地在 windows 和 ubuntu 跑模型了,只需要跟着 rocm 官方文档操作,用 venv 就可以,不需要全局安装 hip-sdk 或 rocm-sdk,太友好了15

这里以 comfyui ltx2.3 text2video 官方模板工作流为例,可以看到 Windows 和 Ubuntu 运行效率差不多:

在 windows 上:

在双系统原生的 Ubuntu 26.04 上:


  1. AMD Ryzen™ Al Max+ 395 ↩︎

  2. ROCm component support — HIP SDK installation (Windows) ↩︎

  3. Windows compilation? · Issue · ROCm/pytorch ↩︎

  4. Branches · ROCm/pytorch ↩︎

  5. X 上的 Anush Elangovan:“I’m running ROCm on my strix halo. Stay tuned 😉” / X ↩︎

  6. System requirements (Linux) — ROCm installation (Linux) ↩︎

  7. Working ComfyUI with ROCM on 9070XT - a quick tutorial and an ask. ↩︎

  8. torch-directml: BSOD in Ryzen iGPU Environment · Issue · microsoft/DirectML ↩︎

  9. Intel® Core™ Ultra 9 Processor 285H ↩︎

  10. Intel® Extension for PyTorch* Installation Guide ↩︎

  11. 历史性一刻:AMD中国市场份额50% ↩︎

  12. 地表最强AMD AI395,玲珑为你打造的家庭超算 ↩︎

  13. ROCm/TheRock: The HIP Environment and ROCm Kit - A lightweight open source build system for HIP and ROCm ↩︎

  14. [Issue]: [Windows] [gfx1151] No suitable algorithm was found to execute the required convolution · Issue #724 · ROCm/TheRock ↩︎

  15. https://rocm.docs.amd.com/en/7.12.0-preview/install/rocm.html?fam=ryzen&gpu=max-395&os=windows&os-version=11_25h2&i=pip ↩︎

http://www.jsqmd.com/news/748355/

相关文章:

  • 为什么APK Installer能彻底改变你在Windows上安装Android应用的方式:3个专业秘诀
  • Anki调度测试不稳定难题:10个实用解决方案从根源到实践
  • 几何潜在扩散技术:3D生成与扩散模型的融合应用
  • 借助Taotoken的审计日志功能追踪API调用记录与异常访问
  • 为什么pry-byebug是Ruby开发者必备的调试工具?10个强大功能详解
  • 构建代码智能体洞察系统:从动态分析到自动化代码质量提升
  • 别再手写CompletableFuture组合了!Java 25结构化并发让微服务编排代码量减少63%,某云原生平台已强制推行Q3上线
  • 如何快速搭建高频交易系统:Interactive Brokers API与High-Frequency-Trading-Model-with-IB的完整配置指南
  • ruby-prof性能分析入门:从零开始掌握代码优化
  • Minecraft Paper插件开发技能树:从新手到专家的完整指南
  • AI驱动海报设计:布局推理与可控编辑技术解析
  • 如何快速为你的CLI应用添加智能更新通知:update-notifier完整指南
  • 第17篇:Vibe Coding时代:LangGraph 并发与限流实战,解决多用户同时调用 Agent 导致服务打爆问题
  • 如何快速构建GraphQL服务:基于ht/http-kernel的Schema设计完整指南
  • 终极sops数据恢复指南:当你的秘钥丢失时如何快速找回
  • Python分布式系统调试难?3个被90%团队忽略的TraceID断层问题及修复方案
  • 控制系统基本概念
  • Spring Cloud Config 加密解密:如何保护敏感配置数据安全
  • 终极VSCode数据库客户端实战指南:从零构建企业级数据库管理平台
  • 别再手动算模型大小了!用thop.profile一键获取PyTorch模型的参数量和计算量(附ResNet50实测)
  • 多核处理器架构与网络性能优化实践
  • 终极Lem AI编程助手教程:Copilot与Claude Code完整配置指南
  • 通过 Taotoken 审计日志功能回溯 API 调用详情与安全事件
  • Fairphone 4:模块化设计与可持续智能手机的未来
  • PHP-DI版本迁移完整指南:从旧版本平滑升级到PHP-DI 7.0
  • 汕头生腌店真的新鲜吗:潮汕生腌店/生腌海鲜店/金平生腌/龙湖生腌/龙眼南生腌/汕头生腌堂食/汕头生腌外卖/汕头生腌宵夜/选择指南 - 优质品牌商家
  • object-fit-images 与主流 polyfill 对比:为什么它是更好的选择?
  • 卡证检测矫正模型效果对比:默认阈值0.45 vs 低光0.35矫正质量
  • Eclipse在硬件设计中的高效应用与配置指南
  • Florr.io 新手必看:从Ant Egg到Mythic,一份超详细的生物掉落率与升级路线图