当前位置: 首页 > news >正文

AMD Instinct MI50 通过llama.cpp 在 ROCm7.0.2上运行

关于网上传言MI50 ROCm7.0.2的性能提升了,这边做了下测试。

ROCm7.0.2安装方法:

ROCm 7.0 Install for Mi50 32GB | Ubuntu 24.04 LTS : r/LocalLLaMA

这边系统使用的ubuntu22.04

ROCm安装

wget https://repo.radeon.com/amdgpu-install/7.0.2/ubuntu/jammy/amdgpu-install_7.0.2.70002-1_all.deb
sudo apt install ./amdgpu-install_7.0.2.70002-1_all.deb
sudo apt update
sudo apt install python3-setuptools python3-wheel
sudo usermod -a -G render,video $LOGNAME # Add the current user to the render and video groups
sudo apt install rocm

Drivers安装

wget https://repo.radeon.com/amdgpu-install/7.0.2/ubuntu/jammy/amdgpu-install_7.0.2.70002-1_all.deb
sudo apt install ./amdgpu-install_7.0.2.70002-1_all.deb
sudo apt update
sudo apt install "linux-headers-$(uname -r)" "linux-modules-extra-$(uname -r)"
sudo apt install amdgpu-dkms

Guide:
1. Run the commands from the ROCm quick install: https://rocm.docs.amd.com/projects/install...
2. Before rebooting to complete the install, download the 6.4 rocblas from the AUR: https://archlinux.org/packages/extra/x86_6...
3. Extract it
4. Copy all files that contain the filename "gfx906" in rocblas-6.4.3-3-x86_64.pkg/opt/rocm/lib/rocblas/library to /opt/rocm/lib/rocblas/library
5. Reboot, enrolling MOK if needed
6. Check by running sudo update-alternatives --display rocm

Now you can build llama.cpp with ROCm + flash attention (adjust j value according to number of threads):

HIPCXX="$(hipconfig -l)/clang" HIP_PATH="$(hipconfig -R)" \
cmake -S . -B build -DGGML_HIP=ON -DAMDGPU_TARGETS=gfx906 -DGGML_HIP_ROCWMMA_FATTN=ON -DCMAKE_BUILD_TYPE=Release \
&& cmake --build build --config Release -- -j 16

Note: Vulkan also works, but in my findings prompt processing seems to be better on ROCm.

 

测试使用qwen3 vl 32b:

./llama-server -m ~/.lmstudio/models/huihui-ai/Huihui-Qwen3-VL-32B-Thinking-abliterated/ggml-model-Q4_K_M.gguf --port 8080

运行后进入浏览器测试

image

测试速度相对LM中Vulkan而言,感觉提升也不大,可能是对部分模型优化会更好,后面试试其他模型。

 

http://www.jsqmd.com/news/41179/

相关文章:

  • 如何成为高级的安卓逆向工程师 glm4.6
  • PyTorch实战(9)——从零开始实现Transformer - 教程
  • 天津雅思培训机构排名2025,无老师国际/新通教育等优质机构,师资/口碑/提分率大PK
  • 2025 最新无缝钢管源头厂家推荐:国际测评认证 + 技术创新 + 全场景适配 + 服务保障综合榜单
  • 用HBuilder建立查询天气的网页
  • 2025 11 15
  • 常用设计模式:职责链模式
  • fanuc 双安检实验指导书
  • 关于样式
  • Java-Spring入门指南(二十四)SSM整合HTML:克服CSS/JS静态资源被过滤问题
  • 1115noip模拟赛
  • 2025 最新推荐!汽车喇叭网生产厂家权威排行榜,0.01MM 精度 + 全工艺保障,靠谱品牌甄选
  • 2025年毕业论文救星:6款免费AI写论文工具实测推荐
  • 2025 最新推荐!汽车喇叭网生产厂家权威排行榜:0.01MM 精度 + 全工艺保障,靠谱品牌专业甄选
  • 二维固定一维+划分 4 个象限——P12617 [RMI 2023] Circles
  • 2025年雅思培训机构哪家强?1V1定制/封闭班/机考押题班/集训营高提分机构推荐
  • 2025 最新蚀刻加工厂家口碑推荐排行榜权威发布,涵盖精密蚀刻定制与不锈钢蚀刻加工优质服务商
  • ESP-IDF V5.4 开发环境搭建教程(基于 Windows11 WSL2 )
  • PlotNeutralNet使用教程
  • idf.py如何退出串口监视器模式?
  • 2025雅思培训课程排行榜:高提分课程定制机构深度解析
  • 11.10-11.15 总结
  • Tomcat的常见问题
  • 2025 最新推荐!护栏厂家实力榜单,国际协会认证优质品牌,市政 / 铁路 / 桥梁专用护栏制造厂精选
  • 2025 最新净水器经销商推荐排行榜,精选优质服务商 涵盖直饮 / 反渗透等多类型设备直饮水净水器/过滤净水器/反渗透净水器公司推荐
  • 2025年芹黄素实力厂家权威推荐榜单:芹菜苷元/芹菜素/芹菜素95%源头厂家精选
  • 序列密码算法RC4的实现与攻击
  • 2025年RFID服装标签批发厂家权威推荐榜单:RFID服装吊牌标签/服装门店盘点标签/服装零售电子标签源头厂家精选
  • 2025 年木包装箱厂家最新推荐榜:木托盘、出口木箱、钢边木箱、免熏蒸包装箱优质厂家权威测评
  • arch配置swap分区并做休眠设置