当前位置: 首页 > news >正文

解决MI50在Ollama0.17.4无法运行最新的Qwen3.5模型的问题

近期qwen又新出了Qwen3.5模型,包括27B、35B的模型。这边升级ollama做了下测试,会出现如下报错:

image

 

为了确定问题,这边在LM studio中也进行了对比测试,LM中使用Vulkan后端是可以运行的说明硬件本身是支持的。但是这边下载0.17.4版本的ollama二进制包,将官方编译的Vulkan库提取拷贝到/lib/ollama下后,配置使用Vulkan后端依然报该错误无法运行。 

 

经过外网相关资料查找,主要的问题在于MI50对SOLVE_TRI支持有限,特定情况下会报错。

image

 其中solve_tri_f32_cublas()MI50的hip库中没有对应实现。

解决方法:

image

 在ggml-cuda.cu下屏蔽掉对GGML_OP_SOLVE_TRI的支持,这样计算会专用CPU后端计算。

方法参考:

HIP: SOLVE_TRI falls back to rocBLAS strsm which fails on gfx906 (MI50) - suggest extending custom kernel · Issue #19972 · ggml-org/llama.cpp

 

处理后,进行编译,并拷贝到指定路径,便能解决MI50在ollama下不能运行的问题。

 

http://www.jsqmd.com/news/421798/

相关文章:

  • 国产IDE产品生态全景图
  • 打造飞机 “神经中枢” 的可靠性基石
  • 2/28
  • JAVA运算符有优先级?
  • 探索大数据领域Kafka的分区与副本策略
  • TPG型多工位(模拟)弹簧疲劳试验机
  • 高效稳定24V 3A开关电源方案:原理图、PCB设计、变压器规格书及适合T1-2电源应用
  • Web前端面试结束,一下子收到2个offer...
  • AI原生应用与业务流程增强的协同发展策略
  • 三元运算符
  • js中,什么是快速排序(Quick Sort)
  • fs文件系统模块
  • Azure DevOps:移除TFVC中过时的签入策略
  • 前端组件库开发实践:从零到发布
  • 滚动锁定:用户向上翻看历史时,如何阻止 AI 新消息把它“顶”下去?
  • 深度测评:哪个执业医师课程通过率最高? - 医考机构品牌测评专家
  • 2011-2024年各省、地级市公众环境关注度数据
  • 开源一个 React 股票 K 线图组件,传个股票代码就能画图
  • 为什么我就想要「线性历史 + Signed Commits」,GitHub 却把我当猴耍 ️
  • 2026.2.28 模拟赛
  • 基于C-V2X的协同感知、协同预测与协同规划:标准、现状与未来展望
  • 7. STL简介
  • 复合赋值运算符+字符串拼接优先级
  • 推荐一个口腔执业医师课程 - 医考机构品牌测评专家
  • 2026西安普内科副主任医师考试用书推荐, 高分考生亲测:这些教材成功上岸 - 医考机构品牌测评专家
  • 大盘风险控制策略分析报告 - 2026年02月28日
  • 指月之手——活在当下的意义行动
  • 7864838
  • 468513
  • C# 里的 dynamic 或者 object 在 C++ 里的对应