当前位置: 首页 > news >正文

支持CUDA的ubuntu版本llama.cpp编译教程

首先确保linux系统已安装过cuda,输入如下命令验证:

nvcc --version

以我的编译环境为例,输入结果如下:

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2025 NVIDIA Corporation
Built on Fri_Feb_21_20:23:50_PST_2025
Cuda compilation tools, release 12.8, V12.8.93
Build cuda_12.8.r12.8/compiler.35583870_0

可以看出当前的cuda版本为12.8。接下来拉取 llama.cpp 源码:

git clone https://github.com/ggerganov/llama.cpp
cd llama.cpp

然后在仓库路径下创建一个 build 文件夹用于盛放编译结果:

mkdir build && cd build

之后输入如下命令配置 cmake :

cmake .. -DGGML_CUDA=ON -DCMAKE_CUDA_COMPILER=/usr/local/cuda/bin/nvcc

开始编译:

cmake --build . --config Release -j $(nproc)

编译完成后,可执行文件会生成在 build/bin/ 目录下。接下来可以将编译结果打包:

tar -czvf llama-bin-linux-cuda-12.8-x86_64.tar -C bin .

 

http://www.jsqmd.com/news/1050150/

相关文章:

  • 7步掌握Deeplearning4j深度学习框架:从入门到生产部署
  • 终极暗黑破坏神2存档编辑器:告别复杂十六进制编辑,轻松修改角色数据
  • Python+YOLO v8 模型训练
  • 2026山东大学项目实训项目博客(八)
  • 2026年阿里云618 Hermes Agent/OpenClaw配置Token Plan详细步骤一文讲清
  • 南京靠谱宠物店整理,新手买宠可以先看看 - 园友3800037
  • 影刀RPA子流程设计:让复杂流程变清晰
  • 2026年6月脉冲除尘滚振清理筛供货厂家怎么选择,脉冲除尘滚振清理筛/滚振组合清理筛,脉冲除尘滚振清理筛制造企业哪家专业 - 品牌推荐师
  • 2026年6月最新格拉苏蒂中国官方售后电话热线网点地址客服服务 - 亨得利官方服务中心
  • 果速修服务流程全透明:先检测再报价后维修,全程录像+旧件归还,热线400-811-2953 - 博客万
  • emWin显示驱动与VNC服务器集成:嵌入式GUI开发实战指南
  • 3分钟解决iPhone USB网络共享问题:Windows驱动一键安装方案
  • 重访Jahnke与Emde函数手册:从查表插值到现代数值计算
  • Windows风扇控制神器FanControl:5分钟打造静音高效散热系统
  • Python毕设选题推荐:基于 Django 的校园跳蚤市场交易平台设计与实现 智能化校园二手商品交易管理系统【附源码、mysql、文档、调试+代码讲解+全bao等】
  • 企业级大模型私有化部署深度指南:从模型选型到SLA运维
  • 2026年6月最新格拉苏蒂中国官方售后电话网点地址及客户服务热线 - 亨得利官方服务中心
  • 2026深度实测!主流AI编程助手横向对比,开发者真实选型指南
  • 南充翻译盖章:2026最新办理流程 - 资讯速览
  • 无锡本地买宠避坑指南,附几家宠物店参考 - 园友3800037
  • 前端组件库建设实践:提升开发效率的利器
  • 第17周学习总结
  • PIC17CXX外部SRAM接口设计:时序计算、硬件连接与调试实战
  • 绵阳翻译盖章:2026最新办理流程 - 资讯速览
  • 果速修2026年品牌发展全景:从上海首店到全国200+门店,官方热线400-811-2953 - 博客万
  • 面试篇-String、StringBuffer和StringBuilder有什么区别?
  • 闲置钻石变现避坑!2026 年 6 月上海正规回收机构攻略 - 奢侈品交易观察员
  • 2026河源黄金奢侈品回收靠谱门店TOP5|中检双认证河源源奢汇领衔,附避坑指南 - 生活测评小能手
  • 2026年6月20日郴州金价大跌!最新回收行情+变现时机+靠谱门店排名 - 小仙贝贝
  • 终极网盘下载加速方案:一键解锁八大平台满速下载