当前位置: 首页 > news >正文

llama.cpp部署Hugginghub模型

参考链接

任意边缘设备部署大语言模型

一、部署模型

step.01:从github仓库下载llama.cpp项目源码
git clone https://github.com/ggml-org/llama.cpp
step.02:编译llama.cpp项目源码
cmake -B build
cmake --build build --config Release
step.03:安装HuggingFace_Hub Python环境,推荐使用env虚拟环境安装。
python3 -m venv .env
source .env/bin/activate
pip install huggingface_hub
step.04:从HuggingFace_Hub下载大模型到本地传输到开发板,以阿里的Qwen大模型为例。
https://huggingface.co/Qwen/Qwen3-0.6B-GGUF/
image
(这里我将本地大模型传输到开发板使用的是jupyter,当然网上又有很多传输方法,这里就不详细说明)
step.05:使用llama.cpp加载Qwen3大模型,并生成Restful服务。
注意把模型权重仿真llama.cpp文件目录下
./build/bin/llama-cli -m ./Qwen3-0.6B-Q8_0.gguf -c 2048 -t 4 -cnv

二、模型运行

这里由于Qwen3-0.6B只支持LLM大语言模型,所以这里只展示语言模型输出,其他模型可以自行到Hugginghub下载,再部署到开发板即可。
image

http://www.jsqmd.com/news/447277/

相关文章:

  • FPGA图像处理实战:如何用FIFO实现3x3卷积窗口(附Verilog代码)
  • Overleaf新手必看:5分钟搞定会议论文LaTeX模板导入与配置
  • 思源笔记+Ollama:手把手教你搭建本地AI写作系统(含内网穿透教程)
  • Seaborn vs Matplotlib:绘制带误差带的曲线图对比指南(2023最新版)
  • rk3588升级Linux 6.1内核后声卡罢工?LT6911UXE录音修复实战记录
  • paraview使用技巧
  • c#获得solidworks零件的 面邻接矩阵
  • 从ImageNet到GLUE:盘点深度学习领域那些影响深远的benchmark数据集
  • 企业边缘AI基建:AI应用架构师的部署与管理实战
  • Power Query逆透视列实战:5分钟搞定Excel数据行列转换(附常见错误排查)
  • STM32F429IG驱动3.5寸ILI9486屏幕实战:从寄存器操作到汉字显示全流程
  • Glass数据库迁移终极指南:10个关键策略保障版本控制与数据一致性
  • 百度之星-第五维度
  • TinyGPSPlus库深度解析:如何用3行代码搞定STM32的NMEA数据解析
  • AntV-G6实战:5分钟搞定可交互拓扑图编辑器(附完整代码)
  • Glass Prompt工程终极指南:构建高效AI提示模板的10个技巧
  • Res-SAM实战案例:如何用AI自动生成精确的缺陷分割掩码
  • ESP32开发实战:如何高效管理IDF组件依赖(附避坑指南)
  • 蛋白互作分析避坑指南:PDB预处理 vs AlphaFold结构怎么选?
  • Kotlin/Native终极云存储指南:AWS/Azure/GCP完美集成方案
  • 解决Matplotlib中文乱码:从DejaVu Sans到SimHei的完整配置指南(附常见问题排查)
  • Glass键盘快捷键终极指南:提升工作效率的10个实用技巧
  • Kotlin/Native终极部署指南:应用商店发布与更新策略详解
  • 各种橡胶的特性介绍
  • 未来生物计算模型核心能力:提示工程架构师需掌握的提示工程创新技术
  • LangGraph实战:如何用SSE协议远程调用MCP Server(附完整代码示例)
  • 妙言MiaoYan LaTeX数学公式:科研工作者的写作利器指南
  • Python27虚拟环境离线安装pandas避坑指南:从whl文件选择到依赖解决
  • Python学习
  • uport1100系列转接头,SZ系列光电编码器RS485通信