当前位置：首页 > news >正文

llama.cpp部署Hugginghub模型

news 2026/7/8 17:17:51

参考链接

任意边缘设备部署大语言模型

一、部署模型

step.01：从github仓库下载llama.cpp项目源码
git clone https://github.com/ggml-org/llama.cpp
step.02：编译llama.cpp项目源码
cmake -B build
cmake --build build --config Release
step.03：安装HuggingFace_Hub Python环境，推荐使用env虚拟环境安装。
python3 -m venv .env
source .env/bin/activate
pip install huggingface_hub
step.04：从HuggingFace_Hub下载大模型到本地传输到开发板，以阿里的Qwen大模型为例。
https://huggingface.co/Qwen/Qwen3-0.6B-GGUF/

（这里我将本地大模型传输到开发板使用的是jupyter，当然网上又有很多传输方法，这里就不详细说明）
step.05：使用llama.cpp加载Qwen3大模型，并生成Restful服务。
注意把模型权重仿真llama.cpp文件目录下
./build/bin/llama-cli -m ./Qwen3-0.6B-Q8_0.gguf -c 2048 -t 4 -cnv

二、模型运行

这里由于Qwen3-0.6B只支持LLM大语言模型，所以这里只展示语言模型输出，其他模型可以自行到Hugginghub下载，再部署到开发板即可。

http://www.jsqmd.com/news/447277/

相关文章：

FPGA图像处理实战：如何用FIFO实现3x3卷积窗口（附Verilog代码）

Overleaf新手必看：5分钟搞定会议论文LaTeX模板导入与配置

思源笔记+Ollama：手把手教你搭建本地AI写作系统（含内网穿透教程）

Seaborn vs Matplotlib：绘制带误差带的曲线图对比指南（2023最新版）

rk3588升级Linux 6.1内核后声卡罢工？LT6911UXE录音修复实战记录

paraview使用技巧

c#获得solidworks零件的面邻接矩阵

从ImageNet到GLUE：盘点深度学习领域那些影响深远的benchmark数据集

企业边缘AI基建：AI应用架构师的部署与管理实战

Power Query逆透视列实战：5分钟搞定Excel数据行列转换（附常见错误排查）

STM32F429IG驱动3.5寸ILI9486屏幕实战：从寄存器操作到汉字显示全流程

Glass数据库迁移终极指南：10个关键策略保障版本控制与数据一致性

百度之星-第五维度

TinyGPSPlus库深度解析：如何用3行代码搞定STM32的NMEA数据解析

AntV-G6实战：5分钟搞定可交互拓扑图编辑器（附完整代码）

Glass Prompt工程终极指南：构建高效AI提示模板的10个技巧

Res-SAM实战案例：如何用AI自动生成精确的缺陷分割掩码

ESP32开发实战：如何高效管理IDF组件依赖（附避坑指南）

蛋白互作分析避坑指南：PDB预处理 vs AlphaFold结构怎么选？

Kotlin/Native终极云存储指南：AWS/Azure/GCP完美集成方案

解决Matplotlib中文乱码：从DejaVu Sans到SimHei的完整配置指南（附常见问题排查）

Glass键盘快捷键终极指南：提升工作效率的10个实用技巧

Kotlin/Native终极部署指南：应用商店发布与更新策略详解

各种橡胶的特性介绍

未来生物计算模型核心能力：提示工程架构师需掌握的提示工程创新技术

LangGraph实战：如何用SSE协议远程调用MCP Server（附完整代码示例）

妙言MiaoYan LaTeX数学公式：科研工作者的写作利器指南

Python27虚拟环境离线安装pandas避坑指南：从whl文件选择到依赖解决

uport1100系列转接头，SZ系列光电编码器RS485通信