当前位置: 首页 > news >正文

下载**Qwen3.5-35B-A3B**的GGUF格式文件

要下载Qwen3.5-35B-A3B的GGUF格式文件,可通过Hugging Face(国际主流)或ModelScope(国内镜像)平台获取,以下是具体步骤和注意事项:

一、核心下载地址

Qwen3.5-35B-A3B的GGUF文件主要由Unsloth团队上传至Hugging Face和ModelScope,这两个平台是最可靠的来源:

  • Hugging Face:https://huggingface.co/unsloth/Qwen3.5-35B-A3B-GGUF
  • ModelScope(国内):https://www.modelscope.cn/models/unsloth/Qwen3.5-35B-A3B-GGUF

二、下载方式选择

根据网络环境和需求,可选择以下下载方式:

1. 直接下载(适合小文件或稳定网络)

进入上述平台的文件页面,找到需要的GGUF文件(如Qwen3.5-35B-A3B-UD-Q4_K_XL.gguf,这是常用的量化版本),点击Download按钮直接下载。

2. 命令行下载(适合大文件或批量下载)

若需下载大文件(如19GB的UD-Q4_K_XL版本),可使用**huggingface-cliaria2c**工具,支持断点续传和多线程加速:

(1)使用huggingface-cli(Python工具)
  • 安装依赖:pip install huggingface-hub
  • 下载命令(示例):
    huggingface-cli download unsloth/Qwen3.5-35B-A3B-GGUF\--include"Qwen3.5-35B-A3B-UD-Q4_K_XL.gguf"\--local-dir ./Qwen3.5-35B-A3B-GGUF\--local-dir-use-symlinks False
    该命令会将文件下载至当前目录的Qwen3.5-35B-A3B-GGUF文件夹,且不使用符号链接(避免路径问题)。
(2)使用aria2c(多线程下载工具)
  • 安装aria2(参考官网:https://aria2.github.io/);
  • 下载命令(示例):
    aria2c-x16-s16-k1M\"https://huggingface.co/unsloth/Qwen3.5-35B-A3B-GGUF/resolve/main/Qwen3.5-35B-A3B-UD-Q4_K_XL.gguf"\-d./Qwen3.5-35B-A3B-GGUF\-oQwen3.5-35B-A3B-UD-Q4_K_XL.gguf
    其中,-x16表示16个连接线程,-s16表示16个分段下载,-k 1M表示每个分段1MB,适合高速网络环境。
3. 国内用户优化(解决网络问题)

若国内访问Hugging Face缓慢,可通过ModelScope镜像下载,或使用HF Mirror(Hugging Face镜像站):

  • ModelScope下载:直接进入ModelScope的模型页面(https://www.modelscope.cn/models/unsloth/Qwen3.5-35B-A3B-GGUF),点击下载按钮,速度更稳定;
  • HF Mirror配置:设置环境变量export HF_ENDPOINT="https://hf-mirror.com",再使用huggingface-cli下载,会自动走镜像站。

三、注意事项

  1. 量化版本选择
    Qwen3.5-35B-A3B的GGUF文件提供多种量化版本(如UD-Q2_K_XL、UD-Q3_K_XL、UD-Q4_K_XL、UD-Q5_K_XL等),其中UD-Q4_K_XL是平衡性能和显存占用的常用选择(约19GB,适合24GB显存的RTX 4090/3090显卡)。

  2. 文件完整性
    下载后可通过平台提供的SHA256校验和验证文件完整性(如Hugging Face页面的Checksumssection),避免因网络问题导致的文件损坏。

  3. 部署建议
    下载后的GGUF文件可用于llama.cppvLLM等推理框架,部署时需参考对应框架的文档(如llama.cpp的llama-cli命令)。

总结

最推荐的下载路径是:

  • 国内用户:优先选择ModelScope(https://www.modelscope.cn/models/unsloth/Qwen3.5-35B-A3B-GGUF),速度稳定;
  • 国际用户:直接使用Hugging Face(https://huggingface.co/unsloth/Qwen3.5-35B-A3B-GGUF),或通过huggingface-cli命令行下载。

若需快速下载大文件,建议使用aria2c多线程工具,或通过ModelScope的镜像加速。

http://www.jsqmd.com/news/562841/

相关文章:

  • Linux驱动异步通知机制原理与实践
  • 告别人工标注!用Flux+SAM+DINO三件套,手把手教你生成高质量合成数据集(附FluxVOC/COCO复现指南)
  • Air8000A+iRTU+AirUI+485传感器—— 环境监测系统设计与实践(带屏UI)
  • 2048游戏AI终极指南:如何用智能算法每秒分析千万步棋局
  • ERP软件选型指南:中小企业数字化转型必看的5个关键问题
  • 系统移植-STM32MP1_U-Boot移植
  • 轻量级AI翻唱工具AICoverGen:3步上手本地部署方案
  • Qwen3-0.6B-FP8效果展示:同一提示词在思考/快速双模式下的对比
  • 宇树一年赚6亿背后:研发投入不足1亿,7成人形机器人卖给高校
  • 提升90% UI开发效率:psd2fgui工具从设计到实现的全流程指南
  • ZMotor2库:STM32电机控制硬件抽象层驱动设计
  • PADS 等长处理方法
  • 如何在30分钟内用OpCore-Simplify完成OpenCore EFI自动化配置?
  • MATLAB自相关与互相关实战:从基础公式到xcorr函数全解析
  • Pisco-Code:基于LED时序编码的嵌入式无接口调试协议
  • Calibre高效全流程实战指南:从格式转换到跨设备阅读解决方案
  • Java函数计算部署实战:从本地调试到生产环境上线的7个关键步骤(含阿里云/华为云/AWS对比)
  • “程序 = 算法 + 数据结构”的具体应用
  • 团队协作中的 Git 工作流(企业级实战)
  • 【2026年招商银行网络科技春招- 后端-3月30日 -第一题- 单词接龙】(题目+思路+JavaC++Python解析+在线测试)
  • 兴业控股2025年业绩:大健康养老业务收入增长13.71% 核心主业战略成效显著
  • 网盘直链下载助手:八大平台文件解析的纯净解决方案
  • 古韵承匠心 智技破边界 京尚重塑传统陶瓷厨具新格局
  • 四川吕达护栏网:四川菱形防护网/四川金属板网/四川钢丝网/四川钢板拉伸网/四川钢板网/四川防护网/选择指南 - 优质品牌商家
  • 国产PHY替代实战:联芸MAE0621A-Q3C在RK3576平台上的RGMII调试与性能调优
  • Polars 2.0大规模清洗性能翻倍的7个底层优化技巧:基于真实金融风控流水线压测数据
  • [a股]同花顺操作
  • 苍穹外卖实战:Spring Task与WebSocket联袂出击,打造高可靠订单状态与实时提醒系统
  • 3种突破实现Switch平台本地视频无缝播放
  • 用Verilog手搓一个IEEE754浮点加法器:从状态机设计到FPGA上板验证(附完整代码)