当前位置: 首页 > news >正文

国内使用huggingface下载大模型教程

国内使用Huggingface下载大模型的常见方法

方法一:使用镜像站或代理
Huggingface官方镜像站(如https://hf-mirror.com)可加速下载。通过wgetcurl直接替换域名:

wgethttps://hf-mirror.com/username/model-name/resolve/main/pytorch_model.bin

或修改环境变量:

exportHF_ENDPOINT=https://hf-mirror.com

方法二:Huggingface CLI工具配置
安装huggingface-hub库后设置镜像:

pipinstallhuggingface-hub huggingface-cli download --resume-download --local-dir-use-symlinks False --cache-dir ./cache username/model-name

通过HF_ENDPOINT环境变量指定镜像源。

方法三:手动下载+离线加载
从镜像站手动下载所有文件(包括config.jsonpytorch_model.bin等),存放至本地目录后通过代码加载:

fromtransformersimportAutoModel model=AutoModel.from_pretrained("./local-path")

方法四:使用学术机构代理
部分高校提供国际网络加速服务,可通过校内VPN或代理服务器直接访问Huggingface官方源。

注册账号

访问目标平台或服务的官方网站,找到注册入口。填写必要的个人信息,如用户名、邮箱、手机号等,并设置密码。完成邮箱或手机验证后,账号注册流程结束。

确保密码复杂度符合要求,通常需包含大小写字母、数字及特殊字符。部分平台可能要求实名认证,需上传身份证或其他有效证件。

生成Token

有些模型如Gemma 是门控模型(需要同意协议),需要先授权才能访问下载,但是国内的hf-mirror.com貌似不支持这类模型的下载,还是需要使用vpn才行

第 1 步:去 Hugging Face 网站同意模型协议

打开:https://huggingface.co/google/gemma-3n-E2B-it
点击:Access repository登录 → 同意协议 → 完成。

第 2 步:创建 Hugging Face 令牌(有只读权限就行)

打开:https://huggingface.co/settings/tokens
点:Create new token名字随便填 → 选择 read → 创建复制生成的一长串 token(类似 hf_xxxxxxxxxxxx)

第3步:先设置环境变量(关键)

运行这两行:

exportHF_ENDPOINT=https://hf-mirror.com
第4步:直接登录(不加任何 endpoint 参数!)
huggingface-cli login

然后:

  1. 粘贴你的hf_开头的 token(read 权限)
  2. 问你Add token as git credential? (Y/n)→ 输入n
  3. 出现Login successful→ 成功!

完整流程(你复制运行就成功)

# 1. 切换国内镜像exportHF_ENDPOINT=https://hf-mirror.com# 2. 登录(直接登录,不加参数)huggingface-cli login# 3. 粘贴 token → 输入 n → 完成

初始化虚拟环境
conda create-ngemma_litepython=3.10-yconda activate gemma_lite
安装核心依赖
pipinstalltorch torchvision --index-url https://download.pytorch.org/whl/cu121 pipinstalltransformers accelerate peft bitsandbytes pipinstalldatasets evaluate pipinstallpillow opencv-python pipinstallopen_clip_torch# CLIPScore
http://www.jsqmd.com/news/531500/

相关文章:

  • [特殊字符] Nano-Banana效果展示:支持多部件层级嵌套的复杂产品爆炸图
  • 22026.3.22/23/24 CAD学习十二--图层功能入门和技巧讲解
  • 手机相机对焦玄学揭秘:PDAF相位对焦在vivo/一加中的实际表现对比
  • 免费开源硬件监控神器:LibreHardwareMonitor完全使用指南
  • Notepad--:跨平台文本编辑器的终极指南,为中文用户量身打造
  • 供电局无人机巡检合作优质机构推荐:无人机行业、无人机资源加盟、无人机资质合作、无人机院校低空专业共建、无人机驾驶培训选择指南 - 优质品牌商家
  • Chroma2-Kaleidoscope:免费AI绘图新模型值得期待吗?
  • 按键精灵新手必看:5分钟搞定LOL自动回复脚本(附祖安话生成代码)
  • 为什么MRAM还没取代你的电脑内存?深入解析DRAM、SRAM与MRAM的实战对比
  • 拓竹工单打标:RAG方案零返工秘籍
  • Python实战:三种迭代法解线性方程组对比(附完整代码与性能测试)
  • AI模型协同新范式:开源工具如何重塑智能任务处理流程
  • 2025技术面试终极指南:从算法刷题到系统设计的完整通关路线
  • 告别TeamViewer!用OpenWRT的SFTP+内网穿透实现跨平台文件互传(Windows/Mac/Linux全兼容)
  • 亲测IndexTTS-2-LLM:CPU也能跑的智能语音合成,效果太自然了!
  • 深度解析:全面探索平面手性COMSOL光学仿真技术,BIC驱动下的最大平面手性特征,涵盖能带、...
  • java毕业设计基于SSM的驾校培训预约管理系统
  • ONNX模型高效管理指南:从环境适配到协作优化的全流程方案
  • Vue项目实战:海康视频监控插件集成全攻略(含常见报错解决方案)
  • 从原理到实践:用yocs_velocity_smoother实现差速机器人速度滤波(附ROS Noetic适配方案)
  • ionic 单选框操作详解
  • 【ComfyUI】Qwen-Image-Edit-F2P生成表情包:从静态人像到动态夸张表情的演变
  • MiniCPM-o-4.5-nvidia-FlagOS在Web开发全栈中的应用:从数据库设计到前端交互
  • 别再用密码了!用VSCode+SSH密钥远程开发真香指南(含密钥代理配置)
  • Flutter 的 build_runner 已经今非昔比,看看 build_runner 2.13 有什么特别?
  • V4L2采集链路解析:从摄像头到用户态图像
  • [a股]一些很像的巧合 箱体
  • java毕业设计基于Spring Boot的阳光蛋糕店管理系统
  • Ubuntu下ESP-IDF环境搭建:巧用Gitee镜像与脚本,告别GitHub龟速下载
  • Dify混合检索优化落地手册(生产级SLA保障版):召回率、延迟、稳定性三重压测实录