当前位置: 首页 > news >正文

程序员转行学习 AI 大模型: 踩坑记录,HuggingFace镜像设置未生效

本文是程序员转行学习AI大模型的踩坑记录分享。
当前阶段:还在学习知识点,由点及面,从 0 到 1 搭建 AI 大模型知识体系中。
系列更新,关注我,后续会持续记录分享转行经历~

设置镜像站

在项目代码中,打开终端,按照如下步骤,设置 HuggingFace 镜像站:

  1. 查看当前环境
echo $HF_ENDPOINT

如果,输出为空,则说明还没有设置镜像站。

  1. 设置 HuggingFace 镜像站
export HF_ENDPOINT=https://hf-mirror.com

使用 HF-Mirror 镜像站。

  1. 验证设置是否成功
echo $HF_ENDPOINT

如果输出:https://hf-mirror.com,则设置镜像站成功。

  1. 永久设置镜像站(可选)

如果希望每次打开终端,都自动使用镜像站,可以添加到 shell 配置文件中。

echo 'export HF_ENDPOINT=https://hf-mirror.com' >> ~/.bashrc source ~/.bashrc

同样,执行以下命令,验证是否成功。

echo $HF_ENDPOINT
  1. 测试镜像站是否生效

输入以下脚本命令,验证镜像站是否正常工作:

python -c "from huggingface_hub import hf_hub_download; print(hf_hub_download('Qwen/Qwen1.5-0.5B', 'config.json'))"

如果下载成功,则镜像站设置正确。

  1. 恢复官方源(如有需要)

如果想恢复到官方源,可以取消设置:

unset HF_ENDPOINT

或者删除配置文件中的设置:

# 对于 Bash sed -i '/HF_ENDPOINT/d' ~/.bashrc # 对于 Zsh sed -i '/HF_ENDPOINT/d' ~/.zshrc

常用 huggingface 镜像站

镜像站地址
HF-Mirrorhttps://hf-mirror.com
ModelScopehttps://modelscope.cn

踩坑:镜像站设置成功,但代码仍去官网链接下载

我在项目中,按照上述步骤成功设置了HF-Mirror 镜像站,但是执行代码时,一直还是去官网下载,报错如下:

'[Errno 101] Network is unreachable' thrown while requesting HEAD https://huggingface.co/Qwen/Qwen1.5-0.5B/resolve/main/tokenizer_config.json

程序还是试图访问huggingface.io(官方源)。

后面发现,是因为我的项目还是缓存了旧的环境变量,因此没有生效。

解决方案:

  1. 清楚 HuggingFace 缓存

删除缓存目录:

rm -rf ~/.cache/huggingface/

然后,执行代码,就可以正常读取新环境变量。

  1. 在代码中显示设置 endpoint

在代码中,添加以下部分:

importos# 设置Hugging Face镜像站(必须在导入库之前设置)os.environ['HF_ENDPOINT']='https://hf-mirror.com'

按照上述操场,可以正常去镜像站下载模型和数据了。

http://www.jsqmd.com/news/553626/

相关文章:

  • C++ Template Meta Programming 实例
  • Boost.Geometry在游戏开发中的妙用:从碰撞检测到AABB计算
  • 避坑指南:用Sora做商品视频时90%人会踩的3个坑(附解决方案)
  • 保姆级教程:SenseVoiceSmall多语言语音识别快速部署与情感检测实战
  • React Hooks 全解:从入门到实战,一篇吃透所有核心
  • 4种SOCD模式深度解析:从键盘冲突到竞技优势的技术实现
  • 智能磁盘释放引擎:解决Windows系统存储压力的开源优化方案
  • OpenClaw移动办公:nanobot+QQ机器人远程控制方案
  • macOS玩转OpenClaw:nanobot镜像云端体验避坑指南
  • Phi-3-vision-128k-instruct Dev-C++安装与C语言调试:初学者集成开发环境搭建
  • 漫画脸描述生成模型详解:从原理到实战
  • 科研必备:一文搞懂DOI、ISSN、ISBN的区别与查询技巧(附实战案例)
  • 从脚本原理到安全反思:聊聊那些“自动答题”工具背后的技术与伦理
  • MOOTDX:Python通达信数据接口解决方案
  • nli-distilroberta-base数据库课程设计:构建基于NLI的智能问答系统
  • 路由器变砖终极救援:3步掌握nmrpflash固件修复技术
  • 企业级手机号码智能定位系统:构建高精度地理信息服务解决方案
  • 如何快速配置绝地求生压枪宏:3步实现稳定射击的终极指南
  • 如何通过GHelper硬件调校工具实现华硕笔记本性能优化的全面掌控
  • SecGPT-14B部署教程:WebUI界面支持导出Markdown格式漏洞分析报告
  • 多语言语音合成:打破巴别塔,AI如何让世界聆听同一种声音?
  • OpenClaw技能扩展指南:基于nanobot开发自定义自动化模块
  • 用本地LLM构建知识图谱
  • StructBERT中文相似度模型GPU算力适配:显存占用峰值218MB,预留缓冲空间充足
  • 2026北京旅游推荐:这些正规旅行社口碑爆棚,北京旅游品牌聚焦优质品牌综合实力推荐 - 品牌推荐师
  • nli-distilroberta-base快速部署教程:5分钟搭建句子关系判断Web服务
  • 圣女司幼幽-造相Z-Turbo部署避坑指南:日志排查、加载延迟、显存占用优化全解析
  • 2026年昆山打官司胜诉率高的律师选择参考 - 品牌排行榜
  • 图图的嗨丝造相-Z-Image-Turbo功能详解:如何通过提示词控制渔网袜的密度、颜色和透明度
  • SMUDebugTool硬件调试解决方案:从故障识别到系统优化