当前位置: 首页 > news >正文

foundationstereo模型的安装部署与运行

  • 硬件:RTX5060(8GB显存) + Intel(R) Core(TM) i7-14650HX + 32GB内存
  • nvidia环境:驱动 580.126.09 + CUDA Version 12.8

1. 安装torch

由于显卡架构 sm_120 原因,官方提供的包在后续编译第三方库时会有环境兼容问题,仍然采用nightly支持版本

#1 创建 conda 环境,手动删除 torch torchision,编译第三方库 conda env create -f environment.yml conda activate foundation_stereo #2 手动安装 torch torchision pip3 install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu128

2. 安装 flash-attn

export TORCH_CUDA_ARCH_LIST="12.0" pip install git+GitHub - Dao-AILab/flash-attention: Fast and memory-efficient exact attention --no-build-isolation

这一步比较耗时间,和RAM大小有关。如果内存过小会出现系统死机,这时可以设置进程数降低RAM占用,但时间也会进一步增加

# 数字视情况而定 export JBOS_MAX = 1

3. 检查一下环境是否success

python - <<'PY' import torch from flash_attn import flash_attn_func q=torch.randn(1,128,8,64,device="cuda",dtype=torch.float16) k=torch.randn(1,128,8,64,device="cuda",dtype=torch.float16) v=torch.randn(1,128,8,64,device="cuda",dtype=torch.float16) o=flash_attn_func(q,k,v) print("output device:",o.device) print("dtype:",o.dtype) PY

4. demo运行之后,会遇到报错

ValueError: Unknown scheme for proxy URL URL('socks://127.0.0.1:7897/')

这个错误通常是因为系统里设置了代理环境变量,而httpx库无法识别socks://这种简写格式

解决方式为

export all_proxy=socks5://127.0.0.1:7897 export ALL_PROXY=socks5://127.0.0.1:7897

然后再运行demo脚本,报错即可解决

5. bug修复

除此之外,运行还有可能会碰到错误

UnpicklingError: Weights only load failed. This file can still be loaded, to do so you have two options, do those steps only if you trust the source of the checkpoint.

解决方法为

找到代码第62行附近

ckpt = torch.load(ckpt_dir)

增加weights_only参数

ckpt = torch.load(ckpt_dir, weights_only=False)
http://www.jsqmd.com/news/505250/

相关文章:

  • 门店系统员工不会用?4招速成法解决难题
  • FireRedASR-AED-L惊艳效果:同一模型对吴语、闽南语、客家话的跨方言识别对比
  • 提速百倍!PySCENIC在单细胞转录因子预测中的高效实践
  • AI提升SEO关键词策略的创新应用与实践指南
  • 技术人的反算法人格:故意制造认知偏差保命
  • 新增智能问数执行详情与实时仪表板,SQLBot开源智能问数系统v1.7.0版本发布
  • AI电影解说工具推荐:实测对比剪映手动流程,效率到底差多少?
  • Python多线程录屏避坑指南:如何解决FFmpeg音视频不同步问题?
  • 优化SEO效果的长尾关键词运用与关键词调整策略分析
  • 大多数人以为越努力越能做好,但其实拼命想“完美发挥”才是最快搞砸一件事的方法
  • 基于影墨·今颜小红书模型的智能客服对话生成效果展示
  • LabVIEW机械故障诊断系统
  • AI 写代码越来越快,但谁来定义代码的架构标准?
  • 【Simulink专题】Simulink模型诊断与硬件实现:关键设置与实战解析
  • FastMCP简单应用------将MCP服务器注册为外部工具,LLM通过MCP客户端与之交互
  • 99%的人只知道TCP可靠,却不知MySQL放弃UDP背后的血泪教训
  • 2026年最新考公软件推荐!双非本在职一年上岸省直,全靠这款“宝藏级”备考神器
  • TRO案件中的“默认判决”有多可怕?
  • 【避坑指南】ConcurrentHashMap 并发计数优化实战
  • LabVIEW B样条曲线拟合
  • 革新性星穹铁道智能托管解决方案:三月七小助手全方位效率提升工具包
  • VideoAgentTrek Screen Filter 企业级应用:Java开发者的AI视频处理集成方案
  • 从N皇后问题看算法选择:回溯法与分支限界法的实战场景与模板精讲
  • Python+skfuzzy实战:用模糊PID控制打造智能温控系统(附完整代码)
  • letcode 19 删除链表中倒数第n个节点
  • 大型源码C# WPF开发框架:集成SCADA数据采集系统、数据库与远程服务器调用,包含多个产品...
  • 子比主题子比超级插件-带AI功能美化集合自助广告,工单,悬赏,团购,砍价等
  • GD32F303CG实战:I2C读写BL24C256A EEPROM的5个常见坑及解决方法
  • MinIO Operator v6.0.3 进阶部署:从本地磁盘规划到高可用 Tenant 配置详解
  • 多端同步不脱节,待办管理超省心