当前位置: 首页 > news >正文

flash_attn安装和使用指南

flash_attn安装比较麻烦。

方法1:whl安装

检查版本:

nvcc -V
ldd --version

如果 > 2.32,flash-attn 可以从https://github.com/Dao-AILab/flash-attention/下载编译好的whl包。
注意torch和cuda版本。
torch不需要完全对应,相近就行。

方法2:pip 编译

pip install packaging
pip install ninja
MAX_JOBS=32 pip install flash-attn --no-build-isolation

GCC报错:版本太低

error "You're trying to build PyTorch with a too old version of GCC. We need GCC 9 or later."

用conda安装gcc

conda install -c conda-forge gcc_linux-64=11 gxx_linux-64=11# Conda compilers use specific environment variables
export CC=$CONDA_PREFIX/bin/x86_64-conda-linux-gnu-gcc
export CXX=$CONDA_PREFIX/bin/x86_64-conda-linux-gnu-g++
http://www.jsqmd.com/news/323826/

相关文章:

  • HG-ha/MTools跨平台对比:各系统下GPU加速效果实测
  • 数字人智能客服实战:从零搭建高可用对话系统的架构设计与避坑指南
  • 表格数据AI处理新范式:低代码机器学习工具TabPFN全面指南
  • YOLOE视觉提示创新:用GAN生成对抗性visual prompt提升鲁棒性
  • Unsloth实战分享:我如何用低显存显卡成功微调32B大模型
  • ChatTTS童声合成实战:从模型调优到生产环境部署
  • HS2-HF Patch汉化完全解决方案:从入门到精通
  • ChatGPT下载安装全指南:从环境配置到AI辅助开发实战
  • Windows Exporter 实用指南:从入门到精通
  • Qwen3-4B GPU算力优化部署教程:device_map=‘auto‘原理与实操避坑
  • RexUniNLU零样本文本匹配实战:中文招聘JD与简历技能匹配教程
  • OFA视觉蕴含模型企业部署指南:生产环境日志管理与故障排查手册
  • 5个智能语音镜像推荐:IndexTTS-2-LLM免配置一键部署教程
  • 造相Z-Image文生图模型v2:C++高性能推理优化
  • 4步构建零基础直播内容本地化管理工具:从技术痛点到自动化解决方案
  • GTE-large部署案例:企业内部知识图谱构建中关系抽取与事件抽取协同流程
  • Cocos Creator WebSocket 实战:从连接到优化的完整指南
  • 网络性能测试工具全攻略:从基础诊断到高级优化
  • CLAP Zero-Shot Audio Classification Dashboard保姆级教程:侧边栏Prompt输入规范、逗号分隔技巧与常见错误
  • 优化Clock Tree Common Path Clock Latency:从理论到MPW实践的性能提升指南
  • 火山引擎API Key集成实战:CLI工具高效配置指南
  • 7天精通Java IM机器人开发:从入门到企业级部署
  • 还在为匹配超时、选角慢人一步烦恼?League Akari让你轻松提升游戏效率
  • 表格AI新范式:TabPFN技术指南与应用实践
  • 毕业设计实战:基于Python的城市租房信息数据分析与检测系统架构解析
  • 7个被低估的设计资产:2025品牌字体策略中的Bebas Neue商业价值重构
  • 全面讲解常用贴片与直插封装区别
  • 老旧Mac系统升级:探索OpenCore Legacy Patcher的焕新之道
  • 3个高效步骤完成B站缓存视频格式转换:完整工具使用指南
  • AIVideo长视频质量评估体系:清晰度/连贯性/逻辑性/表现力四维打分