当前位置: 首页 > news >正文

通用多模态检索——大模型微调

1、7B的模型,参数量就占到了16G,而且你要检索,要把所有的候选项candidate全部变成向量嵌入,然后计算相似度,3090的24G显存很容易爆,而且数据量一旦大了一点,达到几万,基本就很难跑通了。如果输入还有图像的话,显存更加容易溢出,可以在加载模型的时候,限制图片输入的像素,例如max_pixel参数,加载模型的时候也可以使用int4量化。

2、例如原来是在64G的显存上跑,有些时候,即使你把batch_size改成1,num_workers改成0,也依然在24G的显存上跑不了。

3、一般原来的论文用到H200,A100,基本上完整全部复现论文也需要这个配置,24G可能只能复现部分论文。

http://www.jsqmd.com/news/545573/

相关文章:

  • UniHacker开源工具:Unity功能解锁方案的技术实现与应用指南
  • SiameseAOE中文-base部署避坑指南:初次加载模型耗时优化与WebUI响应提速技巧
  • 终极NES模拟器配置指南:FCEUX完全安装与使用教程
  • OpenClaw会议纪要神器:Qwen3-32B镜像语音转写+摘要生成
  • 手把手教你用JS脚本自动化玩转网页小游戏(含完整代码)
  • 若依框架二次开发避坑指南:手把手教你定制菜品管理系统
  • 第4章:几何对象的属性与方法
  • NaViL-9B部署教程:基于CSDN GPU平台的镜像免配置快速上手指南
  • 教培扩音神器,15mS无啸叫
  • 保姆级教程:在Win10上用Docker Desktop一键部署Dify,并接入本地DeepSeek模型
  • 第1章:Shapely 概述与入门
  • 从“炼丹”到“调参”:聊聊反向传播里那些容易被忽略的梯度细节(以PyTorch为例)
  • 计算机毕业设计:汽车大数据可视化与后台管理系统 Django框架 requests爬虫 可视化 车辆 数据分析 大数据 机器学习(建议收藏)✅
  • 第3章:几何对象模型
  • Hutool CronUtil实战:5分钟搞定Spring Boot定时任务(含动态任务配置)
  • 终极音乐解锁指南:一键解密主流平台加密音频格式
  • 宏明电子深交所上市:年营收26亿 扣非后净利3亿 市值161亿
  • 高效 LaTeX 写作:VS Code 与 MiKTeX 的完美结合(含 SumatraPDF 配置)
  • 第2章:安装与环境配置
  • 5个必装的OpenClaw技能:百川2-13B量化模型效率工具套装
  • CATIA vs. UG/NX:汽车设计工程师该如何选择?附学习路径与实战案例
  • AI作曲新浪潮:影视配乐生成的原理、实战与未来
  • OpenProject全球化协作全景指南:多语言配置零障碍实践
  • DanKoe 视频笔记:现代商业哲学:为何选择细分市场对聪明人而言是愚蠢的
  • 第5章:空间关系与谓词判断
  • 5分钟掌握Balena Etcher:最安全的跨平台镜像烧录神器
  • 第6章:集合运算
  • 计算机毕业设计:汽车数据可视化与智能分析平台 Django框架 Scrapy爬虫 可视化 车辆 懂车帝大数据 数据分析 机器学习(建议收藏)✅
  • 保姆级教程:在OrangePi 5 Plus上从SSD启动Ubuntu 22.04,并配置ROS2 Humble环境
  • PostgreSQL高可用实战:Patroni+etcd集群搭建避坑指南(附完整配置文件)