当前位置: 首页 > news >正文

本地跑大模型,终于找到靠谱 AI 工具了。

这两年开源模型从 Llama 到 Qwen,再到 Gemma,能力一点点逼近闭源模型。

于是不少人开始动心思,想要在自己电脑上本地部署模型,试图解决高昂的 Token 费用。

但在 HuggingFace 上有上百多万个开源模型,参数量从 1B 到 100B,该如何选择。

对于大部分人来说,光搞清楚自己的电脑能跑哪些模型,可能就得折腾大半天。

更惨的是,当我们把模型权重下载到本地并部署了,才发现输出一句话得等半分钟。

根本无法使用,然后再卸载删除,重新找模型,重新下载部署,可以说试错成本极高。

最近找到一个开源的命令行工具whichllm,能帮我们解决本地部署,模型选择这个痛点。

它能根据电脑的硬件配置,给我们推荐哪个模型能跑起来又快又好。

与其他检测工具有所区别,它不止关注模型能不能跑,还会判断跑哪个模型更划算,把性能拉满。

简单举个例子。一张 24GB 显存的 RTX 4090,理论上能跑得下 32B 的模型。

但它会将 27B 模型排在第一推荐位置,理由各项基准测试评分更高,而且是最新模型。

也就是说,它不止告诉我们哪些模型能跑,还会考虑到哪些模型体验更好、性价比更高。

下面再来看下如何使用。

安装之后,只需打开终端,输入whichllm命令行,它就会自动检测我们硬件配置。

市面上主流的 N 卡、A 卡、Apple 芯片,甚至纯 CPU 的机器,都能识别出来。

接着就会基于我们的配置信息,计算清楚每个模型大概能跑多少 tok/s。

表格里会显示出模型名称、参数量、量化方式、综合评分还有下载量,所有信息一目了然。

另外,工具还有几个实用的命令,也值得说一说。

想要直接上手体验,只需一条命令whichllm run就能下载、部署模型并开启对话。

如果在纠结购买哪张显卡,可以先跑一下whichllm --gpu "RTX 4090",模拟看看可以跑哪些模型。

反过来,想知道某个模型需要什么级别的显卡才能跑,则可以用whichllm plan这条命令。

至于如果安装使用 whichllm,只需一行 pip 命令就能搞定。

pip install whichllm

装好之后敲whichllm命令即可开始,它会自动检测硬件并给出推荐列表。

不过也有几个缺点,也跟大家客观说一下。

它的速度计算是基于显存带宽和参数量推算的,可能会跟实测有些出入。

对于 Windows 上的 A 卡检测,精度也不如 Linux,需要靠系统接口去补全信息。

另外就是在 Apple 芯片和纯 CPU 环境下,为了稳定,它只推荐 GGUF 格式。

写在最后

关于本地跑模型这件事,后面肯定有越来越多的人会去尝试。

那么前提比较关键的是,不要只顾着「能跑多大模型」,而是要选择好模型。

whichllm 的出现,便帮我们把试错的成本降下来了,剩下的精力花在真正有意思的事情上。

如何学习AI大模型

大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业?”“谁的饭碗又将不保了?”等问题热议不断。

不如成为「掌握AI工具的技术人」,毕竟AI时代,谁先尝试,谁就能占得先机!

想正式转到一些新兴的 AI 行业,不仅需要系统的学习AI大模型。同时也要跟已有的技能结合,辅助编程提效,或上手实操应用,增加自己的职场竞争力。

但是LLM相关的内容很多,现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学,学习成本和门槛很高

那么针对所有自学遇到困难的同学们,我帮大家系统梳理大模型学习脉络,将这份 LLM大模型资料 分享出来:包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴点击下方链接即可前往获取

学习路线
第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发 技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集

http://www.jsqmd.com/news/987251/

相关文章:

  • Gitee 信创安全全面解析:国产化研发效能平台的安全能力与落地实践
  • Windows系统文件d3dx11_43.dll丢失找不到问题解决
  • PowerToys中文汉化版:解锁Windows效率工具的全部潜力
  • 打造你的专属音乐世界:MusicFree插件化播放器完整指南
  • 腾讯应用宝上架
  • 跨设备传一段代码或文件,到底用什么最省事?我把常见的几种方案认真比了一遍
  • 柳州泰遇尚养生馆全场景服务与价值落地指南
  • 【Kafka源码解读和使用指南】第23篇:KafkaConsumer源码全景图——消息消费背后的精密机器
  • 心脏衰竭治疗医院怎么选?2026年最新指南来了(附安徽地区推荐)
  • 核心拆解:基金名字里的“四大密码”
  • 多模态大模型表格解析方案
  • 2026年6月四川吸音板/隔音材料/吸音材料/装饰材料/声学材料公司指南,就选成都澳登建材有限公司 - 2026年企业资讯
  • AI image/video 产品上线前的模型成本评估表
  • 自贡本地老牌黄金白银铂金回收门店权威排行 TOP5 2026 线下实体商家联系方式大全 - 中安检金银铂钻回收
  • 入驻商家选源头厂家直供手办开店平台哪家好:零门槛入驻开店轻松 - 17322238651
  • STM51单片机学习(三)
  • 创业者选源头厂家直供手办开店平台哪家靠谱:智能撮合精准引流 - 19120507004
  • 社交网络模拟
  • 计算机毕业设计之django基于大数据的天水师范学院在线选修课教育平台设计与实现
  • 五大主流英语记忆工具技术与实用性深度评测:欧路词典、Anki、背单词花园、百词斩、不背单词
  • 【IEEE出版·深圳】2026年计算机感知与神经网络国际学术会议(CPNN 2026)
  • 6 月 2 日消息,小米今日正式公布了 MiMo 大模型,送邀请码一起来体验下牛皮不牛皮!
  • 2026年6月四川吸音板/隔音材料/吸音材料/装饰材料/声学材料厂家解析,认准成都澳登建材有限公司 - 2026年企业资讯
  • 广州军事夏令营:融合国防教育与研学实践,助力青少年能力成长 - 13425704091
  • NVIDIA TensorRT研究及模型加速使用
  • 目前HARTING连接器供应商
  • 辐射发射超标,磁环套了一个又一个还是压不住
  • 告别USB数据泄露与丢失:企业级文件镜像策略,这样部署才高效!
  • 一个消息回调的设计哲学:论个人微信 API 的 Webhook 钩子怎么用才不踩坑
  • 2026商户选源头厂家直供手办开店平台怎么选:功能全性价比突 - 13724980961