当前位置：首页 > news >正文

Mac本地部署大模型｜Ollama+Gemma4/Qwen3.5新手零失败教程，彻底告别Token消耗✨

news 2026/6/5 9:31:50

还在为AI Token不够用发愁？还觉得本地部署大模型是技术大神的专属？

No！今天这篇手把手教程，专门写给完全没有命令行经验的新手，从零开始教你在Mac上跑起本地大模型，不用联网、不耗Token，以后聊AI、写代码、处理文档，全靠本地搞定，省心又高效～

不用准备复杂工具，只要你有这些，就能直接开工：

很多新手第一次折腾本地模型，刚起步就翻车——核心原因就一个：选了个自己Mac跑不动的模型！要么内存不够直接报错，要么跑起来卡到怀疑人生，白忙活一场。

所以第一步，咱们先用水滴工具llmfit，快速扫描你的硬件，筛选出适配的模型（https://github.com/AlexsJones/llmfit）。

00:46

这个工具会自动检测你的RAM、CPU、GPU，从几百个模型里筛选出“能跑、好用”的，还会按适配度排序，小白也能一眼看明白。

操作步骤超简单，跟着来：

打开「终端」（不懂的话，按command+空格调出Spotlight，输入Terminal，回车就能打开）；
在终端里输入命令，回车安装llmfit： brew install llmfit
安装完成后，直接输入llmfit，回车运行；
会弹出交互界面，搜索你感兴趣的模型（google/gemma4 或 qwen/qwen3.5），看Fit一栏就好：Perfect、Good都能流畅跑，Marginal勉强能用，Too Tight直接放弃，别给自己找罪受～

小提醒：没有Homebrew？别慌！先去brew.sh复制那行安装命令，粘贴到终端执行，装完再回来继续，全程1分钟搞定～

Ollama是咱们部署模型的“核心助手”，负责模型的下载、加载和运行，还自带本地API，不用手动配置，是目前新手最省事的方案，没有之一。

还是打开终端，输入下面这行命令，回车等待安装： brew install --cask ollama

当终端出现“🍺 ollama-app was successfully installed! ”，就说明安装成功啦！

安装完成后，看Mac菜单栏右上角——会出现一个🦙图标，这是Ollama在后台运行的标志，看到它，就可以放心进入下一步啦～

不用纠结选什么模型，新手直接从这两个里挑就好，都是近期开源圈的“香饽饽”，适配Mac、好用不踩坑：

Gemma4（谷歌出品）：谷歌DeepMind 2025年新发布的开源模型，最大亮点是原生支持多模态（文字+图片），上下文窗口高达128K～256K，同体量模型里综合表现拉满，适合需要处理长文本、图文结合的需求。
Qwen3.5（阿里出品）：阿里通义团队最新开源版本，支持201种语言，重点是中文理解和代码能力超强，还内置“思考模式”，遇到复杂问题会先推理再回答，对中文用户更友好。

根据你第一步用llmfit检测的结果，对照适配度选版本（部分模型可能搜索不到，以实际结果为准）。

划重点：两个都想试也没关系！Ollama支持同时安装多个模型，随时切换，不用重新下载～

终端输入对应命令，回车开始下载（以常用版本为例）：