当前位置: 首页 > news >正文

Claude Code Local:把 Claude Code 搬到本地跑,零云端依赖

文章目录

  • Claude Code Local:把 Claude Code 搬到本地跑,零云端依赖
    • 三个本地模型可选
    • 四种运行模式
    • 数据安全
    • 安装方式
    • 项目定位

Claude Code Local:把 Claude Code 搬到本地跑,零云端依赖

Claude Code 是 Anthropic 推出的 AI 编程工具,正常用法需要调用云端 API,按量付费。这个项目做了一件事:让 Claude Code 完全在 MacBook 上本地运行,不联网、不付费、数据不出设备。

项目叫 Claude Code Local,目前在 GitHub 上拿到了 2800 多个 Star。

它靠的是 Apple Silicon 芯片自带的 GPU。M 系列芯片的统一内存架构,让 MacBook 能跑起几十亿参数的大模型。项目封装了一套 MLX 原生服务器,大约一千行 Python 代码,负责把本地模型和 Claude Code 串起来。

用起来和原版 Claude Code 几乎一样,只是背后调用的 API 从云端换成了本地模型。

三个本地模型可选

项目目前支持三个模型,各有侧重:

Gemma 4 31B是日常编码的主力。4-bit 量化后占用约 18GB 磁盘,32GB 内存的 Mac 就能跑。速度大约每秒 15 个 token,写代码够用。

Qwen 3.5 122B追求吞吐量。它是 MoE 架构,122B 参数里每次只激活 10B,所以速度能到每秒 65 个 token。代价是需要 96GB 以上内存。

DeepSeek V4 Flash是最近加进来的。284B 参数,每次激活 37B,支持 100 万 token 的上下文窗口。它用的是 Antirez(Redis 作者)写的 ds4 引擎,纯 C 加 Metal 内核。实测在同一个 MacBook 上,本地 DeepSeek 跑赢了云端 Claude 的响应时间。

这几个模型不是从通用镜像拉的,项目团队自己做了 abliterated 版本上传到 HuggingFace。Abliteration 的意思是去掉了模型内置的拒绝方向,让它不会拒绝一些合理但敏感的请求。这不是能力升级,用的人还是要遵守上游模型的许可协议。

四种运行模式

项目提供了四种模式,每种都有对应的启动器,双击就能用。

Code 模式是最基本的,用本地模型跑 Claude Code,不需要 API Key。

Browser 模式让本地 AI 通过 Chrome DevTools 协议控制 Brave 浏览器,可以自动操作网页。

Hands-Free Voice 模式实现了完整的语音闭环。你说话提问,AI 用克隆的声音回答,全程在设备上完成。

Phone 模式通过 iMessage 收发消息,支持文字、图片和视频。

数据安全

这个项目最强调的一点是数据不出设备。代码不会发送到任何服务器,没有遥测,没有匿名数据采集。

整个数据流都在 MacBook 内部闭环:用户输入到 Claude Code CLI,CLI 调用本地 MLX 服务器,MLX 服务器加载模型在 Apple Silicon GPU 上推理,结果返回给 CLI。

对于处理敏感数据的场景,比如律师、会计师、医生这类职业,本地运行有实际意义。数据不经过第三方服务器,合规风险低很多。

安装方式

安装过程不复杂。先克隆仓库,然后用脚本启动 MLX 服务器,再配置 Claude Code 指向本地端口。

项目仓库里有详细的 Quick Start 文档,三行命令就能跑起来。前提是有一台内存足够的 Mac,最低 32GB 能跑 Gemma 31B,想要更好的体验建议 96GB 以上。

如果你不想自己折腾,项目还提供了一个 AirGap Box 服务,卖预配置好的 Mac mini,到手即用,一次性付费,没有订阅。

项目定位

Claude Code Local 解决的是一个具体问题:想用 Claude Code 这类 AI 编程工具,但不想把代码传到云端。

它不是要替代云端 Claude,云端模型的能力天花板更高。但在某些场景下,本地运行是刚需,比如处理机密代码、网络受限的环境、或者单纯不想每月掏 API 费用。

项目的 MIT 开源协议也让它可以直接用在商业场景里。对于想在本地试试 AI 编程的人来说,这是一个可以跑起来的完整方案。

项目的 MIT 开源协议也让它可以直接用在商业场景里。对于想在本地试试 AI 编程的人来说,这是一个可以跑起来的完整方案。

http://www.jsqmd.com/news/1102883/

相关文章:

  • SuperCompress(arjunkshah/supercompress)
  • 3个必学技巧:用Obsidian Better Export PDF打造专业级文档输出系统
  • Web架构安全透视:从单体到容器化的渗透测试实战指南
  • React 与 Next.js 工程化实战:从服务端渲染到流式交互的性能全链路优化
  • 【TwinCAT3入门教程】Scope Array Bar Project 与 Marker 游标测量
  • OntoL本体产品即将发布
  • 【ChatGPT编程生产力跃迁指南】:实测17个IDE插件+6类工程场景,代码生成准确率从41%→89.6%的关键转折点
  • Python VScode 配置
  • 歌词滚动姬LRC Maker:专业歌词制作工具的完整使用指南
  • Total Commander 主线程卡死问题排查
  • TEE-TA学习轨迹第九篇:libteec代码详细分析
  • 2026自研技术向GEO服务商深度测评|教育行业AI搜索优化选型指南(避坑干货)
  • Perplexity AI深度解析:可验证AI搜索的架构逻辑与工程实践
  • Windows系统文件AppxApplicabilityEngine.dll丢失找不到问题解决
  • 3大核心能力重塑方舟体验:TEKLauncher的智能游戏管理革命
  • Electron应用架构深度解析:League Akari 1.5.0模块化设计实战指南
  • 和好像一次心平气和的故障复盘——几类亲密关系沟通工具横评
  • 骨传导耳机哪个牌子值得入手?2026十大高口碑热门骨传导耳机推荐
  • ChatGPT写代码效率翻倍真相(工程师内部流传的3层Prompt分层法)
  • ThinkPad风扇控制终极指南:如何彻底解决笔记本散热与噪音问题
  • 模压一体成型电感选型:COILCRAFT XAL1010 与 TONEVEE MVL1010 系列参数逐项对比
  • 时间管理的本质不是管理时间
  • 生命涌现的小龙虾技能之【TCM Constitution Identification Analysis Tool | 中医体质识别分析工具】简介
  • 3分钟掌握QQ音乐加密音频转换:终极免费解码工具使用指南
  • 大模型推理链路与 Agent 编排:从注意力机制到多步决策的工程实现
  • 静电防护与ESD设计:从人体模型到电路保护 —— TVS选型与PCB布局要点
  • GraphQL 全栈 API 设计:从 Schema 契约到 N+1 查询优化的工程实践
  • 分布式技术选型决策:从 RPC 框架到消息队列的工程权衡
  • 从“卷模型”转向“卷应用”:大模型应用工程师为何成为大厂新宠?
  • AI 云原生后端架构:服务网格治理与智能流量调度的工程实践