当前位置: 首页 > news >正文

被 Claude Code 429 逼疯后,我用 Modal 白嫖了 GLM-5.1

JeecgBoot AI专题研究 | Modal 平台 GLM-5.1 免费不限 Token 接入 Claude Code


起因:Claude Code 限流太烦

周五下午赶重构任务,Claude Code 连续弹 429 Too Many Requests,Coding Plan 在高压场景下扛不住。

刷 Twitter 看到 Modal 宣布一件事:把智谱 GLM-5.1 挂到自家 GPU 集群,免费开放 API 端点,只按 QPS 限速,Token 总量不封顶。半小时跑通 Claude Code 接入,就有了这篇笔记。

Modal 把 GLM-5.1 桥接到 Claude Code:零成本、不限 Token、绕开 429 限流

一、为什么这对组合香

  • 不限 Token 总量,只限 QPS(单账号 3-5 QPS)—— 一个人挂一整天够用
  • OpenAI 协议兼容 —— 绝大多数 AI 编码工具能直接接
  • 零信用卡零额度 —— 注册完直接拿 Key

对重度用户就是天然的"主力卡 + 备胎卡"。

二、拿 Key(1 分钟)

  1. 打开 modal.com,走 GitHub / Google OAuth 注册(邮箱注册要人工审核)
  2. 进 modal.com/glm-5-endpoint
  3. 左侧点 Create token,起个名字,Key 只弹一次,立刻存好;同时记下 Example usage 里的 baseUrl 和模型 ID

端点:https://api.us-west-2.modal.direct/v1/chat/completions
模型 ID:glm-5-endpoint

三、接到 Claude Code

Claude Code 走 Anthropic 协议,Modal 走 OpenAI 协议,中间需要一个协议转换网关。Modal 官方已经写好了:modal-jazz

git clone https://github.com/modal-projects/modal-jazz.git
cd modal-jazz/frontends/claude
pip install -r requirements.txt
export MODAL_API_KEY="你的 key"
python app.py   # 监听 127.0.0.1:8000

然后给 Claude Code 配环境变量:

export ANTHROPIC_BASE_URL="http://127.0.0.1:8000"
export ANTHROPIC_AUTH_TOKEN="任意字符串"
export ANTHROPIC_MODEL="glm-5-endpoint"

重启终端跑一次 claude,Modal 控制台能看到请求就是通了。更深的用法(MCP、tool use、cache_control)参考 Claude Code LLM Gateway 文档。

四、OpenClaw / OpenCode

这俩本身就走 OpenAI 协议,不用网关中转,改配置文件就行:

{"llm_backend": {"url": "https://api.us-west-2.modal.direct/v1","api_key": "你的 Modal Key","model": "glm-5-endpoint"}
}

参考仓库:modal-jazz/frontends/openclaw · modal-jazz/frontends/opencode

五、两天用下来的几个体感

  • 首 Token 延迟 500-800ms,比 Claude Sonnet 略慢但可接受
  • CRUD、SQL、单测没问题;跨文件大重构偶尔漏调用点
  • 上下文别超 64k,后段准确率会掉
  • 单机单 Agent 最稳,并发多了会触发限速
  • us-west-2 节点偶尔 502,等十分钟或切回 Claude

小结

主力继续用 Claude Code 原厂,但被限流卡住时,Modal + GLM-5.1 + modal-jazz 是当前性价比最高的应急通道,五分钟配完,不限 Token,免费。

AI 编码工具用到生产级别的人都懂一个道理:永远给自己准备一条 B 路线


本文为 JeecgBoot AI 专题研究系列文章。

http://www.jsqmd.com/news/671351/

相关文章:

  • 告别MATLAB环境:保姆级教程教你用App Designer打包独立EXE(含Runtime配置避坑)
  • 2026年3月火锅品牌推荐,美食/老火锅/成都火锅/重庆火锅/附近火锅/社区火锅/地摊火锅/火锅,火锅品牌推荐分析 - 品牌推荐师
  • AI英语个性化学习系统的开发
  • 从数据透视到监控大屏:手把手教你用Kibana TSVB和Table可视化打造高阶业务报表
  • 解惑新纪元智能网络技术是否先进,企业文化影响力问题 - 工业品牌热点
  • STC32G12K128开发板CAN通信实战:从硬件连接到Keil C251程序调试(附源码)
  • 告别死锁:深入拆解UCIe Sideband与PCIe流控的三大核心差异
  • 免费QQ空间备份神器:一键导出所有说说记录,永久保存青春记忆
  • Whisper.cpp深度解析:打造极致高效的离线语音识别系统
  • 2026年3月除铁、除锰设备生产厂家推荐,1吨/小时反渗透设备/1/吨超纯水设备,除铁、除锰设备厂家找哪家 - 品牌推荐师
  • BetterGI原神自动化工具终极指南:5大核心功能全面解析
  • ModelSim仿真效率提升:5个你可能不知道的实用技巧(附快捷键清单)
  • 如何彻底解除iPhone性能限制?thermalmonitordDisabler专业指南
  • 从周期到成长:中国巨石如何成为AI材料基础设施核心?
  • 惊艳展示!CYBER-VISION零号协议实时分割效果:盲道、行人、车辆精准识别
  • BGP邻居建不起来?从Open报文到Keepalive,一份完整的排错检查清单
  • 别再只把Kibana当查询工具了!手把手教你用Dev Tools Console玩转ES数据增删改查
  • 别再踩坑了!在Win Server 2012 R2部署PostgreSQL必须注意的5个细节(含字符集选择与用户权限)
  • 告别DVP接口:在FPGA上低成本实现MIPI CSI-2接收的完整流程(附电阻网络配置)
  • WechatRealFriends技术指南:微信好友关系检测原理与系统化操作流程
  • 图解Weyl不等式:用Python和NumPy可视化Hermite矩阵的特征值变化
  • 别再手动翻页了!Jupyter Notebook 一键生成目录的保姆级教程(含豆瓣源加速)
  • 如何彻底解决MSI Afterburner提示MFC140.DLL缺失:终极修复指南
  • 5分钟掌握上海交通大学LaTeX论文模板:终极排版解决方案
  • 揭秘微软内部文档未披露的EF Core 10向量扩展架构:IL织入机制、Span<T>向量化查询优化与HNSW索引绑定原理
  • Arch Linux 安全测试工具箱:手把手教你用清华镜像源添加 BlackArch 仓库(附密钥安装避坑指南)
  • 暗黑破坏神2重制版自动化革命:Botty智能刷宝系统深度解析
  • 小程序生态联动:如何设计一个优雅的跨小程序用户流程与数据共享方案
  • 深入Nanite限制清单:除了模型变黑,这些UE5高级功能你也用不了
  • 三分钟让你的Windows闲置屏幕变身复古翻页时钟艺术品![特殊字符]