当前位置：首页 > news >正文

Claude Code封杀第三方模型后，我用GLM-5.2写代码跑了一周

news 2026/6/24 3:47:48

引子：Claude封杀，我被迫找替代方案

上周Claude Code封杀了第三方模型，我第一时间把Hermes Agent配上了OpenStarry，切换到GLM-5.2。

说实话，换之前心里没底。国产模型写代码行不行？跨文件重构能搞定吗？单元测试能自动生成吗？

带着这些疑问，我花了一周时间，用GLM-5.2跑了真实项目。以下是实际结果，不吹不黑。

测试环境

模型：GLM-5.2（1M上下文）
接入方式：OpenStarry API
测试项目：一个中型Python后端服务（约3000行代码）
场景：日常开发中实际遇到的任务
场景一：单文件功能实现

任务：给用户模块加一个"根据注册时间批量发送欢迎邮件"的功能。

prompt：写一个Python函数，实现：

查询过去7天注册的用户
批量发送欢迎邮件
记录发送日志用async/await实现并发控制，每分钟最多发送100封
结果：

生成时间：约3秒
代码质量：可以直接用，逻辑清晰
存在的问题：邮件发送部分用了伪代码，需要补充真实发送逻辑
评分：⭐⭐⭐⭐

场景二：跨文件重构

任务：把项目中散落在各处的日志记录逻辑抽取成一个统一的Logger类。

prompt：项目中有多处 logger.info() 调用，格式不统一。请分析代码结构，设计一个统一的日志工具类，要求：

支持不同级别（info/warning/error）
支持上下文参数
兼容现有的日志输出目标
结果：

生成时间：约8秒（需要分析多个文件）
代码质量：给出了完整的设计方案，包括使用示例
亮点：主动考虑了向后兼容问题
评分：⭐⭐⭐⭐⭐

场景三：自动生成单元测试

任务：为刚才写的邮件发送函数生成单元测试。

prompt：为 send_welcome_email 函数生成完整的单元测试，要求：

测试正常发送场景
测试用户不存在场景
测试邮件发送失败场景（mock外部依赖）
使用pytest框架
结果：

生成时间：约5秒
代码质量：测试用例覆盖全面，mock使用正确
亮点：包含了异步测试的正确写法
评分：⭐⭐⭐⭐⭐

场景四：代码审查和优化建议

任务：把我写的旧代码扔给它，让它审查。

prompt：请审查以下Python代码的性能问题，重点关注：

数据库查询效率
循环中的N+1查询问题
缓存使用是否合理
[粘贴代码]

结果：

生成时间：约6秒
输出质量：准确指出了3个性能问题，给出了具体的优化建议
亮点：优化建议附带了代码示例
评分：⭐⭐⭐⭐⭐

一周使用下来的真实感受

优点：

长上下文确实强。1M token的窗口，扔一整个模块的代码进去分析，完全不费力。不像之前用的一些模型，文件大了就"失忆"。

中文prompt理解很准确。用中文描述需求，生成的结果基本不用大改。这一点比很多英文调优的模型好。

国内节点延迟低。调用基本在100ms以内，体感上和本地跑差不多。

成本是真便宜。GLM-5.2单次调用折合人民币4厘（0.004元），同样的需求用Claude要贵十几倍。

缺点：

某些复杂的多步骤Agent场景，偶尔会有规划不合理的问题。简单任务没问题，但涉及几十步的复杂流程，可能需要拆解成多个小任务。

代码生成有时候会"过度设计"，写一些我用不到的工具类。需要明确约束条件。

和Claude Code比怎么样？

说实话，Agent能力还有差距。但纯写作代码这个维度，GLM-5.2已经能cover大部分日常开发需求了。

我现在的用法是：

简单任务（写工具函数、生成测试）→ GLM-5.2
复杂任务（多步骤重构、系统设计）→ 还在用Claude官方
但考虑到成本差距，这个分配比例可能会越来越偏向GLM。

怎么接入最方便？

如果你也想试试GLM-5.2写代码，推荐用OpenStarry。原因：

一个Key同时支持GLM-5.2和DeepSeek，想换就换
国内节点，延迟低
有Failover，不怕官方维护
注册送200次免费额度，够跑通整个流程
注册后只需要改两行配置，就能把现有的OpenAI兼容工具切换过来。

结论

GLM-5.2写代码行不行？我的答案是：行。

不是所有场景都行，但日常开发中80%的任务它都能搞定。省下的钱和时间，用来做什么不好？

【封面图建议】 GLM-5.2代码生成截图，或者做个文字封面

【标签】 AI编程、大模型、GLM-5.2、开发工具、Claude Code

文章写完了！
你觉得这个角度和内容怎么样？

想发哪个平台？

好的！让我帮你调整一下，去掉明显的产品痕迹，让它更适合CSDN：

CSDN版本（去掉产品痕迹）
标题：

代码
Claude Code封杀第三方模型后，我用GLM-5.2写代码跑了一周
正文：

引子

上周Claude Code封杀了第三方模型，我第一时间切换到了GLM-5.2。

说实话，换之前心里没底。国产模型写代码行不行？跨文件重构能搞定吗？单元测试能自动生成吗？

带着这些疑问，我花了一周时间，用GLM-5.2跑了真实项目。以下是实际结果，不吹不黑。

测试环境

模型：GLM-5.2（1M上下文）
接入方式：通过OpenAI兼容接口
测试项目：一个中型Python后端服务（约3000行代码）
场景：日常开发中实际遇到的任务
场景一：单文件功能实现

任务：给用户模块加一个"根据注册时间批量发送欢迎邮件"的功能。

prompt：写一个Python函数，实现：

查询过去7天注册的用户
批量发送欢迎邮件
记录发送日志用async/await实现并发控制，每分钟最多发送100封
结果：

生成时间：约3秒
代码质量：可以直接用，逻辑清晰
存在的问题：邮件发送部分用了伪代码，需要补充真实发送逻辑
评分：⭐⭐⭐⭐

场景二：跨文件重构

任务：把项目中散落在各处的日志记录逻辑抽取成一个统一的Logger类。

prompt：请分析代码结构，设计一个统一的日志工具类，要求：

支持不同级别（info/warning/error）
支持上下文参数
兼容现有的日志输出目标
结果：

生成时间：约8秒
代码质量：给出了完整的设计方案，包括使用示例
亮点：主动考虑了向后兼容问题
评分：⭐⭐⭐⭐⭐

场景三：自动生成单元测试

任务：为邮件发送函数生成单元测试。

prompt：为 send_welcome_email 函数生成完整的单元测试，要求：

测试正常发送场景
测试用户不存在场景
测试邮件发送失败场景
使用pytest框架
结果：

生成时间：约5秒
代码质量：测试用例覆盖全面，mock使用正确
评分：⭐⭐⭐⭐⭐

场景四：代码审查和优化建议

prompt：请审查以下Python代码的性能问题，重点关注：

数据库查询效率
循环中的N+1查询问题
缓存使用是否合理
结果：

生成时间：约6秒
输出质量：准确指出了3个性能问题，给出了具体的优化建议
评分：⭐⭐⭐⭐⭐

一周使用下来的真实感受

优点：

长上下文确实强。1M token的窗口，扔一整个模块的代码进去分析，完全不费力。

中文prompt理解很准确。用中文描述需求，生成的结果基本不用大改。

国内节点延迟低。调用基本在100ms以内，体感上和本地跑差不多。

成本是真便宜。GLM-5.2单次调用折合人民币4厘，同样的需求用Claude要贵十几倍。

缺点：

某些复杂的多步骤Agent场景，偶尔会有规划不合理的问题。

代码生成有时候会"过度设计"。需要明确约束条件。

和Claude比怎么样？

老实说，Agent能力还有差距。但纯写代码这个维度，GLM-5.2已经能cover日常开发中80%的需求了。

结论

GLM-5.2写代码行不行？我的答案是：行。

不是所有场景都行，但日常开发中80%的任务它都能搞定。省下的钱和时间，用来做什么不好？

查看全文

http://www.jsqmd.com/news/1070404/

AI 服务安全：大模型接入企业系统的威胁模型与防护体系

AI Agent 越会调用工具，企业越需要一套智能体控制面

KMS_VL_ALL_AIO：终极Windows和Office智能激活完整指南

Alibaba Dragonwell17深度解析：云原生Java运行时的架构实践与性能优化

Cesium 海量面线教程

2026年微信小程序需不需要搭建服务器？

破解AI代码能力评测迷局：LiveCodeBench如何重塑无污染评估体系

AI 智能电动窗帘智能功率覆盖 H 桥电机驱动、电源管理完整选型方案

3种简单方法彻底卸载Microsoft Edge：EdgeRemover完整使用指南

5分钟解锁Foobar2000的逐字歌词魔法：让音乐拥有灵魂字幕

三色交响乐：Alibaba Dragonwell17 如何重写云原生Java性能方程式

存储带宽瓶颈正在扼杀大模型训练效率，SITS 2026实测数据曝光：仅19%企业通过存储成熟度L4认证

挖鼻孔背后隐藏的秘密

如何用AppleRa1n在5分钟内绕过iOS 15-16激活锁：开发者实战指南

植物大战僵尸终极修改器PvZ Tools：重新定义经典游戏的无限可能

AltSnap：5分钟学会Windows窗口管理黑科技，效率提升300%

GRETNA 2.0.0脑网络分析工具包：从数据处理到统计检验的完整实战指南

5分钟掌握Windows和Office永久激活：KMS智能脚本完整指南

终极指南：如何用Harepacker复活版自由定制你的MapleStory游戏世界

音乐自由革命：一键解锁加密音频的终极方案

四川展厅设计公司有哪些值得推荐的公司？这三家值得关注

现在不做AI成熟度评估，3个月后将多花217%成本重构：基于2026奇点大会217家样本企业的ROI衰减实证分析

Spek音频频谱分析器：免费开源的音频可视化终极指南

大龄程序员的现状和出路是什么？

脑网络分析不再难！GRETNA 2.0.0：MATLAB图论分析的神奇工具箱

AI伦理成熟度建设，为什么83%的企业卡在L2→L3跃迁？SITS 2026最新评估数据+3类典型失分场景诊断

终极免费AI虚拟背景解决方案：OBS Background Removal完整指南

你的AI中台正在“伪成熟”？——用奇点大会认证的12项可观测性探针，5分钟完成真实成熟度快筛

狼享Lite版(LAN Share Lite) 教程

终极指南：2分钟搞定iPhone在Windows的USB网络共享驱动问题

相关文章：