当前位置: 首页 > news >正文

【技术干货】用「GLM Mythos 工作流」把普通大模型打造成三美元超模编码助手


摘要

本文基于视频中提出的「GLM Mythos」思想,系统拆解如何通过「模型 + 系统提示词 + 终端工作流 + GSD 思维 + 前端设计能力」组合,把一款便宜但能力强的模型打造成接近旗舰体验的编码 Agent。文中给出可复用的系统 Prompt、工作流设计,并提供基于(xuedingmao.com)的一套完整 Python 调用示例,帮助你快速在本地重现一个可落地的 Mythos 风格开发助手。


一、背景介绍:从“堆模型参数”到“设计工作流”

最近关于 “Claude Mythos / 神话版” 的讨论很多,关键词基本都是:

  • 更强的代码能力
  • 更好的长任务规划
  • 更稳定的多步骤 Agent 行为

但视频的核心观点其实很反常识:

真正拉开“普通助手”和“变态强助手”差距的,不只是模型 checkpoint,而是:系统 Prompt、工作流层、工具集成、以及防上下文腐烂(context rot)的设计。

换句话说:
你可以不买天价企业版,也能自己搭一个“神话级”工作流。

视频中把这个组合叫做GLM Mythos,它不是某个隐藏模型,而是一套栈:

  • 引擎层:GLM 5.1(强但便宜的基础模型)
  • 载体层:Kilo CLI / 终端工具(提供“Agent 身体”)
  • 约束层:King Mode 系统 Prompt(强制模型不偷懒)
  • 品味层:前端设计 Skill Prompt(让界面可直接上线)
  • 反混乱层:GSD 工作流(Get Shit Done)(保证任务真的完成,而不是只生成代码片段)

在国内开发环境下,你可以用任何 OpenAI 兼容的 API 实现同样的栈。下面我用薛定猫 AI(xuedingmao.com)来举例,演示如何在本地完成一套接近视频中的“GLM Mythos”工作流。


二、核心原理:GLM Mythos 的设计要点

1. 模型不是产品,工作流才是产品

视频中强调了一个非常重要的认知:

  • “高级模型质量”并不等于“参数更多、训练更贵”
  • 很多时候体验差异,来自:
    • 系统级 Prompt(system prompt)
    • 任务分解逻辑(decomposition)
    • 记忆/状态管理(memory)
    • 工具/终端集成
    • 上下文防腐策略(防止 context rot)

因此 Mythos 的目标是:
在不更换模型 checkpoint 的前提下,通过工程手段把模型“放大”为更稳定、更可控的 Agent。

2. King Mode:让模型“有纪律”,而不是“更聪明”

King Mode 本质上是一套系统提示词(system prompt),核心作用:

  • 明确角色:面向代码重构 / 项目搭建 / 长任务执行的工程 Agent
  • 强制步骤化:先计划、再执行、再验证、再总结
  • 禁止偷懒:不允许“含糊回答”“你可以自己查文档”式输出
  • 明确失败条件:当信息不足时必须要求补充,而不是胡编

关键点:King Mode 不会让模型“更聪明”,而是让它“更自律”。
在 GLM 5.1 这类本身偏 Agent 风格的模型上,效果会非常明显:

  • 不乱闲聊,自动进入“任务模式”
  • 更愿意重试、调试、查找错误

3. GSD(Get Shit Done):从“生成代码”到“生成功能”

GSD 思维强调:

  • 验证目标是“功能是否完成”,而不是“代码是否生成”
  • 对于一个任务,至少需要验证:
    • 能否正常运行(编译 / 测试通过)
    • 关键用户路径是否闭环(登录、保存、状态持久等)
    • 边界情况是否能自洽(空列表、错误状态)

在实践中,你可以用类似这样的小循环:

  1. 让模型先输出任务拆分清单
  2. 针对每一步生成/修改代码
  3. 引导模型设计验证脚本/测试用例
  4. 把运行日志/错误输出回灌给模型
  5. 直到功能真正可用,而不是“看起来写完了”

4. 前端设计 Skill Prompt:避免“AI 缺德 UI”

视频里特别提到:
普通 LLM 做界面时,常常生成:

  • 黑白配色 + 随便一个灰色按钮
  • 默认字体 / 间距
  • 一眼看上去“AI 味儿”的粗糙界面

所谓前端设计 Skill Prompt,就是在系统层告诉模型:

  • 要考虑视觉层级(Hierarchy)
  • 要考虑排版(Typography):字号、行高、对齐方式
  • 要考虑节奏与留白(Spacing Rhythm)
  • 要给出可上线的样式而非占位符

这其实是一种“嵌入式设计规范”,对使用 Tailwind / Ant Design / Chakra UI 等库的项目尤为有效。


三、实战演示:用中转站 AI 快速搭一套“本地 Mythos Agent”

下面用 Python + 薛定猫 AI 的 OpenAI 兼容 API,演示一个最小可用的 Mythos 风格编码 Agent。
默认模型使用:claude-sonnet-4-6(你也可以替换为自己偏好的模型 ID)。

3.1 安装依赖

pipinstallopenai python-dotenv

3.2 环境变量配置

在项目根目录创建.env

XUEDINGMAO_API_KEY=你的_API_Key XUEDINGMAO_BASE_URL=https://xuedingmao.com/v1

3.3 定义 Mythos 系统 Prompt

# mythos_prompts.pyKING_MODE_SYSTEM_PROMPT=""" 你是一个“有纪律的资深工程 Agent”,专注于: - 中大型代码改造 - 新功能从 0 到 1 搭建 - 长任务的规划与持续迭代 请严格遵守: 1. 先思考,后输出。所有任务必须先给出“分步计划”,再执行。 2. 禁止含糊:不要说“也许”“可能”“你可以自己查文档”一类话。 3. 对于代码相关任务,输出结构必须包含: - PLAN: 任务拆分 - IMPLEMENT: 具体代码(标明文件路径) - VERIFY: 如何验证功能完成(命令 / 测试用例 / 手工步骤) 4. 当信息不足时,必须列出需要澄清的问题,而不是胡乱假设。 5. 你更倾向于重构和改进,而不是一次性“写完就走”。 你的目标不是“回答问题”,而是“让功能真正可用”。 """FRONTEND_DESIGN_SKILL_PROMPT=""" 你具备资深前端设计能力。对于 UI 相关任务: - 必须考虑: - 信息层级(层级清晰、主次分明) - 排版(字体大小、行高、对齐方式) - 视觉节奏(间距、行距、块之间的留白) - 输出组件/页面时: - 使用一致的设计系统(例如 Tailwind 的 spacing/typography 规范) - 避免默认黑白 + 无脑灰色按钮 - 给出可直接上线的样式,而非“TODO: beautify UI” 在给出代码前,请简要说明你的视觉决策(例如:为什么使用某个布局 / 配色 / 字号)。 """GSD_WORKFLOW_PROMPT=""" 你正在执行 GSD(Get Shit Done)工作流: - 目标:完成一个“可用的功能”,而不是“几段代码”。 - 对每次迭代,你需要: 1)明确当前子目标 2)说明你要修改/新增的文件 3)给出变更内容 4)给出我应该执行的验证步骤(命令、预期结果) 5)等待我把实际运行结果 / 错误日志反馈给你,再继续调整 请用“GSD-STEP”小节显式标注当前迭代步骤。 """

3.4 核心调用代码:本地 Mythos Agent

# mythos_agent.pyimportosfromdotenvimportload_dotenvfromopenaiimportOpenAIfrommythos_promptsimport(KING_MODE_SYSTEM_PROMPT,FRONTEND_DESIGN_SKILL_PROMPT,GSD_WORKFLOW_PROMPT,)load_dotenv()# 初始化 OpenAI 兼容客户端(指向薛定猫 AI)client=OpenAI(api_key=os.getenv("XUEDINGMAO_API_KEY"),base_url=os.getenv("XUEDINGMAO_BASE_URL","https://xuedingmao.com/v1"),)MODEL_NAME="claude-sonnet-4-6"# 默认模型,可替换为其他已开通的模型 IDdefbuild_mythos_system_message(need_frontend:bool=False,enable_gsd:bool=True,)->str:""" 根据当前任务类型动态组合系统 Prompt: - King Mode:基础纪律约束 - Frontend Skill:需要 UI 设计时启用 - GSD:需要完整功能闭环时启用 """parts=[KING_MODE_SYSTEM_PROMPT]ifneed_frontend:parts.append(FRONTEND_DESIGN_SKILL_PROMPT)ifenable_gsd:parts.append(GSD_WORKFLOW_PROMPT)return"\n\n".join(parts)defmythos_chat(user_task:str,need_frontend:bool=False,enable_gsd:bool=True,)->str:""" 调用薛定猫 AI 的 Chat Completion,执行一次 Mythos 风格对话。 :param user_task: 用户的任务描述(例如:实现某个功能) :param need_frontend: 是否需要前端设计能力 :param enable_gsd: 是否使用 GSD 工作流结构 :return: 模型输出的文本 """system_prompt=build_mythos_system_message(need_frontend=need_frontend,enable_gsd=enable_gsd,)response=client.chat.completions.create(model=MODEL_NAME,messages=[{"role":"system","content":system_prompt},{"role":"user","content":user_task,},],temperature=0.2,# 偏低温度,增强可控性)returnresponse.choices[0].message.contentif__name__=="__main__":""" 示例:让 Mythos Agent 生成一个带基础 UI 的“电影收藏小工具”: - 支持登录 - 可以保存/删除电影 - 状态可持久(哪怕列表为空也有合理展示) """user_task=""" 我想用 React + Tailwind 做一个简单的“电影收藏”单页应用: - 用户可以用邮箱+密码伪登录(前端本地模拟,不接真实后端) - 可以搜索电影并添加到“收藏列表” - 收藏列表支持删除 - 页面要有: - 顶部导航(应用名 + 登录状态) - 左侧搜索区域 - 右侧收藏列表 - 空列表时要有合理的空状态文案和视觉设计 请按你的 King Mode + GSD 工作流来执行: - 先给出 PLAN - 再给出关键组件的实现代码(标明文件名) - 再给出我在终端需要执行的验证步骤 """output=mythos_chat(user_task,need_frontend=True,# 需要前端设计能力enable_gsd=True,# 使用 GSD 工作流)print(output)

说明:

  • 这段代码已经可以直接运行,只需替换.env中的XUEDINGMAO_API_KEY
  • Mythos Agent 会按照我们设计的系统 Prompt:
    • 先输出任务拆分(PLAN)
    • 再输出带 UI 设计说明的 React+Tailwind 代码
    • 再给出npm命令 / 验证步骤
  • 你可以把运行错误(例如编译失败、TypeScript 报错)再喂回去,形成视频里所说的“长任务迭代”。

四、注意事项与实践建议

1. 这不是魔法,垃圾需求照样出垃圾结果

  • 如果你的需求描述模糊:
    • “帮我做个管理后台,漂亮一点就行”
  • 模型再强、工作流再精巧,也只能无限脑补。

实践建议:
在给 Mythos Agent 输入任务时,把自己当产品经理,至少写清楚:

  • 核心用户路径(登录 / 操作 / 结果)
  • 关键约束(技术栈、浏览器支持、性能要求)
  • 验收标准(能算作“完成”的条件)

2. 不要对所有小任务都开“全神装”模式

视频中明确提醒:

  • 重命名变量、调个按钮颜色,不要套整套 Mythos 栈
  • 这类小任务直接调用轻量模型快速改就够了

合理用法:

  • 小变更:直接对话 / 轻量系统 prompt
  • 中大型改造 / 新功能:King Mode + GSD +(可选)前端设计

3. 合理选择模型与平台

在工程实践中,模型质量只是一个维度,更现实的问题是:

  • 模型更新速度如何?
  • 能否一次接入,多模型切换?
  • API 是否兼容主流 SDK / 客户端?

(xuedingmao.com)对开发者比较友好的点在于:

  • 聚合500+ 主流大模型:包括 GPT-5.4、Claude 4.6、Gemini 3 Pro 等;
  • 新模型几乎是实时首发,可以第一时间尝试最新能力;
  • 对外暴露的是OpenAI 兼容接口
    • 只要替换base_url+api_key,几乎不用改现有代码;
    • 对于需要同时调用多家模型的 Agent/评估/重排场景,集成成本非常低。

在搭建类似 Mythos 这种“强工作流 + 多模型组合”的系统时,统一的 API 层可以显著降低后期维护成本。


五、技术资源与延伸方向

如果你想把本文的 Demo 往更实用方向扩展,可以考虑:

  1. 增加文件读写工具
    • 结合本地文件系统,允许 Agent 直接修改项目代码
  2. 集成测试执行工具
    • 让 Agent 自动运行pytest/vitest/playwright等,并解析结果
  3. 引入简单的记忆机制
    • 把关键设计决策写入一个DECISIONS.md,每轮对话前注入上下文,避免“遗忘历史选择”
  4. 多模型分工
    • 便宜模型负责:代码搜索/重命名/格式化
    • 强模型负责:架构设计/复杂调试/跨文件大改造

这些都可以基于薛定猫 AI 的统一接口实现,不需要针对每家厂商单独写一套 SDK 封装。


小结

通过 GLM Mythos 思路可以看到:
真正的“超模体验”,是模型 + Prompt + 工具 + 工作流的系统工程,而不是单纯买最贵的订阅。

落到代码层面,你完全可以:

  1. 选一个性价比高的模型(如薛定猫 AI 上的 claude-sonnet-4-6 / 其他你熟悉的模型)
  2. 用 King Mode 强化“纪律性”
  3. 用 GSD 工作流,确保从“生成代码”走向“交付功能”
  4. 用前端设计 Prompt,让产出的 UI 更“能见人”

做到这一点,你的三美元 Agent,体验上会非常接近现在宣传中的“神话版”。


#AI #大模型 #Python #机器学习 #技术实战

http://www.jsqmd.com/news/558982/

相关文章:

  • UICKeyChainStore最佳实践:避免常见陷阱的10个技巧
  • springboot+vue基于web的高校实验室管理系统
  • AI智能二维码工坊后端对接:REST API接入业务系统指南
  • 全志T3核心板DDR初始化失败:从ZQ校准误导到VREF电压偏差的排查实录
  • Python如何清空回收站
  • Qwen3-ForcedAligner-0.6B惊艳效果:演唱会现场音频人声分离后对齐演示
  • Next-Shadcn-Dashboard-Starter 响应式布局与移动端适配终极指南:打造完美跨设备体验
  • 灵感画廊部署教程:基于diffusers+transformers的SDXL 1.0轻量集成
  • 启动类故障解决方案:使用SMUDebugTool解决系统启动失败的3个实用技巧
  • TSDoc贡献指南:如何为开源文档标准做出贡献的完整教程
  • Wan2.2-I2V-A14B入门教程:Python零基础到实现第一个图像转视频应用
  • 3步轻松备份微信聊天记录:WeChatExporter全攻略
  • 如何快速诊断dynamic-datasource JVM线程问题:JStack实战指南
  • NodeJS进程管理与集群部署:实现高可用服务器架构的终极指南
  • 从零到一:我的超外差收音机DIY实战与调试心法
  • 绝地求生罗技鼠标宏配置终极指南:从新手到高手的压枪技巧
  • Qwen3.5-4B模型智能体(Agent)开发入门:基于Dify平台
  • 高效获取Sketchfab 3D资源:Firefox专属下载工具使用指南
  • VS Code效率神器:用Todo Tree插件打造个性化待办追踪系统(附团队协作配置)
  • 通义千问3-Reranker-0.6B实战应用:智能客服问答排序系统搭建
  • RTX 4090专属SDXL 1.0工坊应用场景:IP形象多角度延展设计
  • Phi-3-mini-128k-instruct惊艳效果:万字产品需求文档→PRD大纲+功能列表+测试点
  • 【教程4>第12章>第3节】基于FPGA的图像缩放实现——图像缩小verilog实现
  • C语言调用SiameseUIE:嵌入式NLP开发指南
  • 猫抓:重构网页资源获取与媒体管理的高效解决方案
  • 通义千问3-Embedding部署指南:vLLM自动批处理配置技巧
  • 影墨·今颜小红书模型企业级部署架构设计:高可用与弹性伸缩
  • bert-base-chinese详细步骤:如何将test.py改造成支持流式文本处理的微服务
  • 终极视频硬字幕提取指南:本地OCR识别87种语言的完整解决方案
  • WeMod Pro功能解锁开源工具深度评测:双方案技术原理与实施指南