当前位置: 首页 > news >正文

12万Star的Karpathy skills:四原则修正 LLM 编码行为

项目地址:https://github.com/forrestchang/andrej-karpathy-skills
许可证:MIT
核心文件:单个 CLAUDE.md


一、项目背景

Andrej Karpathy 在社交媒体上指出了 LLM 编码的三大顽疾:模型替你做错误假设然后一错到底、过度复杂化代码和抽象、作为副作用随意删除或修改它不完全理解的代码。本项目将 Karpathy 的观察浓缩为四条原则,写入一个 CLAUDE.md 文件,直接修正 Claude Code 的行为模式。

与试图"拥有流程"的框架(GSD、BMAD 等)不同,这套指南偏向谨慎而非速度,通过约束代理行为而非接管流程来提升输出质量。

二、四大原则

原则一:Think Before Coding(先想后写)

核心:不要假设,不要隐藏困惑,呈现权衡。

LLM 倾向于默默选择一种解释然后一路跑下去。本原则强制代理进行显式推理:不确定时主动提问而非猜测;存在歧义时呈现多种解读而非静默选择;更简单的方案存在时必须反推;困惑时停下来命名不清楚之处并请求澄清。这一原则将"事后修正"转化为"事前对齐"。

原则二:Simplicity First(简单优先)

核心:用最少的代码解决问题,不做投机性开发。

对抗过度工程化的倾向:不实现未被要求的功能,不为单次使用的代码创建抽象,不添加未被请求的"灵活性"或"可配置性",不为不可能发生的场景写错误处理。检验标准:一个资深工程师会说这段代码过度复杂吗?如果是,就简化它。

原则三:Surgical Changes(外科手术式变更)

核心:只触碰必须触碰的代码,只清理自己制造的混乱。

编辑现有代码时:不"改进"相邻代码、注释或格式;不重构没坏的东西;匹配已有风格;发现无关死代码时只提及不删除。变更产生孤立项时:移除自己的变更导致的无用导入/变量/函数,但不删除预先存在的死代码。检验标准:每一行变更都应能追溯到用户请求。

原则四:Goal-Driven Execution(目标驱动执行)

核心:定义成功标准,循环直至验证。

将命令式任务转化为可验证目标:“添加验证” → “为无效输入写测试,然后让测试通过”;“修复 bug” → “写一个能复现的测试,然后让测试通过”;“重构 X” → “确保重构前后测试通过”。多步任务要求声明简短计划,每步附带验证检查点。强成功标准让 LLM 独立循环,弱标准则需要不断人工干预。

三、安装方式

方式命令适用场景
Claude Code 插件(推荐)/plugin install andrej-karpathy-skills@karpathy-skills跨项目全局生效
CLAUDE.md(新项目)curl -o CLAUDE.md <raw-url>单项目使用
CLAUDE.md(已有项目)追加到现有 CLAUDE.md与项目规则合并
Cursor使用.cursor/rules/karpathy-guidelines.mdcCursor 用户

四、效果验证

指南生效的标志:diff 中不必要的变更减少;因过度复杂导致的重写减少;澄清问题出现在实现之前而非之后;PR 干净最小,无顺手重构或"改进"。

五、适用与不适用

适用于大多数需要 AI 代理修改代码的场景,尤其是代码审查和协作开发。对于简单的 typo 修复或显而易见的单行变更,可酌情跳过完整流程——指南偏向谨慎,但不意味着每个变更都需要全套仪式。


http://www.jsqmd.com/news/795746/

相关文章:

  • Simulink给STM32做自动代码生成?我实测了F4和H7系列,这些坑你得提前知道
  • 2026遥感、地球科学与人工智能国际学术会议(RSGAI 2026)
  • FFXIV TexTools终极指南:打造《最终幻想14》专属视觉体验的三大核心模块
  • 闲鱼自动化脚本开发实战:基于uiautomator2的UI自动化与风控对抗
  • Go语言技能树构建:从知识体系到评估引擎的工程实践
  • Teamcenter 13 部署实战:从零到一构建企业级PLM环境
  • 从HIDL到HAL3:手把手拆解Android相机Provider进程的通信与数据流转
  • Real-ESRGAN-GUI:免费开源AI图像增强工具,让模糊照片重获高清新生
  • 压力语音的声学特征与识别技术解析
  • 终极指南:快速解决FanControl风扇识别故障的完整方案
  • 5分钟搭建Windows免费Syslog服务器:零基础网络日志监控指南
  • Python2.7采集OPC-DA数据性能优化实战:从单点读取到Group批量处理的效率飞跃
  • ARM调试与数据缓存维护指令详解
  • 别再手动画了!用Excel表格5分钟搞定Xilinx/Altera FPGA的ORCAD原理图库
  • 如何快速下载在线视频:Chrome插件的终极免费工具指南
  • SpringBoot+Vue 实验室管理系统 前后端分离 计算机毕设
  • Pix2Text:从图片到Markdown,一键解锁技术文档数字化新体验
  • 从基础到高级RAG:检索增强生成系统的核心优化策略与实践
  • 解放你的音乐资产:ncmdumpGUI让网易云NCM文件重获自由
  • 3步开启你的三国杀网页版:随时随地体验经典策略对决
  • 字面量struct{}代表了什么?又有什么用处?-Go语言
  • YOLOv5网络结构里的‘分辨率魔术’:从608到640,输入尺寸如何悄悄改变你的特征图与Anchor分配?
  • 深度解析VinXiangQi:基于YOLOv5的智能象棋连线工具实战指南
  • 用Python玩转AD7606:一个Python包搞定八通道高速数据采集(附避坑指南)
  • Linux 新硬件适配实战:为 Realtek 8852 WiFi6 网卡手动编译驱动(Ubuntu/Manjaro 双教程)
  • 嵌入式Linux开发避坑:手把手教你交叉编译全套WiFi工具链(iw、wpa_supplicant、hostapd)
  • 如何在Windows上轻松实现多设备文件同步:SyncTrayzor完整使用教程
  • D2DX终极指南:让经典暗黑破坏神2在现代PC上焕然一新的5个步骤
  • 2026年亲测收藏:7款免费降AI率工具汇总,论文高效降AI轻松过知网! - 降AI实验室
  • Python量化交易实战:基于pyalgostrategypool的策略开发与部署全流程