【笔记】用cursor手搓cursor(二)也就是龙虾育种
“养龙虾”是个时尚词了,作为技术人我们还是要找到源头——“龙虾育种”,就是写龙虾。其实cursor你把它的run command设置为allow all,它就是一个大龙虾…
写了几天的龙虾,思考了一下以后的广义程序员。
系列(一)里我们提到了symbolic系统,其实这个symbolic系统就是定义了一套逻辑,或者我们叫算法。以后的程序员还是在写算法,但是还是会分为一部分底层coding,一部分app level;而app level这一部分有所变化,原来app level也要coding,现在变成和LLM集成。我们需要写一些大的步骤,然后这些大的步骤中将LLM当胶水。而这部分胶水就可以交给能力较弱的小LLM,比如4-9B模型。大模型负责和人一起写逻辑算法。比如你要debug,具体的过程是什么,这个是人需要去定义并且明确写出来的,然后机器就按照这个步骤去执行,还是有if有for,所以今后程序员工作的本质依旧保持在那里。
手搓的cursor就是“龙虾”。我们要做的是给龙虾加workflow的安排,让它和symbolic集成。让它能真的去完成任务。比如医学学习,我们给它接好浏览网页的接口,它需要学习并总结医学知识的items,并总结出一些规律,让这些规律配上references;这样我们去读去学习的时候,直接拿结论就好了,至于要深究就看references,节省很多时间。龙虾在workflow里第一个就是sandbox,可以用qemu、kvm、gvisor、docker、wasm等作sandbox,这里也就是各路opensource的方法,也可以加入审核机制,对command run,作用域外文件读写进行approve,一旦有这些危险操作,就要pause workflow等待人为审核然后继续。而接多少api多少app那都是体力活,以后LLM能分分钟搞定的就不用太花心思去弄了,但是想出圈玩出花吸引用户,这个integration是必须的。我就自己造龙虾养起来一起学习就不用花哨的东西了。至于workflow,也就是定义各种function,每一步function要作哪些步骤,产出是什么,写到黑板或者记忆存储中。之后就是从一个main开始,像单步调试一样运行这个龙虾。让龙虾死循环就是一直运行下去到天荒地老了。中间当然得加入各种restart recovery机制。好了,是不是和编译系统接上了,从main的步骤开始运行,运行跳转就是一个function call,需要context switch,需要call stack,也都是同样的知识,只是迁移过来继续用罢了。所以新时代会写程序还是会写程序,不会写的还是不会,因为这是领域知识。
写完龙虾,让大模型生成了几个workflow的模板,处理下我的医书。因为是qwen3.5 9B,还是有点慢的,还是在我的windows上。得想想去搞一个mac studio了,并行运行十几个9B,效率应该可以快不少。
后续还要让龙虾自己改进workflow,并且加入belief系统,开始使用beyasian network了。之后还要再琢磨琢磨voyager,就是nvida那个让gpt-4o从0开始教LLM玩minecraft我的世界。这样整个workflow就可以形成自我改进得闭环,为了让workflow改进更好,一定是还要evolutonary algorithm的。之后就是进军mutliple agents,看看系统间如何协作了。
AI时代对于程序员来说没啥好可怕的,至少对于知识来说。9B怕是要训练起来也很慢的,最初网上的的养虾人要过几年才能真正见效果,会养的还是很有前景的,但是得解决诸如RAG碎片的问题后面需要通过belief系统进行content清洗的。而龙虾最近排队装再排队卸载的,只是被技术壁垒挡住了路退出了。我的观点还是未变的,未来symbolic专家系统会以另一种方式回归,从龙虾开始。
