当前位置：首页 > news >正文

从“会聊天“到“能干活“：用 OpenCode 给自己找个 AI 搭子

news 2026/6/24 5:38:25

你肯定有过这种感觉：

和 AI 聊了半天，说的都对，但就是落不了地。

让它写文案，改了五版还是不对味；让它分析问题，分析得头头是道但解决不了；让它帮忙整理资料，它说"你把资料贴给我"——你有几十份资料，贴到什么时候？

问题出在哪？

出在你一直在和 AI聊天，从来没让它真的干活。

聊天框里的 AI，再聪明也只是"嘴上说说"。真要做事，你得给它找一个能干活的地方。

这篇文章，我们就来聊聊这件事。

一、为什么聊天框里的 AI 干不了活

先打破一个常见误解：不是 AI 不够聪明，是你把它放错了地方。

你想想，一个人再能干，你把他扔在一个空房间里，只给一部手机跟他聊天，他能干成什么事？

他看不到你的文件，用不了你的工具，不知道你的规矩。

他除了跟你聊天，啥也干不了。

AI 也是一样。聊天框里的 AI，就像被关在空房间里的人——它只有你刚说的那几句话，别的什么都不知道，什么都碰不到。

那要让 AI 真的干活，得给它什么？

说穿了就三样。

第一，它得能看到你的资料。不用你每次手动粘贴，它自己能找、能翻、能读。

第二，它得能用你的工具。能改文件、能跑命令、能接外部系统，不是光嘴上说。

第三，它得知道你的规矩。做事的方式是什么、输出的格式是什么、什么能做什么不能做，心里得有数。

有了这三样，AI 才从"陪你聊天的"变成"跟你一起干活的"。

二、OpenCode 是什么

OpenCode 就是这么一个能让 AI 真干活的地方。

你可以把它理解成——给你的 AI 搭子准备的一张工作台。

这张工作台上，有它干活需要的所有东西：

你的项目文件、代码、文档，它都能看到；
读写文件、执行命令、调用工具，它都能做；
你定的规矩、写的 AGENTS.md，它会照着来。

感兴趣的话，可以直接去看官方文档，这里就不多展开了，我们重点说——为什么有了这张工作台，AI 就能干活了？

听起来好像也没什么特别的？不就是个 AI IDE 吗？

不对。

区别在于——聊天框里的 AI 是被动的，你问一句它答一句；OpenCode 里的 AI 是主动的，你给它一个目标，它会自己想办法做完。

你给它一个目标，它会自己拆步骤、自己动手、自己检查，做完了告诉你结果。中间走偏了它会自己调整，做错了它会自己修正。

这就是 Agent 的执行闭环——目标、计划、行动、观察、修正、验证。

聊天框里没有这个闭环。你说一步，它走一步。你不说，它就停着。

这不是"更强的 AI"，这是不同的工作方式。

就像同一个人，在路边跟你唠嗑是一个状态，坐在工位上干活是另一个状态。人还是那个人，环境变了，行为模式就变了。

三、跟着跑一遍：让搭子帮你整理项目文档

说再多不如跑一遍。

我们拿一个所有人都能理解的场景来试：让 AI 帮你整理一个项目的 README。

别小看这个任务——它包含了读文件、理解项目结构、组织语言、输出结果，是一个完整的小闭环。

第一步：告诉搭子你要做什么

打开 OpenCode，选好你的项目目录，然后说一句话：

帮我把这个项目的 README 重新整理一下。按"项目定位、目录结构、快速开始、维护约定"四段来写，语言要简洁，不要废话。

就这么一句话。

注意，你不需要把项目介绍一遍，也不需要把文件贴给它。

为什么？因为它自己能看到工作区里的文件。

这就是和聊天框最大的区别。

第二步：看搭子怎么干活

说完之后你就看着——

它会先翻一翻项目里的文件，看看这是个什么项目；
然后它会读现有的 README，看看写了什么、缺了什么；
接着它会根据项目结构，重新组织内容；
最后它直接改 README 文件，改完告诉你哪里改了、为什么这么改。

整个过程，你不用插一句话。

它自己找资料、自己判断、自己动手。

你最后做一件事就行：检查结果，告诉它哪里不对。

第三步：你验收，它修改

如果你觉得哪段不对，直接说：

第三段"快速开始"写得太简单了，把环境要求也加上，再补一个常见问题列表。

它马上就改。

改完再给你看，你再验收。

来来回回几次，直到你满意为止。

发现没有？这才是搭子的感觉——不是你问一句它答一句，是你们一起把一件事做完。

四、这个搭子为什么能干活？

看到这你可能会说：不就是 AI 能读文件吗？有什么了不起的？

还真不只是"能读文件"。

能读文件只是第一步，真正让它从"聊天的"变成"干活的"，是三件事同时凑齐了：

看得见你的资料、用得了你的工具、知道你的规矩。

缺了任何一样，它都干不了活。

先说看得见资料这件事

还记得我们前面说过，AI 每次只能"看一张纸"吗？

那张纸上有什么，直接决定了它能干成什么样。

聊天框里的 AI，那张纸上只有你刚敲进去的几句话——你不说，它就不知道。你不贴资料，它就没资料可用。

OpenCode 里的 AI 呢？

那张纸上塞得满满的——整个项目的目录结构它扫得到，README 它读得到，代码文件它翻得着，你写的 AGENTS.md 它也看在眼里，甚至前面聊了什么它都记得。

完全不是一个量级的上下文。

所以你不用反复解释"这个项目是干嘛的"，不用把资料一份份贴给它，不用每次从头讲背景。

它自己找、自己看、自己用。

这事儿说穿了不值钱，但真用起来差别巨大——就像你跟一个完全不了解情况的人聊天，和跟一个已经在项目里待了半年的同事聊天，效率能一样吗？

再说用得了工具这件事

光有资料还不够。

你让它整理文档，它总不能在聊天框里给你"口述"一遍怎么改吧？你还得自己复制粘贴、自己找文件、自己改。

那叫什么干活？那叫你指挥，它出主意，最后活还是你干。

在 OpenCode 里不一样——它有手有脚。

读写文件是基础操作，改代码、跑命令都不在话下。你让它整理 README，它直接就把文件改好了，你打开看就行，不用你手动搬运。

这还只是最基础的 Tool。

再往上一层是 Skill——比如它知道怎么按你的风格整理文档，怎么对齐团队的代码规范，怎么做代码审查。这些不是天生就会的，是别人把经验封装好，变成了 AI 能调用的专业能力。

再接上 MCP 就更夸张了——它能直接连你的飞书、连你的数据库、连你公司的内部系统。你让它"把整理好的文档发去飞书群"，它直接就发了，不用你下载下来再上传。

你看，AI 从"会说"到"会干"，中间差的不是更聪明的大脑，是能碰到真实世界的手和脚。

最后是知道规矩这件事

有资料、有工具，就一定能干好活吗？

不一定。

你肯定遇到过这种情况：明明说清楚了要干嘛，结果 AI 给出来的东西就是不对味——格式不对、风格不对、重点也不对。

为什么？因为它不知道你的规矩。

你说"帮我整理一下文档"，你心里的"整理"是"按我们团队的模板来，分四个部分，语言要简洁"，但 AI 理解的"整理"可能是"把内容重新排一排，加点润色"。

信息差就在这里。

那规矩怎么来？

小规矩，写在你说的那句话里。比如"按四段来写，语言要简洁"——这就是单次任务的契约，你写清楚了，它就按这个来。

大规矩，写在 AGENTS.md 里。比如这个项目用什么架构、代码风格是什么、提交信息怎么写、文档模板长什么样——这些长期有效的规矩，写一次，AI 每次都照着来。

小契约 + 大契约，合起来就是 AI 做事的边界。

边界越清楚，它干的活越靠谱。

边界越模糊，它就越容易"自由发挥"——发挥出来的结果嘛，大概率不是你要的。

这也是为什么我们前面说，别再找 Prompt 模板了——模板解决不了根本问题。根本问题是，你有没有把任务的边界、格式、验收标准，清清楚楚地告诉 AI。

在 OpenCode 里，这个逻辑被放大了。

不止 Prompt 是契约，整个工作区的规则都是契约。

五、这个搭子还能干嘛？

整理 README 只是最简单的一个例子。

只要你愿意试，它能帮你干的活多了去了。

随便说几个日常能用的：

一堆杂乱的笔记扔进去，让它按主题分类整理，最后给你一个索引；会议录音转成文字稿了，扔给它，帮你提炼成结构化的会议纪要，谁要做什么、deadline 是什么，列得清清楚楚。

改简历、改文案、改邮件这种事就更不用说了——你把你要的风格告诉它，它帮你调，来来回回改几版，总能找到你想要的感觉。

甚至你读一篇长文章嫌累，扔给它，让它给你总结核心观点，有什么具体问题直接问，它能在文章里找答案给你。

如果你是工程师，那用法就更多了。

刚接手一个新项目？让它帮你梳理代码结构，把核心流程和关键模块给你讲明白，比自己瞎翻代码快多了。

写代码的时候，跟它说清楚这个项目的架构约定和代码风格，它写出来的东西至少在格式和结构上不会跑偏。

出 Bug 了？把报错信息和相关代码扔给它，让它帮你定位问题、分析原因、给出修复思路——不一定每次都对，但至少能给你一个方向，比自己闷头想快。

还有写单元测试、写接口文档、做代码审查……这些重复劳动，都可以丢给它先打个底，你最后过一遍就行。

当然，不是说 AI 什么都能干。

它能干得好的，都是那些有明确目标、有明确规则、结果能验证的事。

越是模糊的、需要拍板的、没有标准答案的事，它越干不好——至少现在还不行。

但话说回来——我们每天的工作里，有多少是真正需要"拍板定方向"的？

大部分时候，我们缺的不是创意，是有人帮我们把那些繁琐但重要的事，踏踏实实干完。

这就是搭子的价值。

六、普通人怎么上手，工程师能玩多深

不同的人，用这个搭子的方式完全不一样。

如果你只是想用它省点时间，不用学什么复杂的东西，记住三件事就够了。

第一件事：别啥都在一个对话框里聊。

写文章就在文章的工作区，做项目就在项目的工作区，个人生活的事单独开一个。不同的事放不同的地方，搭子才不会搞混。

第二件事：说清楚你要啥。

别只说"帮我整理一下"——整理成什么样？给谁看？要多长？按什么结构？

你说得越清楚，它干得越靠谱。你模棱两可，它就只能瞎猜。

第三件事：会验收，会提修改意见。

第一版不满意太正常了，别用了一次觉得不行就放弃。

你告诉它哪里不对、要怎么改，它马上就能调。来来回回几次，总能调到你想要的样子。

就这三件事，不用学编程，不用懂技术，普通人都能用好。

如果你是工程师或者想玩得更深一点，那能折腾的东西就多了。

最基础的，你可以给每个项目写一份 AGENTS.md，把这个项目的架构约定、代码风格、提交规范都写进去。写一次，以后 AI 在这个项目里干活都会照着来。

再进一步，你可以写自己的 Skill。什么意思呢？就是把你擅长的工作方法、检查清单、专业流程，封装成 AI 能调用的能力。以后它干活就用你的方法，而不是它自己瞎摸索。

再接上 MCP 呢？它就不只是你代码里的搭子了——它能直接操作你的数据库、调用你的接口、发消息到飞书、查 Jira 工单。整个研发流程里的重复劳动，都可以交给它。

玩到最后，你甚至可以搭多 Agent 工作流。一个负责写代码，一个负责做审查，一个负责写文档，各司其职，你最后拍板就行。

从"用它省点时间"到"让它帮你搭一个 AI 团队"，中间的空间很大。

你想走多远，就看你自己了。

写在最后

回到开头的问题：为什么你和 AI 聊天总觉得差点意思？

因为 AI 的价值从来不在聊天里，而在做事里。

你不需要一个更能聊的 AI。

你需要的是一个能跟你一起把事做成的搭子。

未来真正会用 AI 的人，不一定是最会"写 Prompt"的人，也不一定是最懂技术的人。

而是最懂得怎么给 AI 找对位置、定好规矩、分好工的人。

就像找搭子一样——不是找最厉害的，是找最合适的、能一起把事干成的。

下一篇，我们聊一个更深入的问题：这个搭子干完了活，它能记住吗？难道每次都要从头开始？

这就是分层记忆要解决的事。

关于 ArchAIHarness

这篇文章是「看懂 AI 与智能体」专栏的一部分，由ArchAIHarness持续输出。

ArchAIHarness 是一套面向 AI 时代软件工程的人机协同架构哲学与公开工程资产，主张：

架构师定义秩序，AI 在秩序中生长。人立法，AI 执行，体系审计。

如果你认同这套思路，欢迎到 GitHub 上跟进我们的工程样例、AI 协作工具和长期方法论沉淀：

组织主页：https://github.com/ArchAIHarness
方法论沉淀：docs
工程样例：framework｜gateway
AI 协作工作流：agent-workflows

Engineered by Architects · Empowered by AI · Audited by Discipline

查看全文

http://www.jsqmd.com/news/1070915/

【收藏夹必备】写博文还在用“●“做列表？这些图标让文章质感翻倍！

【硬核长文】万字拆解无线网络核心：AP（无线访问接入点）从底层原理到企业级实战调优指南

HoRain云--R语言列表操作全指南：从入门到精通

无人机遥感国土目标检测数据集无人机耕地数据集无人机道路农田检测国土遥感地物实例分割数据集 yolo数据集第10759期

五、进程控制

程序员面试翻车？我用了两个月测遍AI面试工具，最终只推荐这一个

Redis...2

影刀RPA新手教程：零基础入门完全指南——从下载安装到独立开发你的第一个自动化流程

Ntk-aware 插值

医疗AI多模态学习：M-IDoL框架突破信息模糊困境

流体-结构耦合与声子亚表面在湍流减阻中的应用

反射的定义、使用方式、优缺点和具体使用场景

RFID 仓库管理系统项目总结

基于用户画像的AI内容生成与安全检测闭环系统实践

外部中断EXTI和NVIC

模块化驱动架构，升级不再怕冲突

高级java每日一道面试题-2026年02月26日-实战篇[Docker]-如何实现镜像的合规性检查（如金融行业的基线要求）？

智能体进化与上下文管理：GA如何通过失败升级与内存压缩实现高效学习

【日耕一题】7. 循环右移（2026第17届蓝桥杯C++B组省赛 C 题）

MyBatis SQL映射配置全解析：XML配置、动态SQL与注解驱动深度实战指南

问卷也能做高颜值？问卷星、金数据等5大平台美工设计能力实测

教育视频摘要技术TR-EduVSum的创新与应用

基于近红外与隐式神经表示的低光图像去噪：频率解耦融合技术详解

大模型内省适配器：基于LoRA的可解释性微调实践

微服务链路追踪的智能采样：从随机到语义感知的演进与实践

伪装目标检测模型W4A4量化实战：TDQ策略实现极致压缩与高效部署

激活值重计算，显存换时间的策略选择

基于VLM与多源数据的故事板智能生成：从原理到工程实践

C# 实现 HTTP 服务器

Human-in-the-Loop 场景应用