当前位置: 首页 > news >正文

基于Claude Code构建个人操作系统:无代码自动化与AI协作实践

1. 项目概述:一个极简的“个人操作系统”

最近在折腾AI自动化工具,发现了一个很有意思的项目,叫personal-os,简称pos。这玩意儿本质上就是一个Bash脚本,但它做的事情,是把Claude Code这个AI编程助手,变成了一个能帮你处理日常琐事的“个人操作系统”。你可以把它理解成一个极度简化、极度个人化的“贾维斯”。

它的核心哲学非常吸引我:“大多数代码只是缓存”。什么意思呢?我们平时用的那些成熟软件,比如日历、邮件客户端、自动化脚本,里面包含了大量为了应对各种通用场景而写的代码。但对你个人而言,你可能只用到了其中10%的功能,却要承担100%的复杂度和维护成本。pos反其道而行之,它本身几乎不包含任何功能代码。它只有一个精心设计的系统提示词(System Prompt),用来引导Claude Code。当你需要什么功能时——比如需要一个自动登录网站查数据的脚本,或者需要一个定时给你发微信提醒的接口——你直接告诉pos你的目标,它会现场指挥Claude Code,为你生成一个完全贴合你当前需求的、一次性的、可执行的代码片段。

这就像你有一个随叫随到的全能程序员(Claude),而pos就是那个知道如何最好地管理、引导这个程序员的“项目经理”或“产品经理”。它负责记住你的习惯(持久化存储),管理任务队列(比如定时任务),并提供与外部世界交互的“接口”模板(比如如何发短信)。所有的具体实现代码,都是按需生成、用完即弃的。这种模式带来的好处是极致的轻量和灵活,坏处就是初期需要你花更多时间和AI“沟通”来调教它,没有开箱即用的丰富插件。

2. 核心设计思路与哲学:为什么选择“无代码”架构

2.1 从“预制软件”到“即时生成代码”

传统的自动化方案,无论是IFTTT、Zapier,还是功能更强大的本地方案如OpenClaw,走的都是“预制集成”路线。开发者预先写好连接A服务和B服务的代码,打包成模块或技能(Skill),用户通过配置界面来组合使用。这就像去宜家买家具:选择多、组装相对简单,但尺寸和样式是固定的,要完全贴合你家墙角那个不规则的空间,可能就得自己锯木头了。

pos走的是另一条路:“即时生成代码”。它不预装任何“家具”,而是带着一个“万能工具箱”(Claude Code)和一个“顶级设计师”(系统提示词)上门。你描述需求(“我这里有个角落,需要个柜子,高80cm,深30cm,左边要开门,右边要三个抽屉,颜色要和地板搭配”),设计师现场画图,工具箱现场制作。这个柜子完美贴合你的空间,但也仅适用于你的空间。下次需求变了,就再做一套。

这种设计的优势非常明显:

  1. 无限灵活性:理论上,只要Claude Code能理解和生成相关代码,pos就能操作任何有API或无API(通过浏览器模拟)的软件或网站。没有“不支持”列表。
  2. 零依赖负担:项目本身就是一个10KB的Bash脚本。没有node_modules黑洞,没有复杂的Python包冲突,没有版本兼容性问题。环境极其干净。
  3. 完全透明与可控:所有为你生成的代码,都以文本形式保存在本地。你可以随时审查、修改、学习。你清楚地知道在每一个环节,AI对你的电脑做了什么。

当然,代价就是初期启动成本。你需要清晰地描述需求,需要和AI一起调试生成的代码,需要理解一些基本的脚本和概念。它不是给“完全不想碰命令行”的用户准备的,而是给那些愿意用一点技术杠杆来撬动巨大效率提升的“高级用户”或“愿意学习的高级用户”准备的。

2.2 核心组件拆解:脚本如何运转

别看它只是一个脚本,内部逻辑划分得很清晰。理解这个,对后续使用和排错至关重要。

  1. 引导器(Bash Script):就是pos这个文件本身。它负责最基础的流程控制:检查环境(Claude Code是否安装)、读取或初始化用户配置、准备运行上下文(比如设置数据目录)、构造最终发送给Claude Code的指令。它是整个系统的“外壳”和“启动器”。

  2. 大脑与蓝图(System Prompt):这是pos的灵魂。这个提示词被精心设计,用来将Claude Code“塑造”成一个具有自主性、记忆性、系统级操作能力的AI助手。它会告诉Claude:“你的角色是一个个人操作系统,你可以访问文件系统、浏览器、命令行;你应该主动规划任务、使用工具、持久化记忆;你的输出应该是可执行的行动或代码。” 这个提示词的质量,直接决定了AI行为模式的优劣。

  3. 记忆系统(~/personal-os-data/:所有状态都存储在这里。这不是一个黑盒数据库,而是一系列Markdown文件和目录。

    • CLAUDE.md:这是核心记忆文件,相当于系统注册表。里面记录了你的偏好、已配置的工具(如浏览器MCP服务器地址)、常用的技能描述等。AI会读写这个文件来保持上下文。
    • user/目录:存放关于你的更具体的上下文信息,可能是你手动提供的,也可能是AI在与你交互中总结的。
    • .claude/skills/目录:存放AI自己生成的“技能指南”。比如,AI第一次成功为你从某个网站抓取了数据,它可能会把这个过程总结成一个how-to-scrape-xxx-site.md文件存下来,下次类似任务可以直接参考。
    • interfaces/scripts/目录:存放生成的接口脚本(如Python脚本用于发Telegram消息)和可复用的自动化脚本。
  4. 执行臂膀(Claude Code + MCP):Claude Code是执行者。它接收来自pos的、包含了系统提示词和用户指令的完整提示,然后思考、规划,并最终输出要执行的Bash命令、Python代码或JavaScript代码。pos会捕获这些输出并执行(在安全确认后)。其中,MCP(Model Context Protocol)是关键,尤其是Chrome DevTools MCP。它允许Claude Code通过WebSocket连接到你的Chrome浏览器,实现真实的浏览器自动化(点击、输入、抓取),这比单纯的HTTP请求模拟要强大和稳定得多,能应对大量现代前端框架构建的网站。

3. 实战部署与初始化配置

3.1 环境准备与前置条件

在运行那个酷炫的一行命令之前,我们需要确保地基是稳固的。以下步骤我亲自走了一遍,有些坑你得提前知道。

第一步:确保你的macOS环境项目明确主要支持macOS。Linux理论上可行,但涉及定时任务(从macOS的launchd切换到cron)和部分系统路径可能需要手动调整脚本,对新手不友好。如果你是Linux资深用户,可以尝试,否则建议先在macOS上体验。

第二步:安装Claude Code CLI这是核心依赖。别被“No dependencies”迷惑,它指的是pos脚本本身不依赖第三方库,但它依赖Claude Code这个外部工具。

  1. 访问 Anthropic 官方文档,按照指南安装Claude Code。通常就是一条curlbrew命令。
  2. 安装完成后,确保~/.local/bin/claude这个文件存在,并且该目录在你的系统PATH环境变量中。打开终端,输入which claude,应该返回/Users/你的用户名/.local/bin/claude或类似路径。如果没有,你需要将~/.local/bin添加到你的PATH中,通常是在~/.zshrc~/.bash_profile文件里添加一行export PATH=\"$HOME/.local/bin:$PATH\",然后重启终端或运行source ~/.zshrc

第三步:获取Claude API访问权限pos需要Claude Code工作,而Claude Code需要合法的API凭证。你有两个选择:

  • Claude Pro订阅:这是最方便的方式。在Claude Code中登录你的Pro账户即可。
  • API Key:如果你有Anthropic的API账户,可以在Claude Code的配置中设置API Key。对于pos的密集型、自动化使用场景,API调用成本需要考虑,Pro订阅目前看来更划算。

注意:请确保你从官方渠道获取和使用Claude服务,遵守相关使用条款。pos只是一个本地调度脚本,它不提供、也不应被用于获取任何未授权的AI服务访问。

3.2 首次运行与交互式引导

环境准备好后,就可以运行了。官方提供的一行命令会创建目录、下载脚本、赋予执行权限并直接运行。我们来分解一下:

mkdir -p ~/personal-os && curl -o ~/personal-os/pos https://raw.githubusercontent.com/sshh12/personal-os/main/pos && chmod +x ~/personal-os/pos && ~/personal-os/pos

执行后,你会看到脚本启动,然后Claude Code的界面可能会弹出来(取决于你的Claude Code设置),或者直接在终端里开始交互。第一次运行,它会进入“引导模式”

这个引导过程至关重要,它会在你的~/personal-os-data/CLAUDE.md文件中建立初始配置。AI会问你一系列问题,例如:

  • 你的主要目标是什么?(例如:“自动化日常信息收集”、“管理个人项目”、“智能提醒”)
  • 你希望使用哪些通信接口?(例如:iMessage、WhatsApp、Telegram、Slack、电子邮件)。对于每个接口,你需要提供必要的凭证或配置方法(例如,Telegram需要Bot Token和Chat ID)。
  • 你常用的工具和网站有哪些?(例如:Gmail、Notion、某个内部管理系统、银行网站)。这有助于AI优先学习与这些工具交互的技能。
  • 你的数据存储偏好?pos会默认使用~/personal-os-data,但你可以在这里覆盖)。

我的建议是,在引导阶段,目标不要设得太大。先说一个明确的小目标,比如“帮我每天上午9点从A网站抓取天气和头条新闻,并摘要发到我的Telegram上”。这样AI的配置和后续生成的技能会更聚焦。大而全的目标容易让AI的初始配置变得空泛。

引导完成后,你的CLAUDE.md文件就初始化好了。这个文件是纯文本,你可以随时用任何编辑器打开查看和修改。养成定期查看这个文件的习惯,这是你和AI助手共享的“大脑皮层”。

3.3 数据目录结构与自定义

默认的数据目录是~/personal-os-data。所有生成物都在这里。理解它的结构有助于你手动干预和备份。

~/personal-os-data/ ├── CLAUDE.md # 核心配置与记忆 ├── user/ # 你的个人档案(可存放简历、兴趣列表等) │ ├── profile.md │ └── interests.md ├── .claude/ # Claude相关数据(注意是隐藏目录) │ └── skills/ # AI生成的技能库 │ ├── how-to-send-telegram.md │ └── how-to-scrape-news.md ├── interfaces/ # 通信接口的具体实现脚本 │ ├── telegram_sender.py │ └── imessage_applescript.scpt ├── scripts/ # 可复用的任务脚本 │ └── daily_weather_check.sh └── .env # 敏感信息(如API密钥,被.gitignore忽略)

如果你想改变数据目录的位置(比如放到iCloud Drive里实现多设备同步,或者放到一个加密盘里),可以在运行pos时设置环境变量:

POS_ROOT=/Volumes/EncryptedDrive/my-pos-data ./pos

这个设置会被写入脚本上下文,后续所有操作都会基于这个新路径。

4. 核心使用模式与自动化任务创建

4.1 交互式命令执行:像与助手对话一样操作电脑

最基本的用法,就是把pos当作一个超级智能的终端命令生成器。你不需要记住复杂的命令参数,用自然语言描述你的意图就行。

例如,在终端里:

cd ~/personal-os ./pos

运行后,你会进入一个与Claude Code的交互会话。你可以输入:

“把我桌面上的所有截图文件,按照‘年月日-序号’的格式重命名,然后移动到‘~/Pictures/Screenshots’文件夹里。”

AI会理解你的意图,然后生成并可能直接执行一系列Bash命令(mv,rename等)。在执行涉及文件删除、移动等危险操作前,pos的默认配置(除非你用了--dangerously-skip-permissions)会要求你确认。这是第一道安全防线,务必仔细阅读AI将要执行的命令!

这种模式适合处理一次性的、复杂的文件操作、数据整理或信息查询任务。你是在用自然语言编程。

4.2 创建持久化技能与自动化流程

这才是pos的威力所在。你不是每次都要告诉它怎么做,而是教它一次,让它以后能自动做。

案例:创建每日新闻摘要机器人

假设你的需求是:“每天上午8点,抓取Hacker News和某个科技博客的前5条标题,总结后发到我的Telegram。”

  1. 首次教学(技能生成)

    • 运行./pos
    • 输入指令:“请编写一个脚本,完成以下任务:1. 使用curl或python抓取Hacker News首页(https://news.ycombinator.com)排名前5的故事标题。2. 抓取我的个人博客(https://example.com)最新发布的5篇文章标题。3. 将这两个列表组合成一份简单的文本摘要。4. 通过Telegram发送给我。我的Telegram配置已经在CLAUDE.md里了。”
    • AI会开始工作。它可能会先检查CLAUDE.md里是否有Telegram的发送方法(如果没有,它会引导你配置,或者现场写一个send_telegram.py脚本存到interfaces/下)。然后,它会编写抓取Hacker News和博客的代码。这个过程可能会经过几轮调试(比如网站结构变了,抓取失败),你需要和AI一起修正CSS选择器或API调用。
    • 一旦成功,AI不仅会输出结果,通常还会做两件事: a. 在.claude/skills/下生成一个how-to-fetch-daily-news.md文件,记录下整个流程和代码关键点。 b. 在scripts/下生成一个可执行的脚本文件,比如daily_news_digest.sh,里面包含了所有步骤。
  2. 自动化部署(定时任务)

    • 接下来,你可以命令AI:“请将刚才生成的daily_news_digest.sh脚本设置为每天上午8点自动运行。”
    • AI知道在macOS上,定时任务通常用launchd管理。它会为你生成一个.plist文件,并给出加载到launchd的命令。例如,它可能会生成~/Library/LaunchAgents/com.user.dailynews.plist文件,并让你执行launchctl load ~/Library/LaunchAgents/com.user.dailynews.plist
    • 这样,一个完整的自动化流水线就建立了。每天8点,系统会自动运行脚本,Claude Code会在后台执行抓取、摘要、发送的全过程。

4.3 浏览器自动化:处理无API的Web操作

很多个人自动化需求涉及没有开放API的网站,比如登录学校系统查成绩、在内部管理后台提交表单、从银行页面导出交易记录。这就是Chrome DevTools MCP发挥作用的地方。

配置Chrome DevTools MCP

  1. 你需要以远程调试模式启动Chrome。一种简单的方式是:完全退出所有Chrome进程,然后在终端运行:/Applications/Google\ Chrome.app/Contents/MacOS/Google\ Chrome --remote-debugging-port=9222。这会打开一个新的Chrome实例,并开启9222端口的调试协议。
  2. pos的引导阶段或后续配置中,你需要告诉AI这个MCP服务器的地址(通常是http://localhost:9222)。AI会把这个信息记录到CLAUDE.md中。

使用场景: 当你给AI下达指令:“登录我的XX银行网站(账号密码在.env文件里),下载最近30天的交易流水CSV文件,保存到~/Documents/Statements目录,并按月份重命名。” AI会:

  1. 读取.env中的凭证(前提是你已安全地存储在那里)。
  2. 通过MCP协议控制已打开的Chrome浏览器,导航到银行登录页。
  3. 模拟输入账号密码、点击登录按钮。
  4. 导航到交易历史页面,操作界面元素选择日期范围、点击导出按钮。
  5. 处理文件下载(可能需要处理浏览器的下载弹窗),并将文件移动到指定位置。

整个过程完全模拟真人操作,可以应对复杂的JavaScript前端。但这里的安全风险极高,因为你将网站密码交给了AI可访问的环境。务必仅在完全信任的私人电脑上操作,并且确保.env文件权限严格(chmod 600 .env),绝不提交到任何版本库。

5. 安全边界、风险控制与最佳实践

使用pos,你必须时刻保持“敬畏之心”。它赋予AI的权限太大了。

5.1 理解风险:你的电脑成了AI的沙箱

  • 文件系统全权限:AI生成的脚本可以执行rm -rf。一个歧义的指令可能导致灾难。例如,你说“清理Downloads文件夹”,AI可能理解为“删除所有旧文件”,而你的“旧”和它的“旧”标准可能不同。
  • 网络与通信权限:AI可以发送邮件、短信、消息。如果指令被误解,可能会向你的联系人列表发送错误或令人尴尬的信息。
  • 浏览器自动化风险:AI可以填写表单、点击按钮。这意味着它可以进行网上购物、发表社交言论等。如果它误解了上下文,后果不可控。
  • 隐私数据泄露:所有上下文(包括可能被AI读取的文件内容)最终都会以会话日志的形式存储在~/.claude/projects/下。虽然这些数据在本地,但如果你的电脑被入侵,这些日志就是宝藏。

5.2 必须遵循的实操守则

  1. 从小任务开始,逐步建立信任:不要一开始就让AI管理你的整个照片库或财务数据。从无害的任务开始,比如整理下载文件夹、重命名文件、查询公开信息。
  2. 绝对不要默认使用--dangerously-skip-permissions:这个标志会跳过所有执行确认。除非你是在一个完全隔离的测试环境中运行一个你100%理解的脚本,否则永远不要用它。让确认提示成为你的安全闸。
  3. 实施“双人复核”机制(对自己):对于任何涉及删除、移动、发送消息、支付等敏感操作,在AI生成命令后,不要直接点确认。停下来,肉眼逐行检查生成的命令或代码。问自己:这行命令真的是我想做的吗?
  4. 善用“沙盒”测试:对于不确定的脚本,可以让AI先在一个临时目录或测试环境中运行。例如:“请写一个脚本,在/tmp/test_area目录下演示一下这个文件重命名逻辑,不要动我的真实文件。”
  5. 严格管理.env和敏感文件
    • .env文件的权限设置为仅自己可读:chmod 600 ~/personal-os-data/.env
    • 不要在CLAUDE.md或任何可能被AI读取的普通文件中直接写入密码、密钥。始终引用.env中的变量。
    • 考虑使用系统的钥匙串(Keychain)来存储最高机密,然后让AI通过调用security命令来获取。但这需要更复杂的脚本,对新手难度大。
  6. 定期审计日志:时不时查看~/.claude/projects/目录下的会话日志。这能帮你了解AI到底“想”了什么,做了什么。也是发现潜在错误或误解的好方法。
  7. 备份!备份!备份!:定期备份你的~/personal-os-data目录(当然要排除.env)。这个目录包含了所有你的配置和AI学习的技能,是独一无二的。如果丢失,你需要从头开始训练。

5.3 与OpenClaw的对比与选择建议

特性维度pos(Personal OS)OpenClaw
核心理念代码即时生成,极度定制,你拥有每一行代码。预制集成,开箱即用,社区共享技能。
上手速度。需要配置、调试、教AI。。安装即用,有图形界面配置。
灵活性理论上无限。只要Claude能写代码,就能集成。高,但有边界。取决于社区已开发的技能和插件。
复杂度极低(项目本身)。只是一个脚本。。完整的Node.js应用,有数据库、前端、后端。
社区与生态。你自己就是生态。活跃。有Discord社区,不断有新技能分享。
学习曲线陡峭。需要会与AI有效沟通,懂基础脚本和排错。平缓。更接近使用传统软件,配置即可。
适合人群黑客/极客/学习者。喜欢折腾,追求完全控制,不介意动手调试。效率追求者/普通用户。想要现成方案,快速解决实际问题,不想碰代码。

我的选择建议

  • 如果你是开发者,或者对技术有强烈好奇心,享受“创造工具”的过程,并且你的需求非常独特、长尾,那么pos带来的自由度和控制感是无与伦比的。它更像一个“元工具”。
  • 如果你的需求是常见的自动化(如同步Notion和日历、管理社交媒体、处理邮件),并且你希望尽快用上、稳定运行,那么OpenClaw是更成熟、更省心的选择。它的社区支持能帮你解决很多常见问题。

6. 常见问题与故障排查实录

在实际使用中,我踩过不少坑。这里记录下最典型的几个问题和解决思路。

6.1 Claude Code 命令未找到

问题:运行./pos时提示claude: command not found排查

  1. 运行which claude,确认安装路径。如果没输出,说明没装好或PATH不对。
  2. 检查你的Shell配置文件(~/.zshrc~/.bash_profile),确保包含了export PATH=\"$HOME/.local/bin:$PATH\"这一行。
  3. 执行source ~/.zshrc或重新打开终端窗口。
  4. 如果通过Homebrew安装,路径可能在/opt/homebrew/bin下,需要相应调整PATH。

6.2 浏览器自动化失败(MCP连接错误)

问题:AI在尝试浏览器操作时卡住或报错,提示无法连接到Chrome。排查

  1. 确认Chrome以调试模式运行:你必须使用--remote-debugging-port=9222参数启动Chrome。检查是否已经有一个这样的Chrome实例在运行(ps aux | grep 9222)。
  2. 检查端口占用:如果9222端口被占用,可以换一个,比如--remote-debugging-port=9223,并记得在CLAUDE.md中更新MCP服务器地址。
  3. 检查防火墙:确保没有本地防火墙规则阻止了localhost上的端口连接。
  4. 首次引导配置:如果第一次配置MCP时出错,可以手动编辑~/personal-os-data/CLAUDE.md,找到类似mcp_servers的配置部分,修正Chrome DevTools服务器的URL。

6.3 生成的脚本执行权限问题

问题:AI生成了一个Python脚本(如interfaces/telegram_sender.py),但定时任务或手动执行时提示Permission denied解决:AI生成文件时可能不会自动设置可执行权限。你需要手动添加:

chmod +x ~/personal-os-data/interfaces/telegram_sender.py

或者,你可以教AI一个技巧:在它生成脚本的指令最后,加上一句“并确保该脚本具有可执行权限”。有经验的AI会在生成的Bash命令中包含chmod +x这一步。

6.4 定时任务(launchd)不运行

问题:配置的.plist文件已加载,但脚本没有在预定时间执行。排查

  1. 检查.plist文件路径和权限:确保~/Library/LaunchAgents/下的.plist文件所有权是你的用户,并且XML语法正确。一个常见的错误是脚本路径(ProgramArguments里的路径)写错了。
  2. 查看日志:使用launchctl debug gui/$(id -u)/com.user.dailynews(替换为你的标识符)来调试,或者查看系统日志console.app中关于launchd的条目。
  3. 环境变量问题launchd运行的环境与你的终端用户环境不同,可能缺少PATH或其他环境变量。一个可靠的方法是在你的脚本(如.sh.py)开头,显式地设置绝对路径和关键环境变量,例如#!/usr/bin/env bash之后加上export PATH=\"/usr/local/bin:/Users/yourname/.local/bin:$PATH\"
  4. 手动测试:先用launchctl start com.user.dailynews手动触发一次,看是否能成功运行,这有助于隔离是定时问题还是脚本本身问题。

6.5 AI的理解偏差与指令修正

问题:AI生成的代码逻辑与你的预期不符。比如,你让它“备份Documents文件夹”,它却把文件复制到了同一个磁盘分区,这不算安全的备份。解决:这是使用LLM类工具的核心挑战。你需要学会“精准提示工程”。

  • 具体化:不说“备份”,而说“将~/Documents文件夹中的所有文件(排除.tmp后缀的),使用rsync同步到外接硬盘/Volumes/Backup/Documents/目录,并保留所有文件属性和修改时间。”
  • 分步引导:对于复杂任务,不要一次性提出。可以先说“第一步,请写一个脚本,列出~/Documents下所有非.tmp的文件。” 确认无误后,再说“第二步,修改这个脚本,将列出的文件复制到...”。
  • 提供示例:如果涉及特定格式,最好提供一个输入输出示例。“我需要一个脚本,将input.csv中的日期格式从 ‘MM/DD/YYYY’ 转换为 ‘YYYY-MM-DD’。例如,输入 ‘04/25/2023’,输出应为 ‘2023-04-25’。”
  • 利用上下文:AI会读取CLAUDE.md和技能库。把常用的、正确的操作范例写成技能文档(或记录在CLAUDE.md里),下次AI会优先参考。

7. 进阶技巧与个人化定制

当你熟悉了基本操作后,可以尝试这些技巧来提升pos的威力和贴合度。

7.1 优化系统提示词(System Prompt)

pos脚本里内置了一个系统提示词,但它是固定的。如果你想微调AI的行为模式,可以修改脚本中的相关部分(但要注意,更新脚本可能会覆盖你的修改)。一个更可持续的方法是在CLAUDE.md的开头部分,以“系统指令”的形式追加你的要求。

例如,在CLAUDE.md里加入:

# 系统指令补充 - 在生成任何涉及文件删除的命令前,必须明确列出将要删除的文件列表,并等待我二次确认。 - 优先使用Python而非Bash来处理复杂的文本或数据操作,因为Python更易读且跨平台。 - 所有对外发送的消息(短信、邮件、Telegram),在发送前必须将内容概要显示给我确认。

AI在每次会话初始化时都会读取CLAUDE.md,这些补充指令会影响它的行为决策。

7.2 构建个人技能知识库

.claude/skills/目录是你的宝贵财富。不要让它杂乱无章。主动去整理和优化这些技能文件。

  • 标准化命名how-to-[动词]-[对象].md,如how-to-export-bank-statement.md,how-to-resize-images-batch.md
  • 丰富上下文:在技能文件里,不仅记录成功的命令,更记录当时为什么这么做,以及遇到了什么坑,怎么解决的。例如:“该网站使用了Cloudflare反爬,直接curl会被拦截。解决方案是使用Chrome DevTools MCP模拟真实浏览器,并添加了随机延迟。”
  • 版本化:将~/personal-os-data目录初始化为一个Git仓库 (git init)。每次AI成功创建一个新技能或重要脚本后,做一个提交。这让你可以回滚到任何可用的版本,也便于在多台电脑间同步核心技能(注意排除.env)。

7.3 与其他工具链集成

pos可以成为你个人工作流的“智能胶水”。

  • 与Hammerspoon/Karabiner集成:你可以让AI写一段Lua脚本(给Hammerspoon)或JSON配置(给Karabiner-Elements),将某个复杂的pos任务绑定到一个全局快捷键上。比如,按Cmd+Shift+L自动整理当前下载文件夹。
  • 与Alfred/LaunchBar集成:将这些工具的自定义搜索或脚本功能,指向你pos生成的特定脚本。实现用快捷键呼出输入框,输入“总结今天邮件”,直接触发对应的AI流水线。
  • 作为代码编辑器的自定义命令:在VS Code或Vim中设置一个命令,将当前选中的文本或问题描述发送给pos脚本处理(比如解释代码、重构代码),然后将结果插回编辑器。

7.4 性能与成本考量

  • 会话长度管理:Claude Code有上下文长度限制。长时间、多步骤的复杂任务可能会导致旧记忆被遗忘。对于超长任务,可以指示AI将中间状态保存到CLAUDE.md或一个临时文件中,然后开启新会话来继续。
  • API调用成本:如果你使用API Key而非Pro订阅,需要关注token消耗。复杂的浏览器自动化或代码生成任务会产生大量交互。可以在CLAUDE.md里加入指令:“在保证任务完成的前提下,尽量精简思考和回复的篇幅,减少不必要的token使用。”
  • 本地模型备用:对于某些不涉及复杂推理的、模式固定的任务(比如简单的文件重命名),完全可以不用调用Claude。你可以自己写一个Bash/Python脚本放在scripts/下,然后让pos在需要时直接调用这个本地脚本,而不是每次都重新生成。这需要你在给AI下指令时更明确:“请调用我们已有的scripts/rename-photos-by-date.sh脚本来处理这些图片,不要重新生成代码。”

使用pos的这几个月,我感觉它更像一个需要耐心培养的学徒。初期效率可能不如直接自己写脚本,甚至不如用现成软件。但一旦你通过多次交互,把那些重复、琐碎但又带点小变化的个人工作流“教”会它,并固化成了技能和脚本,它就会开始产生巨大的复利效应。最大的收获不是省了多少时间,而是获得了一种“任何电脑操作都可以被抽象和自动化”的思维模式。你开始更系统地思考自己的数字习惯,并尝试用这种人与AI协作的方式去优化它。这个过程本身,就充满了乐趣和启发性。

http://www.jsqmd.com/news/744095/

相关文章:

  • 流量变现的终极密码:深度解构全栈游戏电竞护航陪玩源码系统小程序,自研IM矩阵如何赋能千家俱乐部狂飙突进 - 壹软科技
  • R3nzSkin国服换肤:英雄联盟免费换肤终极指南
  • 告别BDC!用SAP函数K_SRULE_SAVE_UTASK批量搞定WBS结算规则(附完整ABAP代码)
  • 3个实用技巧:如何轻松访问全球最大同人创作平台AO3
  • 别再用print调试了!用TensorBoard可视化PyTorch模型训练,保姆级配置教程
  • 为内部知识问答系统集成 Taotoken 实现多模型备用与降级策略
  • 基于MCP协议构建企业情报聚合器:CompanyScope部署与实战指南
  • ARCore深度解析:从运动追踪到云锚点,看谷歌如何用SLAM技术“理解”世界
  • 网盘直链下载助手:一键获取八大网盘真实下载链接的终极解决方案
  • 终极指南:快速掌握暗黑破坏神2存档编辑器d2s-editor
  • 使用 Python 快速接入 Taotoken 实现多模型对话应用开发
  • 2026年论文AI率太高?这款便宜好用的降AI工具帮你快速搞定 - 降AI实验室
  • CSDN博客下载器终极指南:三步实现技术文章完整备份
  • 从LED闪烁到温度监测:用蓝桥杯CT107D板子复刻5个经典电子小项目
  • 别再调硬件接口了!用广播模式为东大PDA写扫码App更简单(Xamarin教程)
  • Wav2Lip推理效果总翻车?手把手教你调优pads、nosmooth和resize_factor参数
  • Magpie终极优化指南:让低配电脑也能流畅放大窗口的5个简单技巧
  • 快马平台一键生成ensp项目:三步完成小型企业网络原型设计与仿真
  • 2026株洲GEO公司推荐指南评测 - GrowthUME
  • 保姆级教程:用Python+OpenCV调参SGBM,让你的双目视觉项目效果立竿见影
  • 数学!真好玩 - qqqaaazzz
  • 从B站m4s文件到完整MP4:手把手教你用Python脚本自动化合成音视频(FFmpeg/MoviePy双方案)
  • OSINT开源情报:从核心技能到实战调查的全流程指南
  • 辽宁大学 —— 信息学院 —— 博导履历 —— 华春生
  • AI Agent安全入门:使用opena2a进行静态扫描与漏洞防护
  • 别再死记硬背了!用这5个PyTorch实战项目,把面试题考点变成你的肌肉记忆
  • 5分钟搞定!鸣潮自动剧情跳过与多账号管理的终极指南
  • 初创团队如何利用 Taotoken 快速试验不同大模型能力
  • 从VMM到UVM:一个芯片验证工程师的十年方法学演进史
  • 给ESP32S3 NES模拟器换“皮肤”:手把手教你修改调色板解决SPI屏颜色错乱