当前位置: 首页 > news >正文

节省token方案

headroom是一款AI Agent上下文压缩工具,核心作用是大幅降低LLM对话的Token消耗,适配Codex、Claude Code、Cursor等主流AI编程工具。该工具依赖终端执行核心命令,同时支持对接Codex桌面应用,并非纯图形化工具。

完整安装步骤(必须在终端操作)

headroom主流通过Python安装,环境要求Python 3.10及以上版本:

  1. 打开系统终端(Windows终端/PowerShell、Mac/Linux终端)。
  2. 执行完整版安装命令(推荐,包含全部功能):
    pip install "headroom-ai[all]"
  3. 若使用Node/TypeScript环境,可执行:
    npm install headroom-ai
  4. 验证安装:终端输入headroom --version,输出版本号即代表安装成功。

四大使用模式(结合Codex场景)

工具提供4种接入方式,全部以终端命令为基础,可分别适配Codex终端版和桌面版:

模式一:Agent Wrap模式(适配Codex终端CLI)

专门用于一键包装Codex命令行客户端,零额外配置:

headroom wrap codex # 执行后拉起Codex会话,自动压缩上下文
  • 特点:所有对话历史、代码上下文被自动压缩。
  • 查看统计:使用headroom statsheadroom perf查看Token消耗及节省数据。

模式二:Proxy代理模式(适配Codex桌面应用)

让Codex桌面端间接使用压缩能力:

  1. 终端启动本地代理服务(默认8787端口):
    headroom proxy --port 8787
  2. 打开Codex桌面应用,配置其请求代理指向http://localhost:8787
  3. 此后桌面端所有对话和上下文自动压缩,无需修改代码。

模式三:代码集成模式(开发者自定义集成)

在Python或TypeScript代码中直接调用压缩函数:

  • Python示例
    from headroom import compress compressed_messages = compress(messages, model="对应模型名称") # 传入Codex消息列表

模式四:MCP Server模式(适配Claude Desktop等MCP协议客户端)

启动MCP服务以支持压缩能力:

headroom mcp install # 安装并启动MCP服务
  • 适用场景:桌面端可直接调用压缩和检索功能,全程依托后台终端运行。

针对核心问题解答

  1. 能否在Codex桌面应用端直接使用?
    可以,但不能脱离终端。Codex桌面端本身无内置图形化入口,需先在终端启动proxymcp服务,再配置桌面端对接本地服务。

  2. 是否必须终端调用?
    核心操作(安装、启动代理、Wrap包装、服务部署)必须在终端执行。日常使用分场景:

    • Codex终端版:全程终端操作,使用headroom wrap codex一步完成接入。
    • Codex桌面版:仅首次需在终端启动后台服务,后续正常使用图形界面即可。

补充实用命令与注意事项

  1. 停止服务:终端按下Ctrl + C可关闭代理或Wrap会话。
  2. 端口冲突:若8787端口占用,自定义端口执行headroom proxy --port 自定义端口号
  3. 跨端联动:Codex终端会话可输入/app快速跳转至桌面端,压缩配置同步生效。
http://www.jsqmd.com/news/1023314/

相关文章:

  • 三步搞定Kodi自动字幕:告别观影无字幕困扰
  • 2026年6月邢台卖黄金怎么选正规回收店实操指南 - 余生黄金回收
  • 2026年6月贵州包车游旅行社推荐:十大排名家庭包车防套路评测专业价格 - 品牌推荐
  • Product Group Reference Article 在 SAP Retail 商品主数据中的设计逻辑与落地边界
  • 榆林旧黄金回收避坑指南 看懂行情不被乱扣费 - 余生黄金回收
  • Python中%运算符的真相:模运算不是取余
  • 魔兽争霸3终极修复指南:5分钟解决现代系统兼容性问题
  • 360Controller背后的魔法:如何让Xbox控制器在macOS上获得新生
  • 2026:温江室内除异味、甲醛治理专业度横向测评,多家服务商技术与落地能力比拼,优先选择成都肃醛环保 - 专注室内空气检测治理
  • 如何在3分钟内解决iPhone USB网络共享驱动问题:终极一键安装指南
  • 合肥黄金回收:避开陷阱选对门,安心变现不踩坑 - 余生黄金回收
  • 2026年6月廊坊卖黄金防坑攻略正规回收价格明细 - 余生黄金回收
  • 2026重庆市家用空调-中央空调等维修安装移机加氟-本地精选指南 -欧米到家 - 欧米到家
  • AI低成本服务落地:数据蒸馏、MoE路由与电价感知部署
  • 2026年取暖炉具加工厂推荐:煤炉/柴炉/电炉/回风炉/电暖炉家用商用全覆盖 - 海棠依旧大
  • GPT-5.5 Instant:大模型事实对齐与幻觉抑制的工程化实践
  • AI在重型机械标准解析中的典型失效模式分析
  • 2026年 仪表木箱/仪器木箱/出口木箱厂家推荐榜单:重型木箱、免熏蒸木箱、钢带木箱源头工厂实力解析及选购指南 - 品牌发掘
  • 如何在Blender中快速导入和制作MMD动画:blender_mmd_tools完全指南
  • DeepSeek-R1本地部署指南:Windows下Ollama+Open WebUI实战
  • 2026.6 南宁润滑油、轴承批发商家实力排行榜(权威测评版) - 星际AI
  • Hermes Agent 国内实战生存手册:网络兼容、安装排障与Kimi深度优化
  • 2026苏州五大城区奢品回收测评|上门变现避雷,高报价靠谱门店盘点 - 薛定谔的梨花猫
  • 2026年承插法兰、承插弯头、承插三通、承插隔膜阀厂家推荐榜:承插焊不锈钢球阀/锻钢止回阀/高压球阀/管件品牌优选 - 品牌发掘
  • 2026年6月邢台黄金回收行情解读与商家筛选技巧 - 余生黄金回收
  • Codex++解锁APIKey全功能
  • 大模型免费时代:推理效率、稳定性与确定性工程实践
  • Hermes Agent国内实战指南:30分钟跑通Kimi集成
  • VBA数据结构之争:3倍效率差,90%开发者选错了
  • 【2026年6月】电动推拉雨棚优质企业推荐指南 - 多才菠萝