当前位置: 首页 > news >正文

rtrvr.ai AI 子程序:零 token 成本自动化脚本,解决网络智能体认证难题!

rtrvr.ai 产品介绍

rtrvr.ai 提供多种产品服务,包括博客、预约演示、定价、API 文档、扩展程序、云端服务等。

AI 子程序功能特点

只需录制一次浏览器任务,就能将其作为可调用工具进行回放,零 token 成本,100% 确定性,认证信息可从实时网页自动传递。还有 2 分钟演示展示其功能,具有零 token 成本、录制一次永久回放等诸多优势。

网络智能体现存问题

大多数网络智能体只解决了问题的一半,执行上千次任务时成本会失控,结果也不确定。显而易见的解决办法是跳过用户界面直接调用网站内部 API,但真正的难题在于认证。

认证难题解析

经过认证的网络请求会携带多种信息,进程外的爬虫程序必须在外部重建这些信息,一旦网站有变动,程序就会失效,大多数 HTTP 存档回放工具的使用寿命也会到此为止。

rtrvr 解决方案:在扩展程序中录制,在网页内回放

在 rtrvr 中,录制和回放都在用户的浏览器内、网页自身的环境中进行。扩展程序会拦截网络请求,采用两层拦截机制,请求体也会被捕获。当脚本运行时,请求会从页面自身的执行上下文发出,认证等信息会自动传递。

对网络捕获的处理:排序和筛选

通常浏览时标签页会发出大量请求,而实际有用的 API 调用占比很少。因此,在生成器处理之前,会对捕获的请求根据第一方与第三方源、与 DOM 事件的时间相关性等加权信号进行评分和排序筛选。即使经过排序,得分高的候选请求也不一定适合回放,规划器会根据情况做出决策。这一步骤是让录制转化为子程序的关键。

子程序的性质:工具调用,而非宏

录制的任务即子程序,会作为可调用工具注册到智能体的工具集中。它具有热路径零 token 成本、确定性、低检测风险、可通过自然语言由 LLM 调用等优势。

子程序内部:`rtrvr` 辅助工具

子程序是一个在标签页中运行的小型异步 JavaScript 函数,`rtrvr.*` 辅助命名空间提供了在真实网站上常用的操作。还给出了一个简单的 LinkedIn “添加好友”子程序示例。同时介绍了一些非显而易见的实现细节,如参数绑定方式、`rtrvr.find` 的功能、`rtrvr.request` 的处理等。

无法解决的问题

对于通过 WebSockets、WebRTC 或大量客户端动态推导进行实际工作的网站,需要在子程序中穿插 DOM 操作,这种方式速度较慢且可靠性较低。当网站的 API 发生重大变化时,子程序也需要重新录制。

与其他工具的区别

Browser - Use 和 Stagehand 在运行时操作路径中使用 LLM,大规模应用时成本高且结果不确定。Libretto 将 LLM 用于代码生成阶段并生成 Playwright 脚本,但 Playwright 在进程外运行,会出现认证问题。rtrvr.ai 的创新在于预先生成一个在与用户相同的浏览器上下文中运行的脚本,解决了认证问题。

最终目标:构建一个网络操作空间的库

一个子程序就是一个工具,子程序库能提供更广泛的覆盖范围。目前缺少一个共享的、确定性的词汇表来描述智能体在真实网站上可零 token 成本完成的实际操作。rtrvr.ai 正在构建一个公共的、社区维护的子程序库,同时辅助工具的功能也在不断增加。

本次发布的其他内容

与子程序一同发布的还有自带 ChatGPT 或 Claude 订阅、WhatsApp 控制、知识库 + 管理控制平台(MCP)升级、Rover + RoverBook 等内容,以及其他方面的更新。

http://www.jsqmd.com/news/665695/

相关文章:

  • Pixel Mind Decoder 效果深度评测:多场景文本情绪解码准确率对比
  • 别再为单片机显示中文发愁了!手把手教你用SH1106 OLED屏+GT20L16S1Y字库芯片搞定
  • 如何在Windows上完美使用PS4手柄:DS4Windows终极配置指南
  • 软件研发 --- AI提示词开发 之 代码注释提示词
  • MetaboAnalystR 4.0:从原始质谱数据到生物学洞察的完整代谢组学分析实战
  • 别急着跑微调!用ModelScope Pipeline 5分钟玩转AI作图和语音转文字
  • UE4材质节点优化:从Switch节点看自定义节点的封装艺术
  • Qwen2.5-7B-Instruct效果展示:复杂嵌套JSON Schema生成+字段类型校验
  • Navicat导出JSON数据为空如何解决_过滤条件与权限排查
  • 从AMP到BMP:在ZYNQ上玩转多核任务绑定的三种模式对比与选型指南
  • 避坑指南:IAR Release模式下的那些‘优化事故‘及解决方法(附真实案例)
  • Onvif + RTSP 双剑合璧:用Python同时控制摄像头和拉取视频流的完整方案
  • 游戏开发中的平滑路径生成:C++实现三次样条插值实战
  • 如何在Zotero中一键安装和管理插件:Zotero插件市场完整指南
  • The Verge员工推荐:50美元以下实用小工具,改善生活超划算!
  • 终极指南:如何用GalForUnity快速开发Unity文字游戏
  • MacOS上VScode配置PlatformIO Core的疑难杂症与提速实战
  • Windows平台Android应用安装神器:APK-Installer全面解析与实战指南
  • 从梯度爆炸到模型收敛:深度学习里你必须搞懂的Lipschitz连续性与正则化实战
  • Google Colab免费GPU突然用不了?别慌,这5个排查步骤和Pro订阅建议帮你搞定
  • 告别默认字体!手把手教你用在线工具为ESP8266/ESP32制作专属Adafruit GFX字库
  • 别再死记硬背公式了!用Python和NumPy直观理解CP、Tucker、BTD三种张量分解
  • 如何轻松编辑暗黑破坏神2存档:d2s-editor可视化编辑器完整指南
  • 手势识别实战:从Light-HaGRID轻量数据集到多平台部署
  • 如何快速掌握Postman便携版:Windows免安装终极指南
  • 别再手动点点点了!用MeterSphere一站式搞定接口、性能与测试管理(附Docker部署避坑指南)
  • 新手避坑指南:在Ubuntu 20.04上搞定衫川Delta 2A激光雷达的ROS驱动与Rviz可视化
  • 惠普OMEN游戏本终极性能优化指南:5分钟掌握风扇调速与功耗解锁
  • 实测GPTZero:ChatGPT、Claude和文心一言的AI检测效果大比拼(附避坑指南)
  • 忍者像素绘卷部署案例:高校AI实验室构建面向本科生的像素艺术实践平台