当前位置: 首页 > news >正文

谷歌调整“水手计划”团队,浏览器智能体遇冷,新模型效率提升 50 倍!

谷歌调整“水手计划”团队

据《连线》杂志报道,谷歌正在对其 AI 智能体项目“水手计划”(Project Mariner)背后的团队进行调整。“水手计划”所打造的 AI 智能体能够在 Chrome 浏览器中操作,并代用户完成任务。知情人士透露,近几个月来,参与该研究原型的部分谷歌实验室员工已转去参与优先级更高的项目。谷歌发言人证实了这一变动,但表示“水手计划”所开发的计算机使用能力将融入公司未来的智能体战略中。该发言人还补充道,谷歌已将其中一些能力整合到其他智能体产品中,包括最近推出的 Gemini 智能体。

浏览器智能体市场遇冷

此次调整正值谷歌和其他 AI 实验室急于应对 OpenClaw 等强大智能体崛起之际。如今,这些工具主要由开发者使用,但硅谷认为,它们很快就能为个人和企业打造通用型助手。英伟达 CEO 黄仁勋将这款热门工具比作智能计算机的新操作系统。本周早些时候,他在公司开发者大会上表示:“如今,全球每家公司都需要制定 OpenClaw 战略。”谷歌 CEO 桑达尔·皮查伊在去年的 I/O 开发者大会上着重介绍了“水手计划”。当时,浏览器智能体似乎成为了行业的下一个重大赌注,OpenAI 和 Perplexity 推出了面向消费者的智能体,承诺为用户自动完成在线任务。这些智能体可以像人类一样在网页上点击、滚动和填写表单。然而,这些产品的市场接受度未能达到行业预期。2025 年 12 月,Perplexity 的 Comet 浏览器智能体每周活跃用户仅达 280 万。与此同时,据报道,OpenAI 的 ChatGPT 智能体近几个月的每周活跃用户降至不足 100 万。与每周数以亿计使用 ChatGPT 的用户相比,浏览器智能体的使用量几乎可以忽略不计。过去一年,AI 领域的发展势头已大幅转向 Claude Code 和 OpenClaw 等智能体(OpenClaw 的开发者已被 OpenAI 聘用)。与浏览器智能体不同,这些系统通过命令行控制计算机,事实证明,这是一种更可靠的任务完成方式。其中一些产品将计算机使用功能作为其智能体能力的一部分。相比之下,浏览器智能体作为独立产品,如今似乎存在一定局限性。AI 技能提升平台 Workera 的 CEO 基安·卡坦福鲁什(Kian Katanforoosh)在斯坦福大学教授 AI 课程,他认为计算机使用智能体未能广泛普及的部分原因在于其巨大的计算需求。大多数此类智能体的工作方式是对网页进行一系列截图,将其输入 AI 模型,然后根据识别结果采取行动。处理这些信息不仅速度慢,而且有时还不可靠。卡坦福鲁什表示:“Claude Code 和 OpenClaw 表明,使用终端操作实际上效率要高得多,因为终端基于文本,而大语言模型(LLM)也是基于文本的。要实现相同的结果,使用终端所需的步骤可能要少 10 到 100 倍。”

新模型另有突破

不过,这并不意味着浏览器智能体没有进步,也不代表计算机使用方面的研究陷入了死胡同。上个月,初创公司 Standard Intelligence 发布了一个基于视频而非截图训练的计算机使用模型。该公司称,他们开发了一种视频编码器,可将视频压缩到 AI 模型的上下文窗口中,其效率比之前的计算机使用模型高出 50 倍。为展示其 AI 模型的能力,该公司将其连接到汽车、实时视频源和计算机键盘上。该模型能够在旧金山短暂地实现自动驾驶。

http://www.jsqmd.com/news/657279/

相关文章:

  • 蓝桥杯单片机备赛避坑指南:从第九届省赛代码里学到的3个调试技巧与1个常见误区
  • MinerU 系列教程 第十一课:表格识别 - 有线与无线的双引擎
  • 如何为Windows安卓子系统打造完整的Android体验:MagiskOnWSALocal终极指南
  • EC开发tips
  • VRC Gesture Manager:Unity编辑器中实时预览VRChat虚拟形象动画的终极工具
  • 用Python和MATLAB搞定CCA:从数据预处理到结果可视化的完整实战指南
  • 用51单片机红外遥控器控制LED亮度(PWM调光保姆级教程)
  • SCL语言实战:在西门子PLC中构建高效FIFO栈数据结构
  • 3个强力技巧:用BilibiliDown实现B站音频高效提取完全指南
  • 【WindowsClear】一款面向 Windows 系统盘的 C盘清理工具,支持AppDate一键迁移到别的磁盘
  • 快速排序与希尔排序实战解析
  • 智能代码生成从“能用”到“飞快”的临界点:基于Transformer Decoder注意力机制重构的4种轻量化生成策略(含可复现PyTorch代码片段)
  • 手机号查QQ号终极指南:3步快速查询完整教程
  • Zotero文献格式化插件终极指南:一键告别杂乱文献库的完整解决方案
  • DeepMosaics终极指南:3个简单步骤掌握AI智能马赛克处理技术
  • MinerU 系列教程 第十二课:公式识别 - LaTeX 的自动生成
  • AI编程工具使用详解
  • 一篇文章带你快速上手Vue3(包含vue核心语法、router路由、axios请求库、pinia状态管理、ts类型约束等等)
  • Excel公式美化器:终极免费工具,让复杂公式一目了然!
  • 【GitHub项目推荐--Agentic Design Patterns:AI Agent 架构设计的“中文版设计模式”】⭐⭐⭐⭐⭐
  • 如何快速将飞书文档转换为Markdown:终极解决方案指南
  • 中层已死,智能体在管你
  • MinerU 系列教程 第十三课:FastAPI 服务 - mineru-api 深度解析
  • 保姆级教程:在COMSOL中搞定压电晶体仿真,手把手教你设置旋转坐标系和欧拉角
  • Spotify广告拦截终极指南:BlockTheSpot如何让免费用户享受Premium体验?
  • 深入PCA9685数据手册:手把手教你用STM32的IIC调试其所有寄存器(附逻辑分析仪实测波形)
  • 10 分钟装好 Hermes,用 Profile 隔离你的“工作人格“和“生活人格“
  • Meta与博通续约至2029年,将推2纳米AI计算加速器,博通CEO转任顾问
  • Java大厂面试实录:互联网医疗场景下的核心技术栈问答解析
  • 终极指南:5分钟免费解锁Cursor AI Pro完整功能的完整解决方案