当前位置: 首页 > news >正文

2026年6月24日Google DeepMind集成计算机使用能力到Gemini 3.5 Flash,简化开发提升任务可靠性

2026年6月24日,Google DeepMind团队宣布将计算机使用能力原生集成到Gemini 3.5 Flash模型,让开发者能通过单一模型构建AI Agent,此能力通过相关平台向开发者开放。

集成优势显著

此前计算机使用能力需额外调用独立模型,如今集成到3.5 Flash,简化开发者体验。一个Agent进行多步骤任务时,可在同一模型上下文使用多种工具,无需切换模型和传递上下文,改善了任务可靠性和延迟。

架构决策关键

这种“多工具合一”架构反映Google DeepMind对AI Agent发展方向的判断,认为其可靠性瓶颈在于多工具间的上下文切换和信息损失。统一模型架构可降低复杂任务失败概率。

应用场景广泛

Google为计算机使用定义三个核心场景,包括长时间自动化任务、持续性软件测试和跨应用知识工作。这些场景需在多上下文保持连续工作流。

安全多层防御

Google采用多层防御策略,有针对性对抗训练、企业安全护栏和间接提示注入检测。加上沙箱隔离等构成完整安全边界,但也承认在开放环境管理风险挑战大。

评测风格转变

发布时未强调标准benchmark排名,可能因标准化评测无法反映现实任务复杂性,Google用定性表述暗示对此的自觉。

编辑观点:Google此举是AI Agent领域的重要创新,简化开发且拓展应用场景,虽安全有挑战,但未来有望推动AI在更多领域落地。

http://www.jsqmd.com/news/1078109/

相关文章:

  • 微信消息防撤回技术全解析:从原理到多平台实现方案
  • SpringBoot配置管理最佳实践
  • 机器学习论文精读系统:从arXiv筛选到可复现验证的工程化实践
  • Linux命令:fish
  • 深度剖析Mos:Swift构建的macOS鼠标滚动平滑引擎架构揭秘
  • AppGen:基于Groq LPU的确定性AI应用编译范式
  • Python图像处理三驾马车:Pillow、OpenCV与NumPy实战指南
  • 如何快速找出Windows热键冲突元凶:Hotkey Detective终极指南
  • XUnity自动翻译器终极指南:5分钟实现Unity游戏无障碍本地化
  • 真正开源AI:用区块链重构数据、训练与治理的全链路
  • MediaPipe TouchDesigner插件摄像头连接故障深度解析与系统化解决方案
  • GPT-4参数量真相:为何1.8万亿说法不成立
  • 任意矩阵的Moore-Penrose伪逆
  • IntelliJ IDEA旗舰版安装全流程拆解:从JDK兼容性校验到离线激活的7个关键步骤(附官方验证日志)
  • 2026年用Gemini镜像站解决Java并发编程难题
  • 解密虚幻引擎资源黑盒:FModel实战手册
  • TurtleBot3搭载RealSense D435i硬件集成全指南
  • 从Daugavet性质到超限推广:Banach空间几何的深度探索
  • C语言实现RSA算法:从大数运算到安全工程的深度实践
  • Mac本地运行DeepSeek R-1:Metal加速+q4_k_m量化实战指南
  • 三步搞定downkyi视频旋转:告别竖屏视频方向混乱的终极解决方案
  • 迅雷影音播放器深度评测:编解码能力、硬件加速与功能解析
  • 022、CBAM 插入 Neck 的三个位置与 Head 前的配置:哪一层对分类分支最有利
  • PCL2启动器性能优化指南:5个关键技巧让Minecraft流畅运行
  • MTKClient终极指南:5步掌握联发科设备底层控制的完整解决方案
  • Viewer.js图像查看器:如何为现代Web应用构建专业级图片浏览体验?
  • AI应用方向:AI文档理解与智能处理
  • 告别网盘限速!八大主流网盘直链下载助手完全指南
  • OpenAI替代方案实战指南:5大可落地AI API选型与迁移路径
  • BilldDesk终极指南:免费开源跨平台远程桌面控制软件完全教程