当前位置: 首页 > news >正文

AI 浏览器 Tabbit 实测:Agent 模式如何操作网页,以及多模型接入方案

背景

最近 AI 浏览器这个赛道比较热闹,豆包、夸克都出了自己的产品。但多数实现思路还是"传统浏览器 + 侧边栏对话框",AI 和浏览过程是割裂的。我比较感兴趣的是另一条技术路线:把 Agent 能力直接嵌入浏览器操作流程,让 AI 能真正"操作"网页

带着这个目的,我用了几个月美团旗下 GN06 团队(原光年之外团队)做的 AI 原生浏览器Tabbit,这篇文章记录一下它的 Agent 机制和多模型架构,供做技术选型的同学参考。Tabbit 1.0 正式版已上线,基础功能免费。

下载地址:抽奖活动邀请Tabbit Browser, Your Life Co-Pilothttps://web.tabbit.com/activity/lottery/invite/D93C4899


一、整体架构

Tabbit 把"网页浏览、全网搜索、AI 对话、任务执行"四件事统一到了一个输入框里。它的核心差异不在对话能力,而在Agent 代理模式:用户用自然语言下达指令后,Agent 会模拟真人操作浏览器,自动完成页面跳转、搜索、填表、多页信息采集等动作,并输出结构化结果。

从交互逻辑上看,它不是"对话式 AI",而是"执行式 AI"。


二、Agent 代理模式实测

1. 任务执行流程

我测了一个比较典型的场景:让 Agent 帮我生成一个禁止 Windows 自动锁屏的小工具。正常实现路径是要么自己写代码编译,要么找现成方案。我直接在输入框下指令,Agent 的执行过程大致是:

  1. 自动检索相关技术资料和实现方案
  2. 组织代码逻辑
  3. 生成一个 exe 可执行文件

整个过程我没有手动参与编码,最终产出的文件可以直接运行。这个"指令 → 自动执行 → 产出可用文件"的链路,是它和普通对话式 AI 浏览器的主要区别。除了 exe,Agent 还支持生成 PPT、Word、Excel、PDF 等格式,适合做调研报告、数据整理这类多步骤任务。

2. 上下文管理

一个值得提的点是上下文引用。Tabbit 支持把当前打开的网页、浏览器收藏、本地文件、文件夹内容直接作为任务上下文,不用手动复制粘贴。收藏夹还会对网页全文做索引,方便后续检索调用。这一点比独立的 AI 对话框更有优势,因为浏览器天然掌握着用户最完整的上下文信息。


三、多模型接入方案

这是 Tabbit 架构上比较开放的一个设计。它接入了多款国产主流大模型,包括 DeepSeek、Kimi、智谱 GLM、豆包、千问、LongCat 等,可以随时切换,也支持多模型结果对比。

各家产品的模型策略不同,做个简单对比:

对比项Tabbit豆包浏览器夸克浏览器
模型接入多模型聚合,可切换绑定豆包绑定夸克自研
Agent 网页操作支持侧边栏对话为主侧边栏对话为主
文件生成能力支持 PPT/Word/Excel/PDF/exe以对话为主以对话为主

多模型聚合的好处是,模型迭代很快,单一绑定存在"模型不是当前最优"的风险。官方数据显示超过 60% 的活跃用户会主动切换模型,平均每人使用 2 个以上,说明用户在不同场景下确实有不同的模型偏好。

国际版还接入了 ChatGPT 和 Claude,每周有指定免费额度,适合偶尔需要国外模型的场景。


四、使用流程记录

1. 安装与数据迁移

安装后,Tabbit 会自动识别电脑上已有的浏览器,询问要导入的书签、标签页、扩展、账户信息,确认后几分钟内完成迁移,包括当时打开的网页。迁移成本比较低。

2. 开启 Agent 模式

首页默认是一个全能输入框(默认搜索模式)。在设置里开启「智能代理」开关后,输入任务指令,Agent 会接管执行。

3. 妙招功能

可以把高频提示词保存为「妙招」,下次输入/一键调用。我固定了"竞品信息搜集 + 对比表格"和"网页评论抓取 + 分析报告"两个模板,重复任务效率提升明显。


五、几点使用体会

用下来几个直观感受:

  • Agent 模式比较适合调研、对比、数据收集这类多步骤、多网页的任务,重复性劳动交给它比较划算。
  • 模型选择上,DeepSeek 偏代码和逻辑类任务,Kimi 适合长文本处理,智谱 GLM 综合表现稳定,建议按任务类型选。
  • 国际版额度有限,重要任务建议留在国产模型侧,国际版作为补充。

整体来看,Tabbit 的技术路线和多数"浏览器 + 对话框"的产品不太一样,把 Agent 执行能力做进了浏览器主流程里,对于每天在浏览器里处理大量信息的开发者、运营和内容创作者,是一个值得关注的方案。

想体验的同学点击下方链接下载抽奖活动邀请Tabbit Browser, Your Life Co-Pilothttps://web.tabbit.com/activity/lottery/invite/D93C4899

http://www.jsqmd.com/news/1070181/

相关文章:

  • 每天运营Instagram,却始终0客户咨询?
  • 苹果电脑录屏怎么带声音?3 种实用方法
  • Spring Boot原生集成Nacos的3种方式
  • 中国古代的科技之谜——图灵竟是老子转世,而C++里藏着“道”的源代码
  • RTranslator离线翻译模型快速部署终极指南:告别漫长下载,5分钟完成安装
  • 大模型应用开发 · 极速学习手册
  • 如何免费获取国家教育平台电子课本:终极离线使用指南
  • 设计师AI创意工具选型指南(2024年Q2权威评测版):基于87家设计团队、1268小时工作流埋点分析
  • Serenity-skill解决方案:构建AI驱动的供应链瓶颈投资研究系统
  • 深度解析mpv命令行播放器:如何在Intel UHD显卡上实现4K/8K超高清流畅播放
  • 终极指南:如何免费让2007-2015年老款Mac焕发新生
  • GLM-5.2 深度解读:智谱新一代旗舰模型,如何重新定义开源大模型的性能边界?
  • 深度解析游戏逆向工程:AES加密破解与模组开发实战指南
  • 火山引擎 FORCE 大会开幕,豆包大模型 1.8 发布,Seedance 月入 10 亿
  • 3分钟学会:如何一键下载国家中小学智慧教育平台电子课本
  • Pingora 深度解析:Cloudflare 下一代 Rust 高性能代理
  • Agent 的工具是如何被大模型使用的
  • 本地部署ChatGLM3、Qwen2、DeepSeek-V3全栈实操:手把手配置CUDA 12.4+Triton+vLLM,3步实现吞吐翻倍、延迟压至87ms
  • Windows系统管理终极指南:Chris Titus Tech WinUtil一键搞定所有烦恼
  • 终极指南:如何在Intel UHD显卡上配置MPV实现4K视频流畅播放
  • 普通软件接入 AI API 的完整方案:功能设计、接口封装、鉴权配置与常见排错
  • 设置目标IP的端口是否开放
  • 遥感水环境智能监测:从数据预处理到AI反演的60个实战案例
  • 联想百应AI主机300 vs ibbot青春版:当26999元的本地工作站遇到1999元的AI手机,谁更懂AI原生时代?
  • 5分钟掌握Chatterbox:开源语音合成的完整实践指南
  • Pose-Search:用人体姿态解锁图像搜索的终极指南
  • PyPDF终极指南:Python中最强大的PDF处理库完全解析
  • 终极指南:四步让旧Mac免费升级最新macOS系统
  • 怀宁设计公司哪家值得选
  • Mac右键菜单功能少?MouseBoost Pro v5.1.0 帮你一键扩展