当前位置：首页 > news >正文

AI 浏览器 Tabbit 实测：Agent 模式如何操作网页，以及多模型接入方案

news 2026/6/24 2:57:39

背景

最近 AI 浏览器这个赛道比较热闹，豆包、夸克都出了自己的产品。但多数实现思路还是"传统浏览器 + 侧边栏对话框"，AI 和浏览过程是割裂的。我比较感兴趣的是另一条技术路线：把 Agent 能力直接嵌入浏览器操作流程，让 AI 能真正"操作"网页。

带着这个目的，我用了几个月美团旗下 GN06 团队（原光年之外团队）做的 AI 原生浏览器Tabbit，这篇文章记录一下它的 Agent 机制和多模型架构，供做技术选型的同学参考。Tabbit 1.0 正式版已上线，基础功能免费。

下载地址：抽奖活动邀请Tabbit Browser, Your Life Co-Pilothttps://web.tabbit.com/activity/lottery/invite/D93C4899

一、整体架构

Tabbit 把"网页浏览、全网搜索、AI 对话、任务执行"四件事统一到了一个输入框里。它的核心差异不在对话能力，而在Agent 代理模式：用户用自然语言下达指令后，Agent 会模拟真人操作浏览器，自动完成页面跳转、搜索、填表、多页信息采集等动作，并输出结构化结果。

从交互逻辑上看，它不是"对话式 AI"，而是"执行式 AI"。

二、Agent 代理模式实测

1. 任务执行流程

我测了一个比较典型的场景：让 Agent 帮我生成一个禁止 Windows 自动锁屏的小工具。正常实现路径是要么自己写代码编译，要么找现成方案。我直接在输入框下指令，Agent 的执行过程大致是：

自动检索相关技术资料和实现方案
组织代码逻辑
生成一个 exe 可执行文件

整个过程我没有手动参与编码，最终产出的文件可以直接运行。这个"指令 → 自动执行 → 产出可用文件"的链路，是它和普通对话式 AI 浏览器的主要区别。除了 exe，Agent 还支持生成 PPT、Word、Excel、PDF 等格式，适合做调研报告、数据整理这类多步骤任务。

2. 上下文管理

一个值得提的点是上下文引用。Tabbit 支持把当前打开的网页、浏览器收藏、本地文件、文件夹内容直接作为任务上下文，不用手动复制粘贴。收藏夹还会对网页全文做索引，方便后续检索调用。这一点比独立的 AI 对话框更有优势，因为浏览器天然掌握着用户最完整的上下文信息。

三、多模型接入方案

这是 Tabbit 架构上比较开放的一个设计。它接入了多款国产主流大模型，包括 DeepSeek、Kimi、智谱 GLM、豆包、千问、LongCat 等，可以随时切换，也支持多模型结果对比。

各家产品的模型策略不同，做个简单对比：

对比项	Tabbit	豆包浏览器	夸克浏览器
模型接入	多模型聚合，可切换	绑定豆包	绑定夸克自研
Agent 网页操作	支持	侧边栏对话为主	侧边栏对话为主
文件生成能力	支持 PPT/Word/Excel/PDF/exe	以对话为主	以对话为主

多模型聚合的好处是，模型迭代很快，单一绑定存在"模型不是当前最优"的风险。官方数据显示超过 60% 的活跃用户会主动切换模型，平均每人使用 2 个以上，说明用户在不同场景下确实有不同的模型偏好。

国际版还接入了 ChatGPT 和 Claude，每周有指定免费额度，适合偶尔需要国外模型的场景。

四、使用流程记录

1. 安装与数据迁移

安装后，Tabbit 会自动识别电脑上已有的浏览器，询问要导入的书签、标签页、扩展、账户信息，确认后几分钟内完成迁移，包括当时打开的网页。迁移成本比较低。

2. 开启 Agent 模式

首页默认是一个全能输入框（默认搜索模式）。在设置里开启「智能代理」开关后，输入任务指令，Agent 会接管执行。

3. 妙招功能

可以把高频提示词保存为「妙招」，下次输入/一键调用。我固定了"竞品信息搜集 + 对比表格"和"网页评论抓取 + 分析报告"两个模板，重复任务效率提升明显。

五、几点使用体会

用下来几个直观感受：

Agent 模式比较适合调研、对比、数据收集这类多步骤、多网页的任务，重复性劳动交给它比较划算。
模型选择上，DeepSeek 偏代码和逻辑类任务，Kimi 适合长文本处理，智谱 GLM 综合表现稳定，建议按任务类型选。
国际版额度有限，重要任务建议留在国产模型侧，国际版作为补充。

整体来看，Tabbit 的技术路线和多数"浏览器 + 对话框"的产品不太一样，把 Agent 执行能力做进了浏览器主流程里，对于每天在浏览器里处理大量信息的开发者、运营和内容创作者，是一个值得关注的方案。

想体验的同学点击下方链接下载抽奖活动邀请Tabbit Browser, Your Life Co-Pilothttps://web.tabbit.com/activity/lottery/invite/D93C4899。

http://www.jsqmd.com/news/1070181/

相关文章：

每天运营Instagram，却始终0客户咨询？

苹果电脑录屏怎么带声音？3 种实用方法

Spring Boot原生集成Nacos的3种方式

中国古代的科技之谜——图灵竟是老子转世，而C++里藏着“道”的源代码

RTranslator离线翻译模型快速部署终极指南：告别漫长下载，5分钟完成安装

大模型应用开发 · 极速学习手册

如何免费获取国家教育平台电子课本：终极离线使用指南

设计师AI创意工具选型指南（2024年Q2权威评测版）：基于87家设计团队、1268小时工作流埋点分析

Serenity-skill解决方案：构建AI驱动的供应链瓶颈投资研究系统

深度解析mpv命令行播放器：如何在Intel UHD显卡上实现4K/8K超高清流畅播放

终极指南：如何免费让2007-2015年老款Mac焕发新生

GLM-5.2 深度解读：智谱新一代旗舰模型，如何重新定义开源大模型的性能边界？

深度解析游戏逆向工程：AES加密破解与模组开发实战指南

火山引擎 FORCE 大会开幕，豆包大模型 1.8 发布，Seedance 月入 10 亿

3分钟学会：如何一键下载国家中小学智慧教育平台电子课本

Pingora 深度解析：Cloudflare 下一代 Rust 高性能代理

Agent 的工具是如何被大模型使用的

本地部署ChatGLM3、Qwen2、DeepSeek-V3全栈实操：手把手配置CUDA 12.4+Triton+vLLM，3步实现吞吐翻倍、延迟压至87ms

Windows系统管理终极指南：Chris Titus Tech WinUtil一键搞定所有烦恼

终极指南：如何在Intel UHD显卡上配置MPV实现4K视频流畅播放

普通软件接入 AI API 的完整方案：功能设计、接口封装、鉴权配置与常见排错

设置目标IP的端口是否开放

遥感水环境智能监测：从数据预处理到AI反演的60个实战案例

联想百应AI主机300 vs ibbot青春版：当26999元的本地工作站遇到1999元的AI手机，谁更懂AI原生时代？

5分钟掌握Chatterbox：开源语音合成的完整实践指南

Pose-Search：用人体姿态解锁图像搜索的终极指南

PyPDF终极指南：Python中最强大的PDF处理库完全解析

终极指南：四步让旧Mac免费升级最新macOS系统

怀宁设计公司哪家值得选

Mac右键菜单功能少？MouseBoost Pro v5.1.0 帮你一键扩展