当前位置: 首页 > news >正文

腾讯“小龙虾计划”的技术悖论

引言:一个看似完美的战略,藏着多少技术债务?

2026年3月,马化腾在腾讯财报沟通会上抛出了一个重磅信号:“服务商特别怕被智能体短路化、渠道化,我们在进行生态设计的时候也要考虑这种需求。”

这句话翻译成技术语言是:我们想在微信里塞一个AI Agent,但不能让这个Agent把生态里的中间商干掉。

这听起来像是一个完美的战略——AI提升效率,生态维持繁荣。但如果你稍微懂一点技术架构,就知道这事远没有听起来那么简单。

本文将从三个维度拆解腾讯“小龙虾计划”面临的技术悖论:

1. 技术架构层:如何在一个为人类UI设计的系统里,塞进一个为机器执行设计的AI?
2. 生态利益层:如何让300万小程序开发者不被AI“短路”?
3. 隐私合规层:如何让一个全知全能的Agent,不触碰监管红线?

---

一、技术架构的底层冲突:套壳调用的脆弱性

1.1 API vs GUI:两种交互范式的根本冲突

微信小程序生态是典型的GUI(图形用户界面)交互范式——用户通过点击、滑动、输入等操作与界面元素交互。这个生态的底层逻辑是:界面即接口。

Agent要调用小程序,目前最可行的方式是套壳调用:

```
用户指令 → Agent语义理解 → 视觉识别界面元素 → 模拟点击/输入 → 执行操作 → 返回结果
```

这个流程依赖的核心技术是视觉模型——Agent需要“看懂”当前界面,找到对应的按钮、输入框、选择器,然后模拟人类操作。

致命问题:这个流程对界面变化极度敏感。以美团小程序为例,如果开发者把“立即购买”按钮从屏幕右侧移到左侧,Agent的视觉模型可能就找不到了,整个任务链当场断裂。

对比真正的API调用:

```
用户指令 → Agent解析 → 调用底层API → 返回数据
```

API是契约式接口,只要接口定义不变,界面怎么改都不影响。但微信小程序生态目前没有系统性地暴露给Agent的底层接口。

1.2 为什么不能简单暴露API?

这个问题的答案不是技术问题,而是工程量问题:

· 微信小程序数量:超过300万
· 每个小程序平均API数量:10-50个
· 改造一个小程序的API暴露成本:2-5人天
· 总改造成本:600万-1500万人天,约合30-75亿人民币

更重要的是,谁来驱动?小程序开发者凭什么配合?腾讯能给什么激励?

现状:腾讯正在探索“Agent友好的小程序框架”,允许开发者主动声明哪些能力可以暴露给Agent。但这个框架从设计到普及,至少需要2-3年。

1.3 模型能力的硬伤:混元不够用,外部的又不敢用

The Information的独家报道披露了一个关键细节:微信智能体目前没有用腾讯自研的混元大模型,而是在测试智谱、阿里、DeepSeek和微信自研的小模型。

为什么不敢用混元?

刘炽平自己承认:“通用模型不容易解决很多微信的独有功能。”

微信的“独有功能”包括:

· 社交关系图谱的深度理解
· 支付场景的毫秒级响应
· 小程序生态的精准调度
· 隐私数据的本地化处理

这些都不是一个通用大模型能解决的。混元虽然在训练数据上做了优化,但距离支撑13亿用户量级应用的稳定性和准确性,还有差距。

为什么测试外部模型?

因为外部模型在某些场景确实比混元强。智谱的代码生成能力、阿里的多模态理解、DeepSeek的推理效率,都有各自优势。

但用外部模型的代价是什么?

1. 数据流转风险:用户的社交关系、支付记录、聊天内容要经过外部模型节点
2. 授权链路复杂:每次调用都需要用户授权,体验割裂
3. 责任归属模糊:出问题时,是腾讯的责任还是外部模型厂商的责任?

更致命的成本问题:

一个重度Agent用户,一天的Token消耗可能达到百万级别。假设日活1亿用户,日均Token消耗就是1e14级别。即使按0.001元/千Token计算,单日成本就是1亿人民币。

腾讯2025年GPU采购预算已超千亿,这个钱烧得动。但问题是:烧多久?如果找不到变现模式,这个成本会成为巨大的财务黑洞。

1.4 “OS+GUI”模式的监管风险

上海交大陈天昊教授的分类框架非常清晰:端侧智能体有四种模式,“OS+GUI”模式自由度最高,但也最具颠覆性。

模式 描述 自由度 监管风险
OS+GUI Agent直接操作系统界面 最高 最高
OS+API Agent调用系统API 中 中
App+GUI Agent操作App界面 高 高
App+API Agent调用App接口 低 低

微信智能体目前走的是“OS+GUI”模式——在操作系统层面获取屏幕权限,模拟人类操作。

这种模式的风险已经被监管层关注:

· 认知层攻击风险:智能体可能被恶意提示词劫持,执行非授权指令(如“帮我转1000块给张三”,但用户本意是转10块)
· 目标劫持风险:智能体在运行过程中可能偏离原始目标,做出破坏性行为
· 隐私风险:智能体的全域感知需求与《个人信息保护法》的“最小必要原则”存在冲突

监管层的态度:

全国政协委员张云泉建议,禁止绕过授权的模拟操作,落实“双重授权”原则。工信部旗下机构已经发布了OpenClaw的风险通报,包括非授权执行系统命令、API接口暴露于公网等。

腾讯的应对策略:

· 用安全沙箱限制文件操作范围
· 用官方接口替代协议逆向
· 用户每一步关键操作都需要二次确认

但这本质上是在用封闭换安全,与开源Agent的自由度背道而驰。

---

二、生态利益的结构性博弈:流量分配权的转移

2.1 服务商“怕被短路”的底层逻辑

马化腾说得很直白:“服务商特别怕被智能体短路化、渠道化。”

翻译成技术语言:在传统模式下,用户要完成一个任务,必须“经过”服务商的界面。这个“经过”的过程,就是服务商的流量价值和变现空间。

以美团为例:

· 用户打开美团小程序
· 看到首页推荐、优惠券、广告
· 搜索餐厅,看到付费排名
· 下单,美团抽佣

这是美团的流量漏斗。

Agent模式下的变化:

· 用户说:“帮我订一份附近评分高的湘菜”
· Agent自动搜索、比价、推荐、下单
· 用户全程不需要“经过”美团的界面

结果:美团从“流量入口”变成了“后台供应商”,流量分发权从商家侧转移到了腾讯。

更尖锐的问题:阿里、字节、拼多多、京东这些本身有完整生态的超级App,愿不愿意把自己的服务接口开放给微信Agent调度?

答案显而易见:不愿意。

除非腾讯能给这些巨头足够的利益置换——比如微信流量反哺、数据共享、或投资绑定。但这又会触及反垄断的红线。

2.2 小程序生态的“围墙幻觉”

虎嗅那篇文章有一个很尖锐的观点:小程序生态的围墙,可能只是幻觉。

逻辑是这样的:

· 小程序是为人机交互设计的,用户主动打开、主动操作
· Agent时代,用户不再主动点开任何入口,而是把需求托付给Agent
· Agent会穿透所有平台,选择最优解,而不是被锁在某个生态里

技术实现:Agent可以同时调取微信小程序、支付宝小程序、抖音小程序、甚至独立App,然后综合比较评分、价格、配送时间,选择最优方案。

那微信的14亿月活小程序围墙还管用吗?

答案是:用户可能根本不需要“翻墙”,因为Agent会替用户翻——而翻的方式,不一定是通过微信。

这才是腾讯最怕的:不是别人攻破你的城墙,而是用户自己绕过了城墙。

2.3 商业模式的闭环压力

腾讯的终极目标是:把用户圈在自己的生态里,钱进自己的口袋。

但Agent的商业逻辑和传统平台完全不同:

维度 传统平台 Agent时代
入口 用户主动打开App 用户说一句话
分发 平台推荐算法 Agent自动比价
变现 广告+抽佣 ?
用户粘性 依赖内容/社交 依赖Agent能力

核心问题:如果Agent永远帮用户选最便宜的,那平台的“入口溢价”就消失了。腾讯怎么从Agent的每一次交易里抽成?

一个可能的出路:Visa式转型

从“流量入口”退居“清算网络”。微信支付+身份+社交体系,可以变成Agent时代的信任基础设施:

· 支付通道:每笔交易走微信支付,收千分之几的手续费
· 身份认证:Agent调用需要用户身份验证,微信是天然的身份锚点
· 社交关系:Agent之间的协作需要社交网络,微信是最大的社交图

但问题是:这个转型意味着腾讯要主动放弃入口控制权——这是商业上的自我革命,比技术难一万倍。

---

三、隐私合规的红线挑战

3.1 数据聚合体的监管恐慌

一个同时整合了以下数据的Agent:

· 社交关系(聊天记录、朋友圈、群组)
· 支付记录(消费习惯、收入水平、信用状况)
· 位置轨迹(常去地点、出行规律)
· 消费偏好(购物记录、浏览历史)

从用户视角看是便利的生活助理,从监管视角看是前所未有的超级数据聚合体。

监管机构担心的:

· 这个聚合体是否会被滥用?
· 数据是否会泄露?
· 是否会被用于不正当竞争?
· 是否会形成新的“数据垄断”?

全国政协委员陆铭也指出,AI手机在调用聊天记录时,可能涉及他人的聊天信息、敏感的银行支付信息甚至公共安全领域问题——这些都是制度上的真空地带。

腾讯现在的做法:

在产品设计层面划定清晰的数据边界,明确哪些数据Agent能碰、哪些不能:

· 敏感数据(支付密码、身份证号)永不触碰
· 私密数据(聊天内容)需要用户显式授权
· 公开数据(小程序操作)默认可调用

但这需要比技术实现本身更高的产品设计能力。

3.2 责任界定的法律真空

当AI Agent代替用户操作并产生误操作或损失时,谁来承担责任?

场景示例:

· Agent帮用户订酒店,误选了不可退款的选项
· Agent帮用户转账,填错了收款人
· Agent帮用户发消息,发错了群

可能的归责路径:

1. 用户全责:Agent是用户的工具,用户对一切行为负责(类似汽车司机)
2. 腾讯全责:Agent是腾讯的产品,腾讯对错误行为负责(类似电商平台)
3. 责任分摊:根据过错比例划分责任(类似自动驾驶事故)

现行法律的问题:

· 行为溯源困难:无法准确定位是Agent的自主行为还是用户的授权行为
· 平台中立性:腾讯既是Agent提供者,又是生态规则制定者,存在利益冲突
· 法律滞后:没有专门针对AI Agent的法律框架

张云泉委员的建议:

建立第三方安全检测机制,将安全理念贯穿技术研发与应用全流程。

但问题是:在监管细则出台之前,腾讯只能摸着石头过河——这本身就是巨大的合规风险。

---

四、总结:三个“不可能三角”

综合以上分析,腾讯“小龙虾计划”面临三个根本性的“不可能三角”:

4.1 技术三角

```
AI足够聪明 ←→ 数据不出域 ←→ 推理成本可控
```

· AI足够聪明:需要大模型+外部数据+复杂推理
· 数据不出域:需要在端侧完成,模型能力受限
· 推理成本可控:需要模型足够小,又牺牲能力

现状:腾讯在三个角之间反复权衡,目前偏向“数据不出域+成本可控”,牺牲了一部分AI能力。

4.2 生态三角

```
服务商愿意配合 ←→ 腾讯保持控制 ←→ 用户体验流畅
```

· 服务商愿意配合:需要腾讯让利,让服务商有利益空间
· 腾讯保持控制:需要保留入口权、数据权、规则制定权
· 用户体验流畅:需要Agent无缝调用,不打断用户

现状:这三个角天然冲突。腾讯目前的选择是“用户体验优先”,这意味着在某些场景下,服务商的利益会被压缩。

4.3 商业三角

```
Agent效率最大化 ←→ 平台抽成可持续 ←→ 开发者有利可图
```

· Agent效率最大化:永远帮用户选最优方案,可能绕开平台
· 平台抽成可持续:需要Agent把流量导给平台,而不是绕开
· 开发者有利可图:需要Agent给开发者带来增量收益

现状:这三个角几乎不可能同时满足。腾讯的选择是“开发者有利可图优先”,因为生态崩了一切都完了。

---

尾声:刘炽平说的“没有特定时间表”

刘炽平在财报沟通会上说得很实在:

“这个事没有特定时间表,但正在积极向前推进。”

翻译成人话:我们知道很难,但不得不做。不做就是死,做了可能死得更快——但万一成了呢?

这才是腾讯这场豪赌的真相。

三个可能的终局:

1. 最优结局:微信成为Agent时代的“操作系统”,所有Agent调用都要经过微信,腾讯成为新的基础设施
2. 中间结局:Agent生态去中心化,微信只是众多入口之一,腾讯守住支付和社交的基本盘
3. 最差结局:Agent直接取代App,用户不再需要任何“入口”,微信从超级App退化成普通工具

你觉得会是哪一个?

---

本文首发于CSDN,欢迎技术讨论。

参考文献:

1. 腾讯2025年第四季度及全年财报沟通会实录(2026.3.18)
2. The Information:“Tencent’s WeChat Tests AI Agents That Can Act on Behalf of Users”(2026.2)
3. 虎嗅:“微信智能体的‘围墙’可能只是幻觉”(2026.3)
4. 张云泉委员提案:“关于规范AI Agent应用的若干建议”(2026.3)
5. 陈天昊:“端侧智能体的四种模式与监管分类”(《中国法律评论》,2025年第4期)

http://www.jsqmd.com/news/543795/

相关文章:

  • 告别WebGL输入噩梦:Unity开发者的终极救星来了
  • OpenClaw技能市场:Qwen3.5-4B-Claude专属5个实用技能推荐
  • 保姆级教程:在Ubuntu 22.04上用Docker Compose一键部署GZCTF靶场(附配置文件详解)
  • Wan2.2-I2V-A14B效果对比评测:不同提示词工程下的生成质量分析
  • 当AI安全遇上生成式对抗:AdvGAN如何绕过主流防御?一份给安全工程师的攻防指南
  • winrar去除广告、去除序列号注册
  • 终极Chrome密码找回指南:使用ChromePass快速恢复遗忘的登录凭据
  • 2026中国石油石化企业信息技术交流大会5月在京启航
  • Jenkins在Docker里启动总报错?试试这个一劳永逸的目录权限预设脚本(支持CentOS/Ubuntu)
  • Python金融风控建模黄金公式:特征工程×样本加权×对抗验证=通过央行《模型风险管理指引》认证
  • SDMatte Web服务监控方案:Prometheus+Grafana显存/请求/延迟看板
  • 2026年市面上口碑好的双缸四柱液压机源头厂家推荐榜单,金属拉伸/零件冲压/粉末压制/工件校直/双缸同步/自动化生产线,双缸四柱液压机制造企业如何选 - 品牌推广师
  • 基于Matlab的无线传感器网络部署仿真探索
  • 手把手教你用红石比较器打造Minecraft自动物品分类机(1.20+版本适用)
  • 基于Vue.js的Qwen3-ForcedAligner-0.6B可视化操作界面开发
  • S7-200plc和MCGS组态自动化搬运机械手的组系统设计 我们主要的后发送的产品有,带解释...
  • 从2kg到10kg:不同规模中试冻干机选型指南与厂家推荐 - 品牌推荐大师
  • AutoDL云服务器+PyCharm远程调试:5分钟搞定Python环境同步(含SFTP配置技巧)
  • 告别卡顿!用MediaCodec的Surface编码,在Android上实现60FPS视频合成(附EGL+OpenGL完整代码)
  • c++有哪些新特性并简单举例-[11,14,17,20,23]
  • 突破Windows苹果设备连接限制:Apple-Mobile-Drivers-Installer的自动化驱动解决方案
  • 1-k8s集群安全-Role_RoleBinding
  • 实战指南|安科士155M SFP 160km光模块部署与运维技巧
  • s2-pro GPU部署实操:显存优化配置与高并发语音合成调优指南
  • OpenClaw故障排查大全:Qwen3.5-9B接口连接失败解决方案
  • 自动化办公闭环:OpenClaw+Qwen3.5-4B-Claude处理审批流
  • 深度解析:Beyond Compare 5授权机制与密钥生成技术
  • 从零构建超图:HGNN+论文中三种超边生成策略的实战解读与避坑指南
  • 技术融合驱动工程创新:PyAEDT如何提升仿真自动化与多物理场分析开发效率
  • 集群节点维护