当前位置: 首页 > news >正文

阿里千问落地谷歌UCP+A2UI,中国率先进入AI办事时代

刚刚,阿里千问App上线千问任务助理1.0,目前可以通过客户端申请邀测。

千问打通了淘宝、支付宝等核心业务,标志着中国互联网正式进入AI办事时代。AI从单纯的对话框聊天,迈向了真正的办事助手。

前不久,谷歌在大洋彼岸联合零售巨头发布了面向智能体商务的开放标准UCP(Universal Commerce Protocol,通用商务协议),和A2UI(Agent to UI)协议,试图定义智能体商务的全球标准。

而阿里直接利用庞大的本土生态让千问成为能买票、能点餐、能办公、能办事、能写代码的超级执行者。

谷歌通用协议与阿里生态闭环

人类在这个星球上的数字化生存正面临一场底层逻辑的重构。

过去二十年互联网建立在一个个独立的应用程序孤岛之上,现在人工智能试图打破这些墙壁。

大洋彼岸的谷歌选择了铺设铁轨。

谷歌意识到要让一个智能体助手为用户完成购物,现有的技术路径存在巨大的积木式集成难题。

没有统一标准之前,每一个智能体平台对接每一个电商平台,都需要适配各自独特的API接口、字段定义和认证方式。

谷歌联合Shopify、沃尔玛、Target、Visa、Stripe等二十多家零售和支付巨头,发布了面向智能体商务的开放标准UCP通用商务协议。

UCP试图解决的问题非常聚焦,它要确立Agent如何与电商与支付系统打交道。

谷歌希望建立一套统一的开放标准,让任意一个AI Agent平台与任意一个电商平台或支付提供商接入时,都只需对接同一套通用语言。

UCP在构想中成为了智能体商务领域的HTTP协议、OpenAPI规范与支付网关规范的综合体。

从商品发现、下单、支付到售后的整条链路,Agent都可以通过一套标准化能力来完成。

近期甚至有消息称蚂蚁国际正与谷歌共推UCP,试图在跨境与多场景支付上打通AI智能体通路。

在解决后端交互的同时,谷歌通过A2UI协议重新定义了前端界面的生成方式。

根据谷歌官方开发者博客与开源文档,A2UI是一种让AI Agent用一种安全、声明式、基于JSON的格式来描述用户界面,而不是直接输出可执行代码的开放协议。

A2UI的核心目标在于安全、跨平台与大模型友好。

Agent只能发送界面蓝图,不能发送任何要在本地执行的脚本,这从根源上规避了恶意代码的风险。

一次描述可以在Web、移动、桌面等多端用原生控件渲染,扁平的JSON结构配合ID引用非常适合模型进行增量生成与更新。

未来智能体不再只是在对话框里聊天,而是随时能为用户画出一个小应用界面,这些界面可以在任意宿主里安全运行。

谷歌的A2UI加上UCP描绘了一个长远的图景,允许任意AI助手共享一套标准化语言来画界面、办交易,摆脱单一平台的捆绑。

在谷歌致力于制定标准时,阿里在中国本土选择了一条更为直接的落地路径。

阿里千问并没有等待全行业的标准统一,直接按下了快进键。

1月15日,阿里巴巴在杭州为千问App举办了一场发布会。

这次发布会被定义为从聊天对话迈入AI办事时代。

千问App一口气上线了400多项办事功能,利用阿里生态庞大的电商和生活服务数据,让规划与执行能力迅速在真实场景里迭代。

在阿里生态内,千问把大模型做成能执行的超级入口,实现了以中国本土超强生态为基座的闭环执行型AI助手。

AI不会只停留在能说会道的阶段,它已经开始真正帮人办事,并且很快会成为数字世界最底层的那层操作系统。

智能体接管生活服务与政务办事

千问此次升级最引人注目的变化在于它几乎接入了整个阿里系生活圈。

千问App已经全面接入淘宝、淘宝闪购、支付宝、飞猪、高德地图以及淘票票等服务。

阿里线上高频生活服务的大部分入口和能力,都被抽象成了千问可以直接调用的一套工具体系。

用户不再需要在淘宝、飞猪、高德、支付宝之间来回切换,而是把需求用一句自然语言说给千问,后面的搜索、决策、下单、支付等步骤都由AI接管。

以外卖场景为例,用户只需在千问App对话框输入“早餐想要吃包子”。

千问会在后台自动调用淘宝闪购服务,依据用户授权的常用收货地址以及实时定位,检索附近可配送商家。

界面上随后会出现一张包含商品和门店信息的卡片,展示商品名称、规格、店铺评分与距离以及价格优惠信息。

用户可以在卡片上点击选它确认方案,或者点击下一个让千问换一家更合适的。

如果触发起送门槛,千问会主动提醒可以凑单,并推荐合适的搭配商品,自动算好满减优惠。

用户确认订单后,千问在对话界面中直接展示支付宝付款按钮,点击即可完成支付,无需跳转到独立的支付宝App。

这种体验的根本变革在于用户只表达意图,而不是点击若干级菜单。

商品搜索、替换商家、优惠选择、凑单、下单链路被整体交给AI,并在对话界面内完成了支付闭环。

在更为复杂的出行场景中,千问通过接入飞猪与高德,初步实现了一条对话规划整趟出行。

例如,用户提出春节去三亚旅游三天两晚的需求,千问能够完成行程规划、机票预订、酒店选择、交通导航乃至餐厅预订。

它会根据出发地、预算、人数和时间偏好给出包括机票、酒店、景点和餐厅在内的行程安排。

调用飞猪按照用户偏好比价并推荐机票方案,结合高德的地理位置和扫街榜评分找出交通便利的高分住宿点。

千问甚至内置了AI打电话订餐厅的能力,用户只需说出帮我明晚7点在西湖边找家人均150左右的杭帮菜餐厅,四人位,能停车。

千问会根据数据筛选餐厅,下发一个拨号任务给AI打电话服务,由AI与商家沟通预订细节并将结果反馈给用户。

这背后是一种人到智能体再到人的链式协同,AI不再只是一个向导,而是可以代替用户去和人沟通的数字助手。

政务民生服务的接入则体现了AI在公共服务领域的价值。相信也将很快能体验到。

千问深度打通了支付宝政务服务的能力,首批接入签证、户口、公积金等50项高频民生服务。

用户直接询问杭州户口怎么办护照,或者查询公积金余额和缴纳记录,千问会自动检索对应地区的最新政策文本,做自然语言的精简解读,列出材料清单、办理流程和办理时限,并给出直达办理入口,跳转到支付宝的对应政务服务模块。

这一步实质上是把过去需要自己上网搜、到处找入口、看一堆PDF文件的繁琐动作,压缩到与AI的一两轮对话中。

在中国正式推动高效办成一件事的政务改革背景下,这种对话式政务入口成为了让普通人真正能用得上政务数字化的关键一环。

重新定义数字世界的生产力

阿里副总裁吴嘉表示,千问任务助理1.0几乎可以执行数字世界所有类型的任务,核心覆盖400多种场景,包括应用开发、Office办公、学习辅导、咨询调研和生活办事。

在办公场景中,报表整理变得异常轻松。

用户拖入近百张格式不一的电子发票,只需一句“帮我生成年度报销台账”,千问会自动识别开票日期、金额、抬头等字段,生成统一结构的Excel。

汇报材料的制作也变得简单,用户上传一张数据截图,要求分析这些数据并写一个汇报稿,千问可以输出图表、文字分析、结论与建议。

调研报告的撰写也能一键完成,给出调研主题如新能源车在一线城市的用户口碑,千问会并行检索多源信息,拼出一篇结构完整的调研稿。

千问还具备了生成小工具的能力。

用户只要描述需求,比如需要一个婚礼请柬生成器、年会抽奖程序或简单互动H5,千问就能生成可直接分享的网页,全程不需要用户懂代码。

这种能力将软件开发的门槛极度降低,让每个人都能成为轻量级应用的创作者。

为了解决大模型可能存在的幻觉问题,阿里特别强调引入了双重核查机制。

对于关键数据和结论,用户可以调用第三方Agent做交叉验证,从而降低模型一本正经地胡说八道的风险。

这实际上是在探索一种多智能体互为制衡的安全架构,在未来可能成为企业采用大模型时的标配。

全球范围内,A2UI加UCP描绘了开放协议的未来,允许任意AI助手共享标准化语言。

而在阿里生态内,凭借庞大的电商和生活服务数据,千问迅速将规划与执行能力在真实场景里落地。

两条路线正在合围同一个未来,让AI不仅能聊、能答,还要能计划、能执行,成为真实世界里的数字行动者。

http://www.jsqmd.com/news/254823/

相关文章:

  • 浙大陆展团队突破铁催化难题,实现高效氢联硅化反应 | 乐研试剂
  • P3349 [ZJOI2016] 小星星 - Link
  • 企业如何破解业法财融合痛点?AI风控探针的 4 个落地步骤
  • Nature发表、Science点赞!清华揭秘AI让科学家走捷径却让科学走窄路
  • 【RAG召回排序】2025最全排序模型梳理
  • AI技术唾手可得的时代,挖掘新需求是产品突围的关键——某知名聚合DNS管理系统的需求洞察
  • 编程已终结!AI时代的原生智能软件架构长啥样?Claude给了个指南
  • 安卓神器 --- 浏览器 之 yandex 狐猴浏览器 chrome firefox
  • P11714 [清华集训 2014] 主旋律 Sol
  • 夏天还不算开始——我,不会退役
  • GD5F1GM7UEYIGR:兆易创新1Gbit SPI NAND闪存,高效低功耗
  • 4B超越8B比肩30B!清华、面壁智能端侧智能体天花板开源
  • 企业软件供应链安全治理立项,方案书/立项书该怎么写?
  • [Non] 字符串问题
  • 谷歌Veo 3.1更新:更一致性、更具创造力和控制力
  • 评正高写书10万字什么价格?
  • Day15对象的方法与遍历对象
  • SCI分区是怎么划分的?
  • 深圳ACFlow智能营销系统:2026年中小企业AI驱动营销新范式
  • ACP:2.从一个 .NET 实战开始,看 Agent 带来的真实差异
  • 工业级文本转SQL新思路:成本暴降、超3000列超大数据库依然稳健
  • C++跨平台开发挑战的技术
  • 万卡的部署架构
  • IDM插件开发创意赛
  • Claude Code 在 Windows 下的 nul 文件问题解决方案
  • 建模智能体,AI 时代的数据治理新范式
  • DCDN和CDN科普:动态内容加速的秘密武器
  • 苹果手机照片怎么导入电脑?苹果手机传输照片就用这5招
  • 7843784538745
  • 探索AI原生应用领域,AI代理引领新潮流