阿里云与谷歌同步全栈重构:入口、Token与芯片的变革之路
入口重构:当人类不再是云的主要消费者
5月20日,阿里云上线“千问云”,首页仅一句让Agent自己安装技能的指令“安装 Skills npx skills add QianWen - AI/qianwen - ai”,没有产品列表、控制台入口和繁复导航。这是阿里云成立17年来,首次在主站之外推出的全新产品官网。同一时间,谷歌开发者大会也抛出云计算主要用户正从人变成智能体的信号。
年初,阿里云内部判断未来云计算产品主要使用对象将从人类工程师变成Agent。阿里云官网自2009年诞生起界面逻辑未变,人类登录、浏览菜单、手动配置参数,但这对Agent毫无意义,Agent需要结构化能力描述、明确调用协议和可预期反馈机制。
刘伟光透露,春节“龙虾”爆火后,外部客户上线类“龙虾”产品,“龙虾”自动激活云计算资源,过去人类工程师花两周完成的资源开通,一天内就能完成。基于此观察,阿里云推出千问云,其定位是“一个纯粹for AI的、for Agent的官网”,设计简洁,以售卖模型及相关应用为主,全面Skill化,让Agent调用体验更好。以前人进网站先找数据库,未来Agent进来先找模型,千问云体现了阿里云全面for Agent的转向决心。
Token经济:从“锦上添花”到“核心引擎”的15倍跃进
入口变迁的核心动力是Token经济的爆炸性增长。Coding能力的跃迁让云厂商看到新服务空间。刘伟光复盘称,去年Token支出在企业IT预算里不到1%,AI只是“提效”,但Coding能力出现后,AI开始创造人类做不了的工作。例如,AI能解构老代码老应用并搬上云,带来新应用。
推理模型和视频模型的能力跃迁也带来更大变化。客户基于开源模型加独有数据调优做三个月,新大尺寸模型出现后将其碾压。在视频领域,未来中国广告业会有很大改变。AI能力带来的价值跃迁体现在付费意愿上,AI原生创业企业Token支出占IT成本100%,互联网类企业达15% - 20%,传统企业在5%以下。
刘伟光澄清市场认知误区,应“分模态、分模型去看市场空间”。阿里云对销售团队提出多维目标,包括付费Token客户数增长数和覆盖率、客户用Token解决刚需及接入核心系统情况、阿里模型生成的Agent自主完成闭环的效率等。对于AI商业模式收费方式,刘伟光认为终极目标是结果付费,目前按量收费较多,但已看到客户愿意为结果付费的苗头。
芯模暗战:为何必须走“谷歌TPU之路”
支撑Token经济大厦的芯片面临不确定性。阿里云峰会上首次公布真武系列芯片路线图,最新亮相的M890芯片,144GB显存,片间互联带宽800GB/s,性能是上一代810E的3倍。平头哥半导体副总裁高慧表示,全栈自研芯片矩阵是为实现算力、网力、存力的系统级协同,还公布了未来两年的迭代路径。
刘伟光称,与初创芯片公司不同,真武芯片在市场验证很久后才推向市场,已在阿里巴巴内部、蚂蚁、智能驾驶、金融行业、政务行业、运营商等领域得到广泛认可。他认同“谷歌路线”,认为自己的芯片和模型能达到最好性价比,若能跑出更多、更高质量的token就胜利了。
一个月前,谷歌连发自研芯片对抗英伟达,CFO披露谷歌年度资本支出预计上调。谷歌I/O 2025开发者大会上,谷歌亮出全栈协同牌。中美两家头部云厂商押注自研芯片与全栈协同,揭示行业竞争逻辑转向“谁能用更低的芯片成本产出更高质量的Token”。
峰会披露,Qwen3.7 - Max在M890芯片上自主工作35小时,完成生产级AI计算内核编写与调优,性能较官方版本提升10倍。刘伟光称推理市场已拿到20%以上,大客户账未输过,但新兴市场增速快,关键是打赢未来。过去五个月,阿里云百炼平台LLM的Token ARR增长了15倍。阿里云底气来自存量转化和Agent辅助识别客户方向,AI Agent爆发将拉动GPU、CPU和存储增长,阿里云未来业务增长空间来自公共云MaaS、私有部署和CPU云。
从千问云面向Agent的代码开始,阿里云和谷歌在5月不约而同选择全栈重构。入口改变因用户变了,Token爆炸因价值变了,芯片加速因命脉不能放别人手里,Token经济与云基础设施的逻辑链正被重构改写。
