AI 手机要成“分身”:技术易破局,生态难题何解?
AI 手机要成“分身”,技术易破局,生态难题何解?
2007 年,乔布斯在发布会上称 iPhone 是“一部革命性的手机”。不过,若乔帮主活到现在,或许会觉得这场革命还不够彻底。
手机的演化,表面看是“技术带来生态变化,生态变化又带来消费者行为变化”,往深里看,背后逻辑是人与手机的关系质变,人与机器的边界不断模糊。
诺基亚时代,手机是通讯工具,用于打电话、发短信,其存在感仅在你主动拿起它时。iPhone 出现后,手机成了“外接器官”,延伸了记忆(备忘录、相册)、感知(地图、搜索)和社交(微信、微博)。如今,不带手机出门寸步难行,它已成为我们的“硅基器官”。
现在,AI 手机要完成第三次跨越:从“外接器官”变为“分身”,即手机有了判断力,你只需给出模糊指令,它就能帮你执行。从 AI 出现起,只要技术进步,这就是大趋势。
初代手机只花你的钱,二代手机既花钱又占用注意力,三代手机不仅如此,还要分走一些权柄。三代“分身”和二代“外接器官”的本质区别在于:“外接器官”等你发指令,“分身”替你想事情。
为何不能单纯靠软件升级
一个合理的问题是:为何不直接给老手机推 AI 更新来实现这些功能,而非要研发新型手机?
因为真正的 AI 体验需三件事同时达成,而软件升级无法做到。
第一是端侧算力。做 AI 手机,大模型要在本地部署,且不能只是文字模型,要能对语音、图像、文字、视频进行理解和推理,还不能依赖网络,即不联网时也能实时处理并进行跨模态推理。要实现这种能力,需要专用的 NPU(神经网络处理单元)。端侧运行可用大模型,对 NPU 的需求量级上不封顶。苹果 A18 的 16 核神经引擎每秒运算达 35 万亿次,联发科天玑 9400 的 NPU 算力约为其两倍,这是目前旗舰机芯片的性能。而三四年前,骁龙 8 Gen 1 的 NPU 算力约为现在旗舰的十分之一出头,骁龙 8 Gen 2 比 8 Gen 1 快 4 倍以上,8 Gen 3 又近乎翻倍。所以 AI 手机必须从头开始,老芯片的 NPU 设计不是为“端侧跨模态推理”这种量级任务准备的。
第二是内存带宽。很多人忽视的原理是,大模型推理时,真正的瓶颈往往不是计算,而是搬运数据。模型每生成一个字,都要把数十亿个参数从内存调入处理器,即 KV cache 读写。NPU 再强,内存跟不上,就只能空转等待。以精简版 70 亿(7B)参数大模型为例,每秒生成 19 个字的勉强可用推理速度,就需要最新的内存标准支撑。两三年前,主流旗舰手机内存速度只有现在的一半甚至更低,运行起来慢得要命。这就是内存带宽不够的后果:端侧大模型要么跑不动,要么慢得没实用价值。
第三,也是最重要的一点,是操作系统的权限架构。传统智能手机系统把每个 App 关在各自沙盒里,彼此不能自由读写数据,调用时需向用户申请权限。这个设计保障了安全,但也阻断了 AI「打通一切」的可能。真正的 AI 助手要调用日历、读取邮件、操作地图、发送消息,需要 OS 层面重新设计权限模型,它作为你的分身,必须拥有你的权限,这不是打个补丁能解决的。
所以,AI 手机的研发是软硬件协同的系统工程,芯片、内存、OS、模型每一层都要重新设计,才能让「分身」在技术上成立,否则最多只是功能较全面的 AI 大模型,算不得 AI 手机。
最大的拦路虎不是技术,是生态
技术上的挑战能用钱和时间解决,并非真正的阻碍,真正难解的问题藏在商业生态里。
2024 年底,字节跳动与中兴合作推出豆包手机(努比亚 M153),其技术方案激进:AI 通过 GUI Agent 直接识别屏幕内容、模拟人手操作,绕开传统 API 限制,理论上能替你点外卖、发消息、订机票,跨越任何 App 的边界。工程样机上线即秒空,还被炒到原价的十倍。但之后,这款手机遭到从微信到淘宝再到各路银行的联合抵制。
原因很简单,这样的手机触碰到了互联网平台最核心的利益——数据货币化。每个超级 App 本质上是数据收集机器,微信、淘宝、美团、抖音等掌握用户大量数据,可制作用户画像,精准推送广告,提高变现效率。若手机上的 AI 助手能自由调用这些数据,局面就不同了。AI 有自己的想法,不会按平台算法计算,可能根据用户体检报告推荐轻食,而不是平台算法推荐的 KFC。
在 AI 手机上,推荐在手机的 AI 界面进行,用户无需打开美团等 App 就能获得推送,美团等平台的推荐引擎和用户关系被架空。平台多年积累的用户数据成了 AI 的养料,用户决策从商品页转到 AI 界面,平台被架空。这样一来,平台的流量收入断根,所以当初抵制豆包手机是平台唯一理性的选择。
矛盾不会被解决,只会被绕过
既然 App 厂商有顾虑,这堵墙该如何处理?老局认为:这个矛盾不会被解决,只会被绕过。
第一种方式,与其说是绕开,不如说是凿穿,即由监管部门以行政命令强制打通。欧盟的 DMA 已强制苹果、谷歌等开放互操作性,国内也在推进平台互联互通,2021 年有关部门要求微信、淘宝开放外链就是信号。但这种方案忽视了大型互联网平台企业的利益。平台的数据是多年投入的回报,如微信的社交关系链、淘宝的交易数据等,都是企业宝贵资产,凝结着研发投入、运营成本和风险承担。强行要求开放,在法律和商业上都有问题,且官方难界定“AI 数据调用权”边界,平台可能应付监管,降低 AI 手机使用体验,得不偿失。
第二条路,是操作系统取代 App 成为新入口。手机有操作系统,操作系统能调动 app,若操作系统 AI 化,手机自然能成为 AI 手机。现在打开外卖软件,决策过程和行为数据都被软件掌握,操作系统接管入口后,用户只需对 Siri/小艺/小爱说一句话,它们会读屏幕、读键盘,除支付外帮用户思考并做决定,外卖软件只能收到送外卖的指令。平台不希望看到这种情况,但手机厂商决定这么做时,平台可能不得不执行,就像当年 App Store 抽佣,开发者虽不满但还是上架。若用户决策在 OS 的 AI 界面进行,App 厂商不接入就放弃流量,接入就接受降级,陷入困境。这样,外卖平台会从掌握用户全程行为的“平台”变成只管接单履约的“外包商”,用户数据、广告收入和用户关系都归手机厂商,平台只剩利润最薄的“配送”段。
第三条路,是完全绕开,即开辟第二战场,用新规则定义 AI 手机——在 App 生态之外建立全新的数据层。前两条路本质上是在现有战场上争夺 app 数据使用权,若数据不走 app 呢?我们每天抱着手机七八个小时,手机上的传感器、麦克风、摄像头、GPS 等模块记录的数据不经过微信、淘宝等 App,叠加起来的用户画像可能更完整、真实。这重新定义了“了解用户”,过去是掌握用户说什么、买什么、搜什么,未来可能是感知用户状态、节奏、情绪、习惯。但要获得极致体验,需牺牲隐私,时刻处于手机监视之下,这样的交易你愿意做吗?
AI 手机会是终局吗?
看看 OpenAI 在硬件上的布局,会对 AI 手机有更多思考。OpenAI 不仅投资了手机,还投资了智能音箱、AI 耳机、智能眼镜等 AI 硬件。如果开发 AI 手机是为让 AI 无处不在地理解和服务你,那需要不断解锁、点击、盯着看的玻璃屏幕真的是最优解吗?耳机、眼镜、手表等设备更自然地融入生活,无需“掏出来”。从这个角度看,可穿戴设备也许是“分身”更自然的载体。当然,手机信息密度高、使用时间长,地位在可预见的未来不会改变,但“AI 手机”可能只是过渡形态,是智能手机时代向新形态过渡的变体。诺基亚解决了“随时通讯”问题,iPhone 解决了“随时联网”问题,AI 手机试图解决“随时理解你”的问题,但最终形态不一定是长方形玻璃屏幕。你的 AI 手机,何必是台手机?
