当前位置: 首页 > news >正文

Siri2.0深度解析:苹果的AI路线终于清晰了

昨晚看 Apple 的 WWDC 26,我最大的感觉不是:

“苹果终于追上 AI 了。”

这个说法太粗了。

更准确一点说,是:

苹果终于把自己的 AI 路线讲清楚了。

以前大家看 Apple Intelligence,总有一种别扭感。

ChatGPT 已经能聊天、写作、看图、写代码;Claude 已经能帮人改项目、跑任务、读长文;Gemini 在 Google 生态里也越走越深。

苹果这边却一直像憋着一口气:

说自己重视 AI,但 Siri 还是那个 Siri; 说自己有系统级能力,但普通人感受到的变化不够强。

这次新 Siri AI 出来后,至少路线清楚了。

苹果不是要做一个放在 iPhone 里的 ChatGPT。

它真正想做的是:

把 AI 塞回手机系统里,让它理解你的屏幕、你的邮件、你的照片、你的信息、你的 App,然后在隐私边界内帮你把事情做完。

这个区别很重要。

因为如果我们还用“谁回答问题更聪明”来判断 Siri,就会看偏。 XQ新 Siri 的关键不只是会不会聊天,而是它能不能成为 iPhone 里的个人执行层。

我先把边界说清楚:

截至2026-06-09,Apple 官方说 Siri AI 还在开发者测试阶段,用户 beta 会在 2026 年晚些时候推出,先支持英语,中国区暂不可用。

所以这篇不是亲测体验,也不会假装我已经把新 Siri 跑了一遍。

这篇讲的是:

基于官方公告和公开报道,我对苹果 AI 路线的判断。


01 Siri 以前的问题,不是“不够会聊天”

Siri 其实不是新东西。

2010 年,Apple 收购了 Siri。 2011 年,iPhone 4S 发布时,Siri 被当成一个很重要的新功能拿出来讲。

那时候它给人的感觉很超前:

你可以对手机说话,让它查天气、设提醒、打电话、问餐厅。

那个时代,Siri 的想象力很大。

但后来很多人对 Siri 的失望也是真的。

你让它设个闹钟、打个电话、开个 App,还行。

但你想让它理解复杂一点的上下文,跨几个 App 帮你把一件事做完,它就很容易掉链子。

问题出在哪?

不是 Siri 不会出声,也不是它不能识别几个命令。它真正缺的是三样东西:

第一,理解能力

你说得稍微绕一点,它不一定听懂你真正想干什么。

第二,上下文

它不知道你刚才看到什么。

不知道你消息里提到哪个餐厅。

也不知道你邮件里那个订单和日历里的行程有什么关系。

第三,执行能力

它能打开 App,但很难像一个真正的助理一样,在不同 App 之间连续完成动作。

所以过去十几年,Siri 最大的尴尬是:

它占着最好的入口,却没有拿到最完整的能力。

iPhone 侧边键、耳机、手表、CarPlay、Mac、iPad,全是入口。

但你真的有事要问,很多时候还是会转头打开 ChatGPT、Claude 或 Google。

这就是苹果这次必须改的地方。


02 这次新 Siri,重点是三件事

Apple 这次官方叫它 Siri AI。

它有很多功能名:

personal context、onscreen awareness、systemwide app actions、Visual Intelligence、Writing Tools。

翻成人话,其实就三件事。


第一,它要知道你手机里有什么

比如你问:

“上次朋友发给我的那家餐厅叫什么?”

以前 Siri 很可能不知道你说的是哪条消息。

新 Siri 的方向,是能从信息、邮件、照片、备忘录这些内容里找线索。

它不是只查互联网。

它要查的是:

你的个人世界。


第二,它要知道你眼前在看什么

这就是屏幕理解。

你在看一张图、一封邮件、一个文件、一段网页内容时,可以直接问 Siri:

“这是什么意思?” “帮我总结一下。” “把这个地址加到联系人里。”

这和打开 ChatGPT、截图、再上传不一样。

苹果想做的是:

把这个动作放进系统里。


第三,它要能跨 App 做事

这才是我觉得最关键的地方。

一个 AI 助手如果只会回答,价值有限。

真正让普通人省时间的是:

它能不能帮你把下一步动作也做掉。

比如你收到朋友发来的聚餐信息。

Siri 不只是告诉你这条信息的意思,还能帮你想带什么菜,把食谱加到备忘录,甚至继续处理后续安排。

这才像一个“系统里的助理”。

过去的 Siri 更像语音遥控器。

新的 Siri 想变成:

一个能理解上下文的执行入口。


03 Gemini 合作说明了什么

这次很多人最关注的是 Gemini。

这里必须把事实边界讲清楚。

Apple 官方 6 月 8 日的新闻稿里,没有把 Gemini 或 Google 写成前台品牌。

官方口径讲的是:

  • Apple Intelligence
  • Apple Foundation Models
  • on-device processing
  • Private Cloud Compute

但 TechCrunch 在 WWDC 汇总里写到,新 Siri 底层有 Google Gemini。

这个信息可以写,但要放在“媒体报道”这一层,不能写成 Apple 官方自己在台前宣布了 Gemini。

所以更稳妥的说法是:

Gemini 很可能不是站在台前的“新 Siri 品牌”,而是被放在后台,提供一部分模型能力。

这件事对苹果来说不丢人。

很多人喜欢把它解读成:

“苹果 AI 不行,只能找 Google。”

这里有一部分对,但不完整。

如果只看大模型能力,苹果确实不是 OpenAI、Anthropic、Google 这种玩家。

它没有必要硬装成自己是最强模型公司。

但苹果真正有的东西,是另外一套牌:

  • 设备入口
  • 系统权限
  • App 生态
  • 用户信任
  • 隐私叙事

这几张牌,不是 ChatGPT 和 Claude 轻易拿得到的。

所以苹果现在的路线更像这样:

底层模型能力可以借,可以买,可以合作。 但用户入口、系统动作、隐私边界和体验包装,必须留在自己手里。

这就是我觉得苹果 AI 路线变清晰的地方。

它不一定要在模型排行榜上天天第一。

它要把 AI 变成 iPhone、iPad、Mac、Apple Watch 里的系统能力。


04 隐私不是口号,是苹果这条路最大的取舍

讲苹果 AI,绕不开隐私。

但这里也不能把隐私讲成一句漂亮话。

真正的问题是:

越好用的个人 AI,越需要了解你。

它想帮你找邮件,就要知道你的邮件。

它想帮你整理照片,就要理解你的照片。

它想帮你跨 App 做事,就要知道你在哪个 App、看到了什么、下一步可能要点哪里。

这就是矛盾。

用户一边希望 AI 更懂自己,一边又不希望自己的聊天记录、照片、文件、密码、行程,被一股脑丢到云端模型里。

苹果的解决方式是分层。

能在设备上处理的,尽量在设备上处理。

更复杂的请求,再进 Private Cloud Compute。

官方说这些服务器运行在 Apple silicon 上,个人数据不会被保存,也不会被 Apple 或其他人访问,外部专家还能检查相关代码。

这套东西听起来很苹果。

也确实是苹果和其他 AI 公司最大的不同。

ChatGPT、Claude 的优势是通用能力强。

你打开它们,给足上下文,它们能帮你写、想、分析、改代码。

它们像一个很强的外部工作台。

Siri AI 的优势则是系统位置。

它不一定每个回答都比 ChatGPT 更强,但它可能更知道你手机里正在发生什么。

可是隐私也有代价。

苹果不能像纯 AI 公司那样激进地拿用户数据训练。

不能随便把个人上下文丢给第三方模型。

也不能把所有权限开放给任意助手直接控制手机。

所以它会慢。

会保守。

会有地区限制。

会有很多“现在还不能用”的尴尬。

但这不是苹果路线的 bug。

这是这条路线本身的成本。


05 和 ChatGPT、Claude 比,新 Siri 到底算什么

很多人会问:

那以后我还要不要用 ChatGPT 和 Claude?

当然要。

因为它们解决的不是同一个问题。


ChatGPT:更像全能对话工作台

你想写文案、查资料、做方案、问知识、看图片、分析文件,它都能接。

它的优势是:

  • 通用能力
  • 产品成熟度
  • 生态扩展

Claude:更像深度工作伙伴

尤其是在长文、复杂推理、代码项目、文档整理这些场景里,它的感觉很像你旁边坐了一个能一直跟上下文的人。

Claude Code 这一类工具,已经不是简单聊天。

它能读代码库、改文件、跑命令、做开发任务。


Gemini:更像 Google 生态里的能力底座

Gemini 的优势在 Google 生态和模型底层能力。

它背后有搜索、YouTube、Workspace、Android 和 Google Cloud。

对苹果来说,Gemini 更可能是一个能力供应方,而不是用户每天看到的那张脸。


Siri AI:更像系统里的个人入口

你不是专门打开它写一篇 5000 字文章。

也不是让它像 Claude Code 一样改一个项目。

你更可能在手机里随手问:

“刚才那条消息里的地址,帮我加到联系人。” “上周谁发给我那个酒店确认码?” “把这几张照片修一下,然后发给某某。” “我屏幕上这个东西是什么意思?” “帮我按我平时的语气回一封邮件。”

这类任务看起来小,但频率很高。

如果苹果做成了,Siri AI 的价值不是让你少用 ChatGPT。

而是让很多原本不值得打开 ChatGPT 的小动作,直接在系统里完成。

这对普通人更重要。

因为普通人不是每天都在研究 prompt,也不是每天都在搭 Agent。

他们只是希望手机别那么笨。

别每件小事都要自己来回切 App。


06 苹果这次真正想抢的,不是聊天窗口

我自己做 AI 内容、网站和小项目时,感受特别明显。

ChatGPT、Claude、Codex 这些工具已经很强了。

但它们大多数时候还是“工具”。

你要先打开它,把上下文给它,再让它做事。

这当然没问题。

对写代码、写长文、分析资料来说,甚至是最好的方式。

但手机里的大量 AI 场景不是这样。

手机里的任务更碎。

看一条消息,想回一句。

看到一张图,想知道它是什么。

翻到一封邮件,想把里面的信息存起来。

拍到一个东西,想立刻问它怎么处理。

这类场景不适合每次都复制、截图、上传、解释一遍背景。

所以苹果真正要抢的不是聊天窗口。

而是:

动作发生的地方。

你在哪看到问题,AI 就在哪出现。

你在哪需要下一步,AI 就在哪帮你接上。

这才是系统级 AI 的价值。

也是为什么苹果即使模型不一定最强,依然有机会。

模型公司拼的是大脑。 苹果拼的是身体。

大脑再聪明,如果摸不到你的手机、文件、照片、App,也只能隔着窗口给建议。

苹果要做的是让 AI 长在系统里,能碰到更多真实动作。

当然,这也更危险。

一个 AI 如果只是回答错了,最多让你重问。

但一个 AI 如果能读消息、发邮件、买东西、改文件、控制 App,它一旦出错,后果就不是“答案不准”这么简单。

这也是为什么 Apple 在 EU 延迟 Siri AI 时,反复强调权限和隐私风险。

它的态度很明显:

AI 助手可以强,但不能随便拿到无限权限。

这点我很认同。

普通人用 AI,最怕的不是它不会说漂亮话,而是它在你没看住的时候乱动东西。

这跟我平时让 AI 改项目的感受很像。

Codex、Claude Code 能帮你写很多代码,但我一定会先写清楚:

  • 哪些文件不能动
  • 哪些配置不能改
  • 哪些动作必须先问

因为 AI 一旦能执行,就必须有边界。

Siri AI 也是一样。

只不过它面对的不是代码仓库,而是一个人的手机生活。


07 普通人以后怎么分工用 AI

如果这次 Siri AI 真能按 Apple 描述的方向落地,我会这样分工。


手机里的即时小事,交给 Siri

比如:

  • 找信息
  • 看屏幕
  • 处理照片
  • 回消息
  • 加提醒
  • 跨 App 做简单动作

它不一定最聪明,但它最贴近现场。


复杂思考,继续用 ChatGPT 或 Claude

比如:

  • 写文章
  • 做选题
  • 拆项目
  • 整理资料
  • 分析一个商业问题

这些任务需要更长上下文,也需要你和 AI 来回打磨。


代码和项目,交给 Codex / Claude Code 这类开发工具

它们能读项目、改文件、跑命令、看 diff、做验收。

这不是 Siri 的主场。


Google 生态里的资料和搜索,可以继续看 Gemini

尤其是你本来就在 Google 文档、Gmail、YouTube、Android、Google Cloud 里工作,Gemini 的位置会越来越自然。

所以别再问“谁替代谁”。

更现实的答案是:

AI 会分层。

有些 AI 在聊天窗口里。

有些 AI 在浏览器里。

有些 AI 在代码项目里。

有些 AI 会藏在系统里。

新 Siri 代表的就是最后这一层。


08 我的判断:苹果晚了,但没丢掉牌桌

苹果这几年在 AI 上确实慢。

这没必要替它洗。

Siri 被吐槽这么多年,不是网友要求太高,而是它真的没有跟上大模型时代的用户预期。

Apple Intelligence 早期体验,也没有给普通人足够强的:

“哇,这就是 AI 手机。”

但这次 Siri AI 让我觉得,苹果至少没有走错方向。

它没有简单做一个聊天机器人。

也没有把 ChatGPT、Gemini、Claude 粗暴塞进系统里就完事。

它选择的是一条更苹果的路:

  • 把个人上下文拿回来
  • 把 App 动作接起来
  • 把隐私边界管住
  • 把外部模型放在该放的位置

如果这条路做成了,Siri 不一定是最会聊天的 AI。

但可能是最容易被普通人每天用起来的 AI。

因为普通人真正需要的,不是又多一个 App。

而是手机终于能听懂一点人话,少让自己在十几个 App 之间来回折腾。

这就是我觉得这次热点值得看的地方。

苹果的 AI 路线终于清晰了:

不抢模型第一名。抢系统入口。

不只做回答。 做个人场景里的动作。

不把隐私当装饰。 把隐私变成产品边界。

这条路会慢,也会有很多限制。

但如果以后 AI 真要进入普通人的日常生活,它最后一定不是只待在一个聊天框里。

它会出现在你正在看的屏幕上,正在写的消息里,正在整理的照片里,正在处理的文件里。

Siri AI 这次要赌的,就是这个位置。


能看到这里,先给你比个心,说明咱们多少算是同路人了哈哈哈。

如果觉得这篇文章还不错,记得点个赞、点个在看。

你的支持,也是我继续熬夜码字的动力。

我是罗叨叨,我会持续分享我看到的、学到的、踩过的坑,我们下篇见。

http://www.jsqmd.com/news/985890/

相关文章:

  • 2026 年下半年PMP报名流程以及注意事项(总结版)
  • 2026 东莞厨卫屋面地下室漏水瓷砖空鼓测评:吉修匠 99.8 分五星榜首 - 吉修匠
  • Linux 进程间通信 (IPC):System V 共享内存从原理到实战
  • 618旗舰游戏本怎么选?2026年五款高性能机型深度横评,天选7Pro领衔
  • 北京26年甄选名猫猫狗狗宠物店权威排行榜店铺推荐,靠谱宠物店联系方式推荐 - 谊识预商贸
  • 深圳家电维修平台推荐:本地用户反馈较多的几家服务商(2026最新发布) - 欧米到家
  • 计算机毕业设计之智能推荐系统在电商平台中的个性化设计与实现
  • 2026年 商标注册与复审服务推荐榜单:重庆/上海/天津/北京商标转让、续展、驳回复审及国际商标办理高质量机构精选 - 品牌发掘
  • SEO-文章标题:写文章时候,分类+主标题+大纲+解释 作为标题 / 不点进去也知道全文覆盖什么 / 标题即架构
  • 算法描述的5种方法(非常详细)
  • 一体式超声波液位计多少钱?2026年十大品牌价格全解析与选型避坑指南 - 仪表品牌排行榜
  • 广东育家心理学研究院为什么要为休学孩子做“坤和静界·春藤计划”
  • 常州26年甄选名猫猫狗狗宠物店权威排行榜店铺推荐,靠谱宠物店联系方式推荐 - 谊识预商贸
  • 小程序毕业设计-基于Springboot+Vue+微信小程序智能停车场管理系统(源码+LW+部署文档+全bao+远程调试+代码讲解等)
  • 2026 云浮厨卫屋面地下室漏水瓷砖空鼓测评:吉修匠 99.8 分五星榜首 - 吉修匠
  • 企业即时通讯选型:从业务场景反推能力,而不是只看功能清单 - 小天互连即时通讯
  • 2026丽水缙云木门定制,选对不踩坑
  • 2026年上海美本申请规划成功案例:完整方案资料解读 - 虚拟星辰
  • 面试必刷!Java面向对象10道经典题 答对8道直接上岸!
  • 如何在Linux上轻松搞定RTL8821CU无线网卡驱动:终极安装指南
  • 嘉兴装修参考,2026优质全屋定制品牌精选 - 十大品牌排行榜
  • 网络经纪人助手口碑全维度评测:合规性与服务力验证 - 奔跑123
  • 上海智慧食堂厂家排行:基于资质与落地案例的客观盘点 - 互联网科技品牌测评
  • 2026年保定市CPPM考试最新全攻略:科目题型、通过率、备考重点及官方双认证报考机构推荐 - 众智商学院课程中心
  • 鸿蒙原生开发进阶:ArkUI 空间化引擎底层架构揭秘,六大渲染机制全景拆解
  • Gemma 4 12B 实战:本地代码生成、OpenClaw 和 QVeris 工具调用
  • 传世无双之金装裁决官方:战法道铁三角经典还原
  • 2026 惠州厨卫屋面地下室漏水瓷砖空鼓测评:吉修匠 99.8 分五星榜首 - 吉修匠
  • 气膜为什么成为工业主流建筑?玖晟气膜拆解五大核心优势
  • Python多线程高阶避坑实战:异常兜底、超时控制、原子操作、断点续跑、内存泄漏修复(企业级源码)