当前位置: 首页 > news >正文

手机离线跑AI这个事,是不是智商税?

讲真,2026年这个AI圈真的太魔幻了。前两年大家还在卷千亿参数的大模型,今年突然就开始在手机上跑AI了。

我一直以为小语言模型(SLM)就是个智商税——参数那么少,能干啥?直到前两天在地铁上信号不好,手机又收不到网,原来能用的AI助手突然就歇了,我才意识到一个很现实的问题:离了云端,我们真的啥也干不了。

端侧AI到底行不行?

现在主流的SLM都是3B-7B参数这个量级。Phi-3 Mini、Gemma 2、Qwen 2.5这些,说白了就是"浓缩版"的大模型。浓缩是真的浓缩了,但能力也打折。

但有个东西确实让我蚌埠住——Apple的CoreML和Google的MediaPipe现在可以直接在手机上跑模型推理了。不需要网络,完全离线。延迟还低得离谱——20ms以内就能出第一个Token。这比云端往返的300ms快了不止一点。

高通和联发科的旗舰芯片也都支持本地AI推理了。80 TOPS的算力,足以跑一个量化后的3B模型。所以硬件基础是有了。

但我还是不太懂

有个问题我一直没想明白:为什么厂商都在推端侧?是隐私?但大多数用户的隐私需求真的那么强吗?更多人还不是一样把数据上传云端。

我觉得更可能是成本。云端API调用是要钱的,每个Token都在烧钱。端侧推理 once买了硬件就不需要额外付费了。这才是厂商真正想推的原因吧。

你们呢?

你们会更倾向于用端侧SLM还是继续用云端大模型?

http://www.jsqmd.com/news/840135/

相关文章:

  • # 2025-2026-2 《Python程序设计》实验四报告
  • 为内部 AI 应用平台集成 Taotoken 实现多模型路由与灾备方案
  • Markdown Viewer架构设计:多编译器统一接口与模块化渲染系统实践
  • 终极指南:如何让Windows任务栏完美透明化,提升桌面美观度
  • Taotoken的APIKey管理与审计日志如何助力企业合规
  • 东北区域主流草坪基地品牌实测排行与采购参考 - 奔跑123
  • 谁在守护四川地下管网?2026年市政非开挖修复厂家深度测评——捷顺通领跑本土梯队 - 深度智识库
  • 使用标准库例程串口乱码
  • linux ubuntu 挂载硬盘
  • 涿州本地防盗门品牌实测评测:安全与服务双维度对比 - 奔跑123
  • tmpr3z5vs82
  • 沈阳漏水检测/漏水维修/防水补漏/卫生间漏水/水管漏水师傅专题:沈阳一修哥漏水检测维修布局和平区等地深度问答 - 十大品牌榜
  • 辽宁草坪价格实测排行:五家源头基地性价比对比 - 奔跑123
  • 论APS智能排产:让生产排程从“经验博弈“到“智能决策“的进化
  • GitHub加速终极指南:如何用开源插件将下载速度提升30倍
  • 全国宠物托运机构排行:合规服务与体验实测对比 - 奔跑123
  • 使用 cloud-init 初始化 CVM 失败报错 exit code 1 怎么排查?
  • Dify 工作流实战:用 Workflow 编排一个可控的 AI 自动化处理流程
  • springboot mybatis
  • 2026国产氟化氢含水量测定池哪家做得好?实测对比金工鸿泰等主流品牌 - 品牌推荐大师1
  • 从战略到执行断层,企业目标为何总是沦为纸上谈兵?——企业计划如何助其落地
  • 2026年松江区交通事故纠纷律所评测:口碑与实力的客观对比 - 奔跑123
  • MySQL 在执行深度分页时,绝不会一次性将行数据加载到内存中
  • 2026年4月公交站台广告价格推荐分析,电梯框架广告/电梯视频广告/高铁广告/电梯门贴广告,公交站台广告公司推荐分析 - 品牌推荐师
  • Taotoken API密钥的精细化管理与审计日志功能在实际运营中的作用
  • 四川市政管道CCTV检测哪家强?2026年非开挖修复行业优选服务商深度解析 - 深度智识库
  • 深入浅出:使用 Gunicorn + Nginx + Docker 将 Django 项目部署到云服务器
  • 软件测试实验六
  • ARM+FPGA异构计算:软硬件协同定制与生态共建实践指南
  • 五相同步电机模型预测控制:原理、算法设计与仿真实现