当前位置: 首页 > news >正文

谷歌开源大模型Gemma 4实测:千元机跑本地模型,速度慢、易出错?

突发:谷歌发布新一代开源大模型Gemma 4

今年4月,谷歌发布了新一代开源大模型Gemma 4,一口气推出四种规格版本,从手机到工作站全面覆盖。其中最小的两个版本专为移动设备设计,主打完全离线运行,谷歌此次旨在让手机跑本地模型。

测试疑问:普通安卓机跑本地模型表现如何?

网上现有的Gemma 4实装测试基本在最新款iPhone或旗舰机上进行,这些旗舰机性能和算力处于第一梯队,表现好属情理之中。小雷不禁发问,若用几百到一千多块的普通安卓机,中端处理器、算力不算顶尖,本地模型能否正常使用?与旗舰机差距有多大?本地AI是否注定是旗舰手机专属功能?为搞清楚这些问题,直接拿搭载中端芯片的千元安卓机vivo Y500 Pro实测Gemma 4。

实测机型:vivo Y500 Pro配置情况

vivo Y500 Pro是典型千元安卓机,虽不是老机型,但SoC整体性能一般。它采用联发科天玑7400,台积电4nm制程,CPU配置为4个2.6GHz大核加4个2.0GHz小核,GPU是Mali - G615 MC2。这套配置在千元价位段正常,日常使用没问题,但与旗舰芯片比算力,不在一个量级。AI方面,天玑7400用的是联发科NPU 655,官方称比上一代提升了15%。

测试过程:安装及题目测试

谷歌为Gemma 4手机端版本推出Google AI Edge Gallery App,应用商店可直接搜索下载。下载打开后选Gemma 4 E4B,等模型文件下载好即可直接使用,全程离线,无需联网和配置,安装体验用心。

第一题,问推荐三部适合长途高铁上看的电影并说明理由。Gemma 4给出阿甘正传、盗梦空间和爱乐之城,选片经典,推荐理由合理,但回答近500字,还附“小贴士”。在vivo Y500 Pro上,这500字跑了2.8分钟,后半段没必要读。这是小参数模型常见毛病,回答不知何时停止,还会凑字数。

第二题,是经典多步逻辑推理题:五个人坐成一排,A不坐在最左边,B坐在C的右边,D坐在E的左边,E不坐在最右边,问谁坐在最中间?Gemma 4认真列条件、排列组合,但给不出正确答案,耗时3.3分钟,且过程中不能退到后台,需一直亮屏。在X300 Pro旗舰机型上也没得出正确答案,但X300 Pro回答速度碾压,1.6分钟给出错误答案。

第三题,尝试经典问题“洗车应该开车去还是走路去”。Y500 Pro花2.5分钟给出“若为‘洗车’去,应选择走路”的啼笑皆非回答。X300 Pro绕弯子,最后提到若去洗车还是要开车去。

测试总结:Y500 Pro上Gemma 4 E4B表现

跑完三道题,Y500 Pro上的Gemma 4 E4B整体印象是慢、废话连篇,但不怎么发烫。慢是直观感受,每题平均等两到三分钟才能看完完整回答,日常使用难受。慢是因为天玑7400的NPU算力有限,每秒处理token数少。出错率也高,因模型处理复杂逻辑需反复“思考”,千元机算力有限,易提前给出结论,出现幻觉。

识图测试:Y500 Pro与X300 Pro对比

因Gemma 4 E4B是多模态模型,测试Y500 Pro识图效果。先丢夜景购物中心照片,问图里信息,回答描述建筑规模、屋顶结构、夜景氛围方向正确,但未提及Apple Store招牌,只说“现代大型购物中心”,参数量不够,能看出轮廓但认不出品牌。

再丢绿植图片问是什么,Y500 Pro转圈五分钟无回答,App无法操作,只能干等。而X300 Pro仅用32秒回答,但未准确说出装置,猜测是小型传感器。

综合结论:本地模型在普通手机的可用性

Y500 Pro上的Gemma 4 E4B并非完全干不动,有小惊喜,如基本不发烫、不卡顿,能正确回答简单问题。但作为本地模型,回答速度慢,Google AI Edge Gallery权限不够,除开关手电筒外,无法做其他系统级操作。除非断网,否则不如在线大模型好用。

从测试看,Gemma 4目前需旗舰手机才能达“及格线”标准,虽有出错情况,但速度不慢。谷歌推出的Google AI Edge Gallery里的Mobile Actions功能,可将自然语言指令转化为Android系统操作。三星Galaxy S25系列、豆包手机等也有类似自动化操作,但大多不是真正本地模型在跑。

本地模型能力上限有限,参数量小能做的事少,用户对AI期待高,云端成兜底方案,本地模型承担轻量、实时任务。谷歌这款App像是在试水本地模型进入移动端,开放自动化操作权限,等芯片算力提升。但芯片厂商何时将足够AI算力下放到千元机价位未知,普通用户能否用上好用的本地AI,取决于产业链推动动力,接下来要看芯片厂商和手机厂商如何应对。

http://www.jsqmd.com/news/668263/

相关文章:

  • Kali Linux 2023 上 Burp Suite Pro 2024 的保姆级安装与激活指南(含JDK 11配置)
  • PCHMI权限开发避坑指南:从用户等级映射到实际功能锁定的完整流程
  • 从LCD到MicroLED:手把手拆解主流显示技术演进史,看懂未来屏幕长啥样
  • 2025届学术党必备的AI写作网站横评
  • 人形机器人半马:进步与失控并存,短板暴露促进行业迭代
  • 从FGM到FreeLB:一次讲透对抗训练怎么“卷”起来的(附代码避坑指南)
  • DeepSeek融资3亿美元背后:算力人才两手抓,国产适配成行业变量
  • nRF52832串口DMA效率翻倍秘籍:从“定长接收”到“伪不定长”的完整配置流程
  • FanControl终极中文设置指南:5分钟让风扇控制说中文的完整教程
  • 告别手动敲命令:用Ansible CE模块批量管理华为交换机端口(附完整Playbook)
  • 用Rainmeter打造你的专属桌面:从零开始配置农历、股票和圆盘时钟插件
  • 【Java学习新手第一篇】:Hello World !
  • 别再乱选启动盘格式了!用Rufus烧录Windows安装盘时,GPT和MBR到底怎么选?(附DiskGenius查看方法)
  • 用STM32F407的TIM1驱动舵机:CubeMX配置PWM详解与避坑指南
  • 如何用TsubakiTranslator轻松翻译Galgame,打破语言障碍?
  • MMC并网逆变器:基于滑模控制的优化策略与实验结果分析
  • C#连接OPC UA服务器的三种身份验证方式详解:匿名、用户名密码和证书(附完整代码)
  • 告别驱动冲突:多维度解决AMD显卡驱动版本不匹配难题
  • 学习的时间复杂度和稀疏矩阵
  • GPT Image 2 泄露,文字渲染准确率提升,或让截图难成证据!
  • 从零开始,用Wireshark抓包分析BLE广播包(ADV_IND)的完整结构与实战解析
  • Windows/Mac/Linux三平台实测:Python pySerial连接Arduino/树莓派避坑指南
  • 当Air Florida 90号航班坠入波托马克河:用Elasticsearch+Kibana复盘一场‘非典型’空难的数据叙事
  • # 简易在线英语考试系统 - 课程设计报告
  • 从LED到DFB激光器:如何为你的项目选择对的SFP光模块?(附速率、距离避坑指南)
  • 别再被KB2999226和KB3118401补丁卡住了!Win10安装Wireshark的终极避坑指南
  • 别再只会用下载器了!手把手教你用Python解析Torrent文件,自己动手生成磁力链接
  • 10.1.24 Registry virtualization:为什么容器里的应用明明以为自己在写 HKCU / HKLM,Configuration Manager 实际看到的却是 \Registr
  • Day06-Java
  • 智元与宇树竞争升级:营收千亿目标背后,谁能在具身智能赛道突围?