当前位置: 首页 > news >正文

Google BwA 杭州场(Gemma 4 专题全国首发)线下活动记录

今天参加了Google BwA 杭州场(Gemma 4 专题全国首发)线下活动,感觉挺有意思的。这篇文章简单总结一下活动的主要内容。

关于MoE模型

本地大模型的一大问题就是运行速度慢。会上说的让我比较印象深刻的一个点就是,Gemma 4有多个版本,其中26B版本的性能相比31B差距不大,但是速度比31B快好几倍。

原因是26B是MoE模型。26B完整名字是26B A4B,这里的A4B指的是Active 4B,也就是每次实际只激活4B参数(B是Billion的缩写,1B = 10亿)。

我对大模型的实现了解不多,所以问了一下ChatGPT,对MoE模型给出了通俗的解释:

Gemma 4 模型微调

活动中,我们实际跟着老师做了两项任务。

第一个任务是Gemma 4模型的微调,这个任务代码放在一个叫hello-rocm的项目里面,用于ROCM项目的入门科普。其中ROCM是一个类似CUDA的项目,用于AMD显卡。

https://github.com/datawhalechina/hello-rocm/blob/master/02-Fine-tune/models/Gemma4/01-Gemma4-E4B-LoRA及SwanLab可视化记录.ipynb

下载了这个Notebook以后,可以上传到Google Colab里面运行。Colab提供了远程高性能的 Jupyter Notebook 开发环境,对于本地没有高性能开发环境的人来说很方便,而且是免费的。

https://colab.research.google.com/

需要说明的是,这里面用到了一个HF_TOKEN的环境变量,需要去Hugging Face注册账号并创建一个access token,然后设置到Colab的Secrets中。

在Android Studio中使用Gemma 4开发

Gemma 4可以在多种平台体验和使用。

其中一种就是Android Studio,Agent模式可以调用本地模型开发代码。

下载LM Studio 或者 Ollama ,安装对应的模型,推荐Gemma 4 26B A4B。

以LM Studio为例,下载好模型以后,切到Developer页面,开启本地的端口就可以了。

然后在Android Studio中按照官方文档去配置就行了。

https://developer.android.com/studio/gemini/use-a-local-model?hl=zh-cn

但是我实际测试的时候遇到了一些问题,Agent并没有按照我的要求去修改代码,而是直接把代码输出来了,需要我人工去复制粘贴,我尝试换了提示词,没有成功。但是现场看到有人使用时是正常工作的。

总的来说感觉这个模型目前还不成熟。如果以后成熟了,用这种本地模型去开发一些不那么复杂的代码还是可以的。

常用的一种思路就是用比较强的大模型去对项目的整体结构先做一个完整的规划,然后到具体的实现细节,再让相对弱一些但是性价比高的模型去实现。

下面是我实际运行的效果。

这篇文章就简单总结到这里,对这个活动感兴趣但是没机会参加的,可以参考一下。

如果觉得文章有帮助,欢迎分享转发,也欢迎关注我的公众号“搬砖的小明”,及时获取更新

http://www.jsqmd.com/news/668797/

相关文章:

  • 别再混淆了!YOLOv5/v8模型评估里mAP@0.5和mAP@0.5:0.95到底怎么看?
  • 【热门技术深度讨论】AI Agent 自进化框架革命:从静态配置到生物级进化
  • 10年老兵带你学Java(第3课):数组和方法 - 代码的复用
  • 贵阳找工作该看什么?一份2026年本地招聘市场完整观察指南 - 精选优质企业推荐官
  • Product Hunt 每日热榜 | 2026-04-19
  • HarmonyOS原子化服务:轻量化应用的未来形态
  • Windows 10系统清理终极指南:让旧电脑重获新生的免费神器
  • 面试官灵魂拷问:Linux软链接与硬链接到底有什么区别?(附底层Inode级深度图解)
  • RKMEDIA VO图层配置与双屏显示实战
  • C语言分支循环作业错题与心得
  • 如何学好C语言:从入门到精通,掌握编程基石
  • 我重新梳理了一遍 RAG,终于明白它不只是接个向量库
  • 为什么92%的AGI项目在记忆对齐阶段失败?——2026奇点大会实测数据揭示5大认知断层与3步修复协议(含开源Memory-LLM v0.9预览版)
  • zmq源码分析之io_thread_t
  • 贵阳伍子柒网络|贵阳本地企业专属GEO服务商,技术适配、效果可查、服务贴心
  • Wan2.2-I2V-A14B与Dify集成:打造无需编码的AI视频工作流
  • 5G流量卡科普与避坑指南:如何选择正规号卡
  • 【AI大语言模型基础(0)】
  • 常用API:
  • 别再学框架了!2026奇点大会证实:未来3年高薪岗位只筛选这7种AGI协同行为模式
  • 2025-2026年全球访客机品牌推荐:五大口碑产品评测对比顶尖工厂访客身份核验繁琐 - 品牌推荐
  • mysql如何优化索引以减少扫描_mysql高效索引设计原则
  • 终极免费视频下载工具:ytDownloader完整使用指南
  • 2025-2026年香港求职机构推荐:五大口碑服务评测对比顶尖求职者面试技巧不足 - 品牌推荐
  • 从寄存器手册到代码:手把手教你逆向分析ES8311官方驱动配置逻辑
  • 刚刚,4月编程排行榜出炉,AI都能写代码了,C语言凭啥还排第二?
  • H3C交换机上给不同VLAN配DHCP,一次搞定网关、地址池和DNS(附完整命令)
  • 【AGI蛋白质折叠预测革命】:2024年AlphaFold 3与RoseTTAFold AI实测对比,精准度突破99.2%的5大临床应用落地路径
  • 2025-2026年访客机品牌推荐:五大口碑产品评测对比顶尖工厂安全管理访客滞留案例 - 品牌推荐
  • FPGA设计里选乘法器IP还是写RTL?从面积、时序和易用性帮你决策