当前位置: 首页 > news >正文

Gemini 3.1 Flash-Lite 正式上线:专为规模化智能而生

内容来源于谷歌官方,由谷歌云谷歌地图合作伙伴 CloudAce 深圳云一进行翻译发布。

导语: Google 扩展了 Gemini 3 模型家族,正式推出 Gemini 3.1 Flash-Lite。作为该系列中速度最快、性价比最高的模型,它专为应对大规模高容量的开发工作负载而设计,在模型等级与价格平衡方面树立了新的行业标杆 。

目前,开发者已可通过 Google AI Studio 中的 Gemini API 接入预览版,企业级用户则可同步通过 Vertex AI 平台进行部署 。

⚡ 性能更强

在实时交互与高频工作流中,低延迟是应用成功的关键。根据最新的基准测试,Gemini 3.1 Flash-Lite 在保持甚至超越前代模型质量的同时,实现了性能的飞跃:

  • 极速响应:其首个答案 Token 生成时间(Time to First Answer Token)比 2.5 Flash 快 2.5 倍

  • 高效输出:输出速度提升了 45%

  • 实时体验:这种超低延迟特性使其成为构建高响应、实时交互体验的理想底座 。

Gemini 3.1 Flash-Lite 在速度和质量方面都优于 2.5 Flash。

Gemini 3.1 Flash-Lite 在速度和质量方面都优于 2.5 Flash

💰 成本更低

对于需要处理 PB 级数据或海量用户请求的企业而言,3.1 Flash-Lite 提供了极具破坏力的定价模型,将先进智能的获取成本降至更低 :

  • 输入成本:仅需 $0.25 / 100万 tokens 。

  • 输出成本:仅需 $1.50 / 100万 tokens 。

微信图片_20260310144849_222_821

📊  表现更好

Gemini 3.1 Flash-Lite 在 Arena.ai 排行榜上取得了令人印象深刻的 1432 Elo 分数,并在推理和多模态理解基准测试中超越了同级别的其他模型,包括在 GPQA Diamond 上获得 86.9% 的分数,在 MMMU Pro 上获得 76.8% 的分数——甚至超越了前几代更大的 Gemini 模型,如 2.5 Flash。

Gemini 3.1 Flash-Lite 在 Arena.ai 排行榜表现

Gemini 3.1 Flash-Lite 分数表现

🧠 自适应的规模化智能

为了赋予开发者更精细的控制力,3.1 Flash-Lite 在 AI Studio 和 Vertex AI 中标配了 “思考等级(Thinking Levels)” 功能 。开发者可以根据具体任务的复杂程度,灵活调节模型的推理深度:

  • 成本优先任务:处理海量翻译、内容审核等高重复性、大规模任务 。

  • 逻辑优先任务:应对复杂的 UI/仪表盘生成、模拟创建或精准遵循复杂指令 。

目前,已有包括 Latitude、Cartwheel 和 Whering 在内的多家先锋企业正利用 3.1 Flash-Lite 解决大规模的复杂业务挑战 。

3.1 Flash-Lite 可瞬间为电商线框图填充数百种不同类别的产品。 (1)

Gemini 3.1 Flash-Lite 可瞬间为电商线框图填充数百种不同类别的产品

☁️ Cloud Ace 助力企业抢占技术红利

Cloud Ace 是在 Google Cloud 领域拥有顶尖业绩的系统集成商,在 Google Cloud 的 Service(服务)及 Co-sell(联合销售)两大核心领域,成功获得最高等级 Diamond 合作伙伴认证 ,提供从云端架构设计、运维支持、系统开发到生成式 AI 应用的一站式服务,并为企业提供从战略规划到实施落地、到运营维护的 AX 与 DX(数字化转型)一站式支持。

Cloud Ace 集团拥有 500 多名工程师,包括多名入选 Google Cloud Partner Top Engineer 的顶尖工程师,以及大批深耕行业多年的技术专家。

凭借卓越的技术实力与服务品质,连续多年荣获 Google Cloud 年度合作伙伴、 Google Maps Platform 合作伙伴等多项认证。

如果您希望了解如何将 Gemini 3.1 Flash-Lite 引入您的业务架构,实现从“降本增效”到“体验升级”的飞跃,欢迎咨询我们。
http://www.jsqmd.com/news/458738/

相关文章:

  • 2026年靠谱的配眼镜工厂推荐:绍兴配眼镜/孩子配眼镜/配眼镜金属镜框制造厂家推荐 - 行业平台推荐
  • qmc-decoder:突破QMC加密限制的音频格式转换工具深度指南
  • PP-DocLayoutV3参数详解:5点bbox坐标系、label_id映射表与类别权重调整
  • 通义千问1.5-1.8B-Chat-GPTQ-Int4技术解析:深入理解Chat模型对话微调技术
  • 旧设备激活与系统焕新:让你的旧Mac重获新生的完整指南
  • 淡法令纹家用美容仪哪款口碑好?三大主流机型的硬件配置与核心功效数据横评
  • 装修博主必看|3家靠谱小红书投流服务商实测,避坑不踩雷 - 品牌测评鉴赏家
  • AI入门指南:无需魔法,盘点国内主流大模型工具与实战场景
  • ChatGLM-6B在智能客服中的应用:自动应答系统构建
  • 分期乐购物额度回收全攻略:避坑 + 安全变现指南 - 团团收购物卡回收
  • 2026中医正骨培训优质机构推荐指南:小儿推拿学习/手诊培训/手诊学习/整骨培训/整骨学习/正骨学习/选择指南 - 优质品牌商家
  • NLP-StructBERT处理长文本相似度:效果对比与挑战展示
  • Qwen3-4B纯文本模型应用案例:高效辅助代码编写与多语言翻译
  • 忤合第六《鬼谷子》殷商后裔复国间谍学院教材
  • 解决PDF比对难题:diff-pdf工具的视觉化优势
  • Keyviz:让操作可视化的实时交互反馈工具
  • MindSpore GPU版安装避坑指南:从Python版本到CUDA匹配的全流程解析
  • 网页文本智能替换:提升内容编辑效率的开源工具
  • IEEE 802.1 Qbv协议实战:如何用EST增强工业网络流量调度(附配置示例)
  • DCT-Net在个人品牌中的应用:如何制作统一风格的团队头像
  • Unity游戏开发:5个导致托管堆内存溢出的真实案例与修复技巧
  • PostgreSQL 技术日报 (3月10日)|IIoT 性能瓶颈与内核优化新讨论
  • 老旧Mac技术改造工程:使用OpenCore Legacy Patcher实现系统焕新
  • 2026年 脂肪酸系列产品厂家推荐榜单:椰子油/蓖麻油/棕榈油脂肪酸及钾皂、二乙醇酰胺等专业原料供应商深度解析 - 品牌企业推荐师(官方)
  • BetterNCM Installer:网易云音乐插件管理的智能解决方案
  • OpenCore Legacy Patcher项目管理指南:让老旧Mac焕发新生
  • Jetson AGX Orin上PyTorch和Torchvision安装避坑指南(附详细编译步骤)
  • 开源歌词工具:高效制作同步歌词的专业解决方案
  • 2026实木多层板材优质品牌推荐榜:全屋定制板材品牌/十大板材品牌排名/十大板材品牌有哪些/十大生态板品牌排名/选择指南 - 优质品牌商家
  • GLM-4V-9B场景应用:教育、办公、创作,多领域实用案例