当前位置：首页 > news >正文

谷歌发布Gemini 3 Flash：性能媲美顶级模型成本大幅降低

news 2026/7/6 21:38:50

大语言模型发布周期持续加速。在过去30天内，我们见证了谷歌Gemini 3 Pro、Anthropic的Opus 4.5以及OpenAI的GPT-5.2的相继发布。除此之外，A2AI、DeepSeek、Grok、Mistral、Nvidia等公司也推出了各自的模型。今天轮到谷歌再次出手，推出Gemini 3的更小更快版本：Gemini 3 Flash。

正如我们在谷歌和其他前沿模型开发商的小型模型中所见，Gemini 3 Flash在能力方面与其Pro版本相差不远。在开启思考模式的情况下，Gemini 3 Flash在大多数基准测试中接近Gemini 3 Pro、Anthropic的Sonnet 4.5和OpenAI的GPT-5.2的表现，有时甚至超越它们。与前代产品一样，它也提供100万Token的上下文窗口。

为了更好地理解Gemini 3 Flash的性能表现，仅在几周前，Flash 3还能在大多数前沿模型基准测试中位居榜首。

谷歌在今日的公告中写道："长期以来，AI让我们面临一个选择：要么是缓慢昂贵的大型模型，要么是能力较弱的高速模型。Gemini 3 Flash结束了这种妥协。Gemini 3 Flash既提供了智能又保证了速度。"

与上一代Flash模型（Gemini 2.5 Flash）相比，Gemini 3 Flash实现了显著提升，这对开发者来说尤为重要，因为Flash长期以来一直被认为是性价比最佳的模型。

谷歌在多模态推理领域一直处于领先地位，其模型能够对文本、图像、音频文件和视频进行推理。最近，Gemini模型在即时构建可视化方面也变得相当出色，谷歌也为这个新模型强调了这一点。实际上，Gemini 3 Flash在多模态MMMU-Pro基准测试中甚至超越了Gemini 3 Pro，尽管仅高出0.2%。

谷歌模型最近取得进展的另一个领域是编程。在SWE-Bench Verified基准测试中，Gemini 3 Flash也超越了Gemini 3 Pro，甚至领先于Sonnet 4.5（尽管GPT-5.2在这里仍是最佳表现者）。

Warp公司创始人兼首席执行官扎克·劳埃德表示："Gemini 3 Flash仍然是Warp建议代码差异功能的最佳选择，在这里低延迟和成本效率是硬性约束。通过这次发布，它能解决更广泛的常见命令行错误，同时保持快速和经济。在我们的内部评估中，我们看到修复准确性提升了8%。"

我们最近看到的一个趋势是，即使是这些较小的模型，开发者通过API使用的成本也在上升，Gemini 3 Flash现在每百万输入/输出Token的成本为0.5美元/3美元，高于之前的0.3美元/2.5美元。但这仍然比Anthropic的Claude Sonnet（3美元/5美元）或甚至更小且能力较弱的Claude Haiku（1美元/5美元）模型便宜得多。

不过，谷歌表示，平均而言，与Gemini 2.5 Flash相比，Gemini 3 Flash在生成答案时使用的Token减少了30%，同时速度也更快。谷歌只将这个新模型与较旧的2.5 Pro模型进行了比较，在这种比较下，它的速度快了3倍。

新模型现在可通过Google AI Studio和Vertex AI的API使用，也可在公司新的AI编程工具Antigravity、Gemini CLI和Android Studio中使用。当然，谷歌的合作伙伴也会将其集成到自己的工具中。

对于消费者来说，Gemini 3 Flash现在将为Google搜索的AI模式提供支持（Pro模型仍然是一个选项），以及Gemini应用中的"快速"和"思考"模式（Pro模式仍然可用）。

Q&A

Q1：Gemini 3 Flash相比前代产品有什么改进？

A：与Gemini 2.5 Flash相比，Gemini 3 Flash实现了显著性能提升，平均使用的Token减少了30%，速度更快。在能力方面接近顶级模型如Gemini 3 Pro、Sonnet 4.5和GPT-5.2的表现，有时甚至超越它们。同时保持100万Token的上下文窗口。

Q2：Gemini 3 Flash的定价如何？

A：Gemini 3 Flash每百万输入/输出Token的成本为0.5美元/3美元，虽然比前代的0.3美元/2.5美元有所上涨，但仍然比Anthropic的Claude Sonnet（3美元/5美元）或Claude Haiku（1美元/5美元）便宜得多，保持了最佳性价比。

Q3：开发者和普通用户如何使用Gemini 3 Flash？

A：开发者可以通过Google AI Studio和Vertex AI的API使用，也可在Antigravity、Gemini CLI和Android Studio等AI编程工具中使用。普通用户可以通过Google搜索的AI模式和Gemini应用中的"快速"和"思考"模式体验这项技术。

查看全文

http://www.jsqmd.com/news/240247/