谷歌发布Gemini 2.5 Flash与Flash-Lite升级版:效率提升50%,推理速度再突破
thinkindev • 2025-09-26
1494 views
谷歌DeepMind团队近日在Google AI Studio和Vertex AI平台推出了Gemini 2.5 Flash及Flash-Lite模型的升级版本。此次更新聚焦于模型效率与性能的协同优化:Gemini 2.5 Flash-Lite的输出令牌数量减少50%,而标准版Flash模型也实现24%的令牌压缩,显著降低了计算资源消耗。尽管这两个模型暂未作为稳定版发布,但其在质量与推理速度上的双重提升,将为下一代稳定版模型的设计提供关键数据支撑。这一迭代体现了谷歌在轻量化AI模型领域的技术积累,对边缘计算、实时交互应用等场景具有重要实践意义。
核心要点
- Gemini 2.5 Flash系列模型实现输出令牌大幅压缩(Flash-Lite减少50%,Flash减少24%)
- 新模型在Google AI Studio与Vertex AI平台开放,侧重效率优化而非直接升级为稳定版
- 技术迭代为未来稳定版模型提供核心参数参考,推动轻量化AI落地应用