在 Google Cloud Next '25 活动上,Google 发布了其 Gemini AI 模型家族的新成员 Gemini 2.5 Flash。该模型被定位为「主力(workhorse)」模型,特别针对低延迟和成本效益进行了优化,旨在满足高容量、实时应用场景的需求。
Gemini 2.5 Flash 的一个关键特性是其动态可控的计算能力,模型能根据提示的复杂性调整其「思考预算」或推理深度,从而在速度、准确性和成本之间取得平衡。
该模型将很快通过 Google Cloud 的 Vertex AI 平台提供。
(Google Cloud Blog)