Google 于 11 月 20 日发布 Gemini 3 Pro Image Preview 模型。作为 Gemini 3 系列的一员,该模型引入了推理能力,能够在响应前对思路进行推理,从而在复杂和多轮图像生成及编辑任务中实现更高的准确性和图像质量。Gemini 3 Pro Image 支持最高 4K 分辨率输出,增强了多语言长文本的渲染能力,并集成了 Google 搜索功能(Grounding with Google Search)以提供更准确、实时的知识支持。
该模型支持文本和图像输入,输出包含图像和文本,输入上下文限制为 64k 词元(Token),输出限制为 32k 词元。开发者目前可通过 Vertex AI Studio 和 Google Gen AI SDK 访问该预览版模型。
(Google Cloud)