2025 年 4 月 23 日,OpenAI 最新的图像生成模型 gpt-image-1 正式通过 API 向开发者和企业开放。
该模型是一个原生多模态模型,能够理解复杂的文本指令、结合世界知识生成图片,并可按照指令调整风格、内容和细节。与 DALL-E 系列相比,gpt-image-1 在图片中准确生成清晰、可读文本的能力有显著提升,解决了以往图像中出现「乱码」的问题。
Adobe、Figma、Airtable、Gamma、HeyGen 等平台已集成该模型。在计价方面,输入文本 5 美元/百万词元,图片输入 10 美元/百万词元,图片输出 40 美元/百万词元,平均每张图片成本约 2-19 美分。所有开发者层级均可访问,但需通过 OpenAI API 实名验证。