3 月 6 日,OpenAI 正式发布 GPT-5.4,并同步推出 GPT-5.4 Pro。新模型已在 ChatGPT、API 和 Codex 上线,其中 ChatGPT 端名称为 GPT-5.4 Thinking,将逐步替代 GPT-5.2 Thinking;GPT-5.2 Thinking 将在 Legacy Models 保留至 2026 年 6 月 5 日后退役。
能力上,GPT-5.4 将 GPT-5.3-Codex 的编程能力与通用推理、工具调用、原生 Computer Use 合并为单一模型,并支持更大规模的工具生态。官方称其在知识工作、浏览器与桌面操作、工具检索与多步骤任务上均有提升。核心指标包括:GDPval 83.0%(GPT-5.2 为 70.9%)、SWE-Bench Pro 57.7%(GPT-5.2 为 55.6%)、OSWorld-Verified 75.0%(GPT-5.2 为 47.3%,人类基准 72.4%)、BrowseComp 82.7%(GPT-5.4 Pro 为 89.3%)。
在办公场景中,GPT-5.4 的电子表格建模内部评测为 87.3%(GPT-5.2 为 68.4%),演示文稿盲测中有 68.0% 的对比样本被人工评审偏好。OpenAI 同日还发布了 ChatGPT for Excel add-in,并更新了 Codex/API 的 spreadsheet 与 presentation 技能。官方同时表示,GPT-5.4 在一组真实错误反馈提示词中,单条事实性错误概率较 GPT-5.2 下降 33%,整条回复含错概率下降 18%。
价格方面,API 中 gpt-5.4 定价为每百万词元 (Token) 输入 2.50 美元、输出 15 美元;gpt-5.4-pro 为输入 30 美元、输出 180 美元。
(OpenAI)