OpenAI 发布 GPT-5.4 模型3 月 6 日，OpenAI 正式发布 GPT-5.4，并同步推出 GPT-5.4 Pro

一个小站的自留地

OpenAI 发布 GPT-5.3 Instant 模型 3 月 4 日，OpenAI 宣布推出 GPT-5.3 Instant 模型。作为 ChatGPT 日常使用频率最高的模型更新，GPT-5.3 Instant 重点改善了语气、相关性和对话流畅度，旨在提供更准确的回答及更优质的网络搜索整合结果。该模型在多个方面进行了体验优化。首先，模型大幅减少了不必要的拒答和过度防御性的说教前言，能够更直接地提供有用信息。其次，在调用网络搜索时，GPT-5.3 Instant 能够更好地平衡网络信息与自身知识…

OpenAI 发布 GPT-5.4 模型

3 月 6 日，OpenAI 正式发布 GPT-5.4，并同步推出 GPT-5.4 Pro。新模型已在 ChatGPT、API 和 Codex 上线，其中 ChatGPT 端名称为 GPT-5.4 Thinking，将逐步替代 GPT-5.2 Thinking；GPT-5.2 Thinking 将在 Legacy Models 保留至 2026 年 6 月 5 日后退役。

能力上，GPT-5.4 将 GPT-5.3-Codex 的编程能力与通用推理、工具调用、原生 Computer Use 合并为单一模型，并支持更大规模的工具生态。官方称其在知识工作、浏览器与桌面操作、工具检索与多步骤任务上均有提升。核心指标包括：GDPval 83.0%（GPT-5.2 为 70.9%）、SWE-Bench Pro 57.7%（GPT-5.2 为 55.6%）、OSWorld-Verified 75.0%（GPT-5.2 为 47.3%，人类基准 72.4%）、BrowseComp 82.7%（GPT-5.4 Pro 为 89.3%）。

在办公场景中，GPT-5.4 的电子表格建模内部评测为 87.3%（GPT-5.2 为 68.4%），演示文稿盲测中有 68.0% 的对比样本被人工评审偏好。OpenAI 同日还发布了 ChatGPT for Excel add-in，并更新了 Codex/API 的 spreadsheet 与 presentation 技能。官方同时表示，GPT-5.4 在一组真实错误反馈提示词中，单条事实性错误概率较 GPT-5.2 下降 33%，整条回复含错概率下降 18%。

价格方面，API 中 gpt-5.4 定价为每百万词元 (Token) 输入 2.50 美元、输出 15 美元；gpt-5.4-pro 为输入 30 美元、输出 180 美元。

（OpenAI）