OpenAI 于 2025 年 4 月 17 日凌晨正式发布了全新推理模型 o3 与 o4-mini。
o3 模型在 Codeforces、SWE-bench、MMMU 等权威测试中得分均超 2700 分,全球排名前 200,外部专家评价其「接近或达到天才水平」。不过,这一智力提升的代价是算力需求达到 o1 的十倍以上。
o4-mini 则以小巧高效著称,在 2025 年 AIME 数学竞赛中配合 Python 解释器取得 99.5% 的高分,性能全面超越 o3-mini,适合高并发和成本敏感场景。
两款模型均已在 ChatGPT Plus、Pro 和 Team 用户端上线,并通过 API 向开发者开放。o3-pro 版本预计数周内发布。
(综合媒体报道)
北京时间 2025 年 4 月 15 日凌晨,OpenAI 发布 GPT-4.1 系列模型,包括 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano 三款产品。
这系列模型主要有三大特点:编程能力大幅提升、指令遵循更加精准以及支持高达 100 万 token 的超长上下文。
在 SWE-bench Verified 测试中,GPT-4.1 得分 54.6%,比 GPT-4o 提升 21.4 个百分点,比 GPT-4.5 提升 26.6 个百分点。
GPT-4.1 mini 表现超越 GPT-4o,同时较后者延迟降低近 50%,成本降低 83%。
最小型号 GPT-4.1 nano 是 OpenAI 目前速度最快、成本最低的模型,输入价格仅 0.7 元/百万 token。
GPT-4.1 系列目前仅能通过 API 使用,不会直接出现在 ChatGPT 中,但 ChatGPT 的 GPT-4o 已整合部分 GPT-4.1 功能。同时,OpenAI 宣布 GPT-4.5 Preview 将于 2025 年 7 月 14 日下线。
据传 OpenAI 还在开发类似费曼式的推理模型,能跨学科整合概念提出创新实验,甚至打算推出月费高达 14 万元的博士级研究服务。
(综合媒体报道)
本频测试,在不开启代理的情况下,仍然能打开登录页面,但是有几率登录失败。
(Github Discussion)
——————
4月14日更新:
根据 GitHub 官方状态页面发布的信息,由于一项配置变更产生了意外影响,未登录状态下尝试从中国访问 GitHub.com 的用户在过去一天内暂时无法访问该网站。
该事件于北京时间 2025 年 4 月 13 日凌晨 4:01 开始,直到当天晚上 22:55 才得到缓解,影响持续了近 19 个小时。
GitHub 官方表示,此次事件仅影响未登录用户,已登录的用户在此期间仍能正常访问平台服务。GitHub 在其官方状态页面上发布了回溯性报告,确认「导致此影响的配置变更已被撤销,用户在尝试访问 GitHub.com 时应不再遇到问题。」
(Github)