一个小站的自留地

起于小站，终于生活。
现实之外，一个普通人的思考。

博客地址：ygxz.in
讨论组：https://t.me/ygxz_group

12:31 · 2025年7月10日 · 周四

一个小站的自留地

Grok 4 系列模型据信将在一周内发布。目前消息称 Grok 4 系列会有 grok-4-0629 和 grok-4-code-0629 两个型号。具有和前代模型相同的 128k 上下文窗口，支持推理，但只能输入文本模态内容。

马斯克旗下 xAI 发布 Grok 4 模型

北京时间 2025 年 7 月 10 日，Elon Musk 旗下的 xAI 公司正式发布了其下一代大语言模型 Grok 4 。该模型在多项关键基准测试中表现出色，综合性能超越了 OpenAI 的 o3 和 Google 的 Gemini 2.5 Pro 等主要竞争对手。

Grok 4 在被誉为「人类最后的考试 (HLE)」的超高难度测试中得分远超以往模型，其增强版 Grok 4 Heavy 更是在 AIME 2025 (美国数学邀请赛) 中取得满分。根据 AI 评估平台 Artificial Analysis 的数据，Grok 4 目前在综合性能上排名第一。

Grok 4 是一个支持文本和图像输入的多模态模型，拥有 256K 的上下文窗口。其强大的推理能力得益于在强化学习 (RL) 上的大量投入。Grok 4 Heavy 版本更是一个多智能体系统，能协同解决复杂问题。

目前，Grok 4 已向付费用户开放，提供每年 300 美元和 3000 美元（针对 Grok 4 Heavy）两种订阅等级。其 API 接口也已上线，价格与前代持平。xAI 还公布了未来计划，将在未来数月内陆续发布专用的编码模型、多模态智能体和视频生成模型。

（综合媒体报道）

13:56 · 2025年7月9日 · 周三

一个小站的自留地

前端开发框架 Remix 的开发团队宣布了两个重要发展方向： React Router v7 已将 Remix 的核心功能完全整合进来，包括服务端渲染、代码分割和实验性的 React Server Components (RSC) 支持。这为现有的数百万 React Router 项目提供了升级到现代全栈开发的平滑路径。 RSC 是这次更新的亮点，它允许开发者在服务器端渲染组件，然后将结果传送到客户端，实现了更高效的数据加载和更好的性能表现。 Remix v3 将放弃 React 转而基于 Preact…

Vercel 宣布收购 NuxtLabs

Vercel 宣布收购 NuxtLabs，标志着 Nuxt 这个基于 Vue.js 的全栈框架将加入 Vercel 生态。NuxtLabs 成立于 2017 年，其开源框架 Nuxt 每周下载量超过百万次，以文件路由、自动导入和服务器端渲染功能著称。

此次收购后，NuxtLabs 计划将 Nuxt UI v4 的所有 Pro 组件免费开放，并附带 Figma Kit。基于 Git 的内容管理系统 Nuxt Studio 也将开源，支持实时协作和类 Notion 编辑体验。同时，即将推出的 NuxtHub 将与 Vercel Marketplace 集成，支持 Postgres 和 Redis 等服务。Vue.js 创始人尤雨溪确认，此前与 VoidZoid 合作开发 DevTools 的合同仍然有效。

收购完成后，Vercel 旗下将拥有 Next.js、Svelte 和 Nuxt 三大主流前端框架。虽然 Vercel 承诺保持 Nuxt 的开源特性和独立治理模式，但部分开发者对前端框架生态集中化表示担忧。支持者认为此举为 Nuxt 提供了可持续发展的资源保障，质疑者则担心可能形成技术垄断和厂商绑定。

（Vercel）

19:31 · 2025年7月6日 · 周日

一个小站的自留地

阿里云发布 Qwen2.5-Max 模型，称其性能超越 DeepSeek V3 和 GPT-4o 阿里云于 2025 年 1 月 29 日推出 Qwen2.5-Max 大语言模型，该模型基于混合专家架构（Mixture-of-Experts, MoE），参数规模超 200 亿，训练数据量达 20 万亿词元。据官方基准测试显示，Qwen2.5-Max 在 Arena-Hard（89.4）、LiveBench（62.2）等 5 项核心指标上均超越 DeepSeek V3 和 GPT-4o，其中数学推理能力（GSM8K…

华为盘古大模型涉嫌抄袭争议

HonestAGI 近日发布报告，指出华为盘古 Pro MoE 72B 大语言模型与阿里千问 2.5 14B 模型存在异常高的相似性。该分析基于一种新的参数分布指纹识别技术，通过检测注意力机制参数的标准差分布模式来识别模型血缘关系。

分析结果显示，两个模型在查询、键值、数值和输出投影矩阵上的相关系数分别达到 0.867、0.928、0.939 和 0.973，综合相关系数为 0.927，远超正常独立开发模型间 0.3 至 0.7 的相似度范围。技术报告还发现，盘古模型保留了千问模型特有的 QKV bias 设计和注意力层归一化权重模式，而这些特征在千问后续版本中已被放弃。

同时，一位自称华为诺亚方舟实验室员工的匿名人士发布详细举报材料，指控由王云鹤领导的「小模型实验室」多次采用「套壳」现有模型的做法。举报者称，盘古 Pro MoE 72B 虽然内部声称是从小模型实验室的 7B 模型扩增而来，但实际上是基于千问 2.5 14B 模型进行的改造。为了掩盖模型来源，开发团队付出了巨大的算力成本进行续训，甚至故意训练「脏数据」来模糊原始特征。举报者表示，用于「洗参数」的算力投入已经足够从头训练一个同等规模的模型。

华为诺亚方舟实验室于 7 月 5 日发布声明回应争议。声明表示，盘古 Pro MoE 是基于昇腾硬件平台开发训练的基础大模型，并非基于其他厂商模型增量训练而来。华为承认模型的部分基础组件代码实现参考了业界开源实践，但强调严格遵循开源许可证要求。

2025 年 3 月，华为诺亚方舟实验室发生人事变动，90 后王云鹤接替姚骏担任实验室主任。王云鹤此前担任华为算法应用部部长，曾因高效 AI 算法创新获得华为「十大发明」奖项。

（综合媒体报道）

13:21 · 2025年7月5日 · 周六

一个小站的自留地

AI 代码编辑器 Cursor 发布了 1.0 正式版。带来了多项重要功能更新，包括自动生成记忆、自动代码审查工具 BugBot、一键 MCP 安装以及 Jupyter 笔记本支持等新功能。另外，通过设置页面新增的网络调试功能，用户可以自主选择是否使用 HTTP/2，这对部分代理场景有兼容性提升。

AI 代码编辑器 Cursor 宣布就此起对个人 Pro 用户的计费模式调整造成的模糊致歉，并承诺：

- 退还过去三周内用户因使用而产生的任何意外费用
- 新的 Pro 定价允许用户使用无限次 Tab 补全和 Auto 模型，并提供 20 美金的 API 额度供高级模型和高级功能调用（无需额外计费）。

（Cursor Blog）

21:46 · 2025年7月4日 · 周五

一个小站的自留地

苹果 WWDC25 全球开发者大会正式开幕北京时间 6 月 10 日凌晨，苹果 WWDC25 全球开发者大会正式开幕。本次大会的最大亮点是推出名为「液态玻璃」(Liquid Glass) 的全新设计语言。苹果将这套源自 visionOS 的设计体系应用到所有平台，采用半透明玻璃质感、实时反射折射效果和景深层次，覆盖应用图标、锁屏界面、控制中心等系统各处。新设计主打通透感和动态响应，旨在让界面元素更加融入主题环境。在命名上，苹果首次统一所有操作系统版本号，从传统递增编号改为年份标识，如iOS 19…

Apple Music 线上环境出现大规模配置事故，错误将歌词的翻译版本提供给所有版本用户。

歌词翻译是 iOS 26 的新功能，在新版本中，歌词翻译是可选功能，且开启后用户应能看到源语言和本地语言的双语歌词。

据大量用户实测，Android 等非第一方平台的 Apple Music 客户端不受影响。

14:55 · 2025年7月2日 · 周三

一个小站的自留地

马斯克旗下 xAI 发布 Grok 3 模型 xAI 正式发布新一代大语言模型 Grok 3，该模型基于 20 万张英伟达 H100 GPU 构建的 Colossus 超级计算机训练，计算量是 Grok 2 的 10 倍，成为目前已知训练算力最大的模型之一。 Grok 3 系列包含 Grok 3 和 Grok 3 mini 两个版本，均支持推理模式。其中，Grok 3 mini Reasoning 已完成训练，Grok 3 Reasoning Beta 仍在测试中。推理模式允许模型在更长的推理时间和更多词元…

Grok 4 系列模型据信将在一周内发布。

目前消息称 Grok 4 系列会有 grok-4-0629 和 grok-4-code-0629 两个型号。具有和前代模型相同的 128k 上下文窗口，支持推理，但只能输入文本模态内容。

12:38 · 2025年6月30日 · 周一

一个小站的自留地

百度今日官宣，将在未来几个月中陆续推出文心大模型 4.5 系列，并于 6 月 30 日起正式开源。早前文心一言在官网宣布将于 4 月 1 日 0 时起全面免费，所有 PC 端和 APP 端用户均可体验文心系列最新模型，同时上线深度搜索功能。此前 The Information 报道，即使苹果国行 AI 确定和阿里合作，但和百度的合作仍然会继续。百度正在为苹果开发基于 AI 的搜索功能，除了能处理图像和文字，也将提升中文版 Siri 的体验，成为国行版 Apple Intelligence 的一部分。

百度开源 ERNIE 4.5 大模型家族

百度正式宣布开源其最新的旗舰级大模型系列 ERNIE 4.5，这是一个包含 10 个不同变体的大规模多模态模型家族。该系列包含 2 个多模态大模型和 4 个大语言模型，共计 23 个模型版本，其中最大模型拥有 4240 亿参数，47B 活跃参数。

ERNIE 4.5 采用了创新的异构多模态混合专家（MoE）架构，支持跨模态参数共享的同时，也为每个模态保留专用参数。这种设计在提升多模态理解能力的同时，实现了文本处理性能的同步增强。模型支持图像、视频和文本等多种输入模态，并生成文本输出。

在技术创新方面，ERNIE 4.5 在三个关键领域实现了突破：多模态异构 MoE 预训练、高效扩展的基础设施，以及针对特定模态的后训练。该模型在预训练阶段达到了 47% 的模型 FLOPs 利用率（MFU），在 2016 块 NVIDIA H800 GPU 上实现了高效训练。

性能评测显示，ERNIE 4.5 在指令遵循、世界知识记忆、视觉理解和多模态推理等方面表现出色。在传统基准测试如 MMLU、MMLU Pro 等任务上，该模型与当前最强的 DeepSeek-V3、Qwen 等模型不相上下。然而在更具挑战性的新评测任务如 AIME、LiveCodeBench 等方面，表现相对一般。

本次开源遵循 Apache 2.0 协议，意味着开发者可以自由进行商业化使用和二次开发。百度还同时开源了完整的开发工具链，包括 ERNIEKit 训练工具包和 FastDeploy 推理部署工具包，涵盖从训练、微调到部署的全栈能力。模型提供了 PyTorch 和 PaddlePaddle 两个版本，以满足不同开发者的需求。

（技术报告）

11:51 · 2025年6月28日 · 周六

21:50 · 2025年6月26日 · 周四

美国芯片出口管制或将拖慢 DeepSeek R2 在华推广步伐

据 The Information 报道，DeepSeek 备受期待的下一代大语言模型 R2 可能无法像其前任 R1 那样在中国迅速广泛普及。据中国主要云服务提供商员工透露，国内英伟达服务器芯片短缺是主要原因，而美国最近禁止专为中国市场设计的英伟达 H20 芯片销售进一步加剧了这一问题。

DeepSeek 的模型完全针对英伟达的硬件和软件进行了优化，在英伟达芯片上运行时表现最佳。R1 发布后，包括字节跳动、阿里巴巴和腾讯在内的中国科技巨头在 2025 年第一季度为英伟达 H20 芯片下了 160 亿美元订单，相当于 120 万块芯片。相比之下，2024 年英伟达向中国发运了 100 万颗 H20 芯片。

据知情人士透露，由对冲基金公司幻方量化拥有的 DeepSeek 尚未确定 R2 的发布时间。CEO 梁文锋对新模型的性能并不满意，工程师正在持续优化直到获得批准发布。

英伟达在声明中表示：「中国拥有全球最大的开发者群体之一，他们创建了开源基础模型和非军事应用。虽然安全至关重要，但这些应用都应以美国的人工智能堆栈为最佳运行平台。」

云服务提供商员工表示，如果 R2 发布后能超越现有开源模型，其需求将令正在应对英伟达芯片短缺的中国云提供商应接不暇。目前使用 R1 的云客户大部分都使用英伟达 H20 芯片运行该模型。

（The Information）

10:00 · 2025年6月25日 · 周三

Cloudflare Containers 公开测试版正式发布

Cloudflare 于 6 月 24 日宣布，Cloudflare Containers 现已面向所有付费计划用户提供公开测试版服务。

Cloudflare Containers 与现有的 Workers 平台实现了紧密集成，开发者只需定义几行代码即可创建容器，就像部署 Worker 一样简单。容器无需管理跨多个区域的配置。当请求新的容器实例时，Cloudflare 会从其全球网络中选择已预置就绪容器的最佳位置，初始容器启动仅需几秒钟时间。

该平台的突出特点是其可编程性。容器实例可以按需启动，并由 Workers 代码控制。开发者可以根据需求灵活选择工具：轻量级可扩展任务使用 Worker，需要更多算力和灵活性的任务使用容器。这为开发者提供了运行以前无法在 Workers 中运行的库的能力，例如使用 FFmpeg 将视频转换为 GIF 的应用程序。

在定价方面，Containers 采用按使用量付费的透明模式。目前提供三种实例类型：dev（256 MiB 内存）、basic（1 GiB 内存）和 standard（4 GiB 内存）。费用从向容器发送请求时开始计算，在容器实例进入休眠状态后停止计费。容器按每 10 毫秒的活跃运行时间计费，内存费率为每 GiB- 秒 0.0000025 美元，CPU 费率为每 vCPU- 秒 0.000020 美元。

Cloudflare 已经规划了多项未来增强功能，包括提高并发实例限制、支持基于利用率的全球自动扩展、增强 Containers 和 Workers 之间的通信方式，以及与开发者平台其他服务的更深度集成等。

（Cloudflare 官方博客）

01:14 · 2025年6月21日 · 周六

据本频信源，iOS 版微信在 8.0.60 版本上正灰度测试朋友圈图片评论功能。如无意外，该功能即将大规模放量。

目前未被灰度到的用户，更新到最新版本后也可查看图片评论。

21:07 · 2025年6月17日 · 周二

一个小站的自留地

Google 云平台全球故障 2025 年 6 月 13 日凌晨 1 时 51 分（北京时间），Google 云平台 (Google Cloud Platform, GCP) 发生全球性重大故障，导致包括 Spotify、Discord、YouTube、Gmail、Cloudflare 在内的众多互联网服务出现大面积中断。故障根因指向 Google 内部身份和访问管理 (Identity and Access Management, IAM) 服务异常。据了解，Google 云内部代号为「Chemi…

Google Cloud 发布全球宕机故障复盘

太平洋夏令时间 2025 年 6 月 12 日 10 时 49 分（北京时间 6 月 13 日凌晨 1 时 49 分），Google Cloud Platform（GCP）发生全球性重大故障，导致包括 Gmail、Google Drive、YouTube 在内的数十项 Google 服务以及依赖 GCP 的第三方服务出现大面积中断。故障持续约 3 小时，其中美国中部地区 us-central1 的恢复时间长达 2 小时 40 分钟。

根据 Google 发布的详细事故报告，故障源于 Service Control 系统 —— 负责 Google 所有 API 请求授权和配额管理的核心组件。5 月 29 日，Google 向 Service Control 部署了一项新的配额策略检查功能，但该代码变更存在致命缺陷：缺乏适当的错误处理机制，且未受功能标志位（Feature Flag）保护。

6 月 12 日，当一项包含空白字段的策略变更被推送到全球数据库时，触发了有问题的代码路径。空指针异常导致 Service Control 二进制文件进入崩溃循环，由于配额管理的全球性质，故障在数秒内蔓延至所有地区。

Google 工程团队在 2 分钟内开始响应，10 分钟内识别根本原因，25 分钟内部署缓解措施。然而，在 us-central1 等大型地区，Service Control 任务重启时产生的「雷群效应」（Thundering Herd）过载了底层基础设施，延长了恢复时间。

此次故障影响了超过 80 项 Google Cloud 服务，包括身份和访问管理（IAM）、Cloud Storage、BigQuery、Vertex AI 等，以及 Gmail、Google Calendar、Google Drive 等 Workspace 产品。Spotify、Discord、Cloudflare、Anthropic Claude、OpenAI 等依赖 GCP 的第三方服务也受到波及。

Google 承诺采取一系列补救措施，包括模块化 Service Control 架构以实现故障开放（Fail-Open）、审查所有消费全球复制数据的系统、强制关键二进制文件变更必须受功能标志保护，以及改进错误处理和测试实践。公司还计划确保监控和通信基础设施在 Google Cloud 主要服务宕机时仍能正常运行。

（Google Cloud）

20:56 · 2025年6月17日 · 周二

一个小站的自留地

GitHub Copilot 发布代理模式预览版 GitHub 宣布为 Copilot 引入多项重大更新，包括代理模式（Agent Mode）预览版、Copilot Edits 正式版，以及首度公开研发代号为 Project Padawan 的自主代理功能。代理模式现已在 VS Code Insiders 版本开放预览。该功能支持多文件上下文感知，可自主迭代代码、识别运行时错误并自动修复，还能通过终端命令建议实现环境配置。开发者只需通过自然语言描述需求（例如「构建马拉松训练追踪 Web 应用」），Copilot…

GitHub Copilot 高级请求计费将于 2025 年 6 月 18 日起施行

GitHub 官方宣布，Copilot 的高级请求（Premium Requests）将于 2025 年 6 月 18 日起正式计费，适用于所有订阅计划。在此之前，用户可免费使用 Copilot 的高级模型，无需为额外的高级请求支付费用。计费开始后，用户的高级请求计数器将重置为零，并可在后台实时追踪用量。部分请求可能会因高需求而受到速率限制。

高级请求主要用于 Copilot Chat、Copilot coding agent、Copilot 代码审查、Copilot Extensions 等高级功能。不同 AI 模型对应不同的高级请求倍率（Multiplier），如 GPT-4.5 单次请求计为 50 个高级请求，Claude Opus 4 为 10，Gemini 2.0 Flash 为 0.25，o3-mini 和 o4-mini 为 0.33。付费用户使用 GPT-4.1 或 GPT-4o 基础模型时不计入高级请求额度，免费用户则每次计 1 个。

21:27 · 2025年6月13日 · 周五

微软 Office 团队完成从 Source Depot 到 Git 的大规模迁移

微软 Office 工程团队完成了一项历时数年的重大技术迁移，将版本控制系统从内部专有的 Source Depot 全面转向开源的 Git。这一迁移项目涉及超 4000 名工程师。

Source Depot 是微软基于 Perforce 技术在 2000 年代初开发的定制版本控制系统，专门用于管理 Windows 和 Office 等大型代码库。当时 Git 尚未诞生，Subversion 也不够成熟，Source Depot 承担了管理数百万行代码的重任。然而，随着时间推移，这一集中式系统的局限性逐渐暴露：获取 Office 代码库需要数小时，分支操作异常复杂，合并变更的流程更是令开发者苦不堪言。

迁移面临的最大技术挑战是 Office 代码库的庞大规模 —— 超过 270 GB 的大小和数百万个文件，远超标准 Git 的处理能力。为解决这一问题，微软开发了 Virtual File System for Git (VFS for Git) 技术，通过虚拟化文件系统实现按需下载文件，将克隆时间从 12 小时缩短至几分钟，检出操作从 2 至 3 小时缩短至 30 秒，状态检查从 10 分钟缩短至 4 至 5 秒。

为此，微软采用了「平行宇宙」迁移策略，创建与 Source Depot 持续同步的 Git 代码库，确保迁移过程的平稳进行。团队还为开发者提供了沙箱环境进行培训，并设置了「红色按钮」回滚机制以应对可能出现的问题。

（danielsada.tech）

11:26 · 2025年6月13日 · 周五

一个小站的自留地

ChatGPT、API 和 Sora 服务中断，疑因微软数据中心电力故障当地时间 2024 年 12 月 26 日下午，OpenAI 的 ChatGPT、API 和 Sora 服务出现大面积中断，影响了全球用户。此次中断报告于美国东部时间下午 1:30 左右开始激增，用户无法正常访问或使用这些服务。Downdetector.com 上报告了超过 50,000 起 ChatGPT 服务中断事件，用户尝试使用 ChatGPT 时收到「内部服务器错误」的消息。 OpenAI 在美国东部时间下午 4:05 …

Google 云平台全球故障

2025 年 6 月 13 日凌晨 1 时 51 分（北京时间），Google 云平台 (Google Cloud Platform, GCP) 发生全球性重大故障，导致包括 Spotify、Discord、YouTube、Gmail、Cloudflare 在内的众多互联网服务出现大面积中断。

故障根因指向 Google 内部身份和访问管理 (Identity and Access Management, IAM) 服务异常。据了解，Google 云内部代号为「Chemist」的核心服务出现问题，该服务负责所有 API 请求的项目状态和策略检查。当这一关键组件失效时，几乎所有云服务的权限验证都被阻断，导致「一票否决」式的连锁故障。

Anthropic 的 Claude、Cursor AI 编程助手、Weights & Biases 机器学习平台均出现服务中断。OpenAI 也因「外部供应商问题」影响了单点登录功能。

Cloudflare 作为承载全球 20% 互联网流量的基础设施提供商，因部分服务依赖 GCP 而被波及，进一步放大了故障影响范围。截至6 月 13 日上午 8 时 33 分，大部分服务开始恢复，但 Google Cloud Dataflow 和 Vertex AI 仍有残留问题。

21:01 · 2025年6月12日 · 周四

一个小站的自留地

哔哩哔哩发布 7.2 断网故障复盘报告 2024 年 7 月 2 日 10:04，哔哩哔哩（以下简称 B 站）机房 A 的公网物理光缆全部中断，导致该机房无法通过公网访问。B 站技术团队近日发布了详细的故障复盘报告，分析了此次事件中暴露的问题并提出了优化措施。故障源于 B 站双公网接入点（POP）至机房 A 的链路同时中断，造成机房 A 公网完全脱网。B 站的网络架构采用 POP 与机房解耦设计，并建立了 B2-CDN 环网。在正常情况下，动态内容分发网络（DCDN）公网节点可通过双 POP 交叉回源站，应对单点故障。…

哔哩哔哩出现大面积故障

12 日晚，哔哩哔哩（下称 B 站）主站和周边服务出现服务不稳定现象，部分用户出现视频无法加载、评论区空白、信息流报错等问题。

本频测试发现，并非所有用户都受到故障影响，考虑到故障面广，很有可能为基础设施的单点故障。

B 站暂未发布声明。

B 站上一次出现大规模故障是在 2024 年 7 月，彼时阿里云上海数据中心因光纤被挖断导致机房整体断网，引发 B 站大规模服务异常导致服务降级。

07:44 · 2025年6月11日 · 周三

一个小站的自留地

OpenAI 宣布将 o3 模型定价降低 80%，更新后定价为输入 2 美元 /M Tokens，输出 8 美元 /M Tokens，甚至低于 gpt-4o 模型。外界猜测，此举是为即将推出的 o3-pro 模型设计的营销手段。

OpenAI 正式发布 o3-pro 模型，Pro、Team、Plus 用户正分阶段灰度中，最早今天可用。

OpenAI 还调高了 o3 的限额，目前 Plus 用户可使用 200 次 / 周。

00:13 · 2025年6月11日 · 周三

开源网盘程序 Alist 疑似被出售

开源网盘程序 Alist 项目出现异动。项目中文文档被篡改，替换为了贵州某公司的收款码、群聊，Docker Hub 镜像被从原作者的 xhofe/alist 修改为 alist666/alist。新主的 Github 账号并无活动记录，身份存疑。

目前 Alist 原开发者已暂时无法联系上，官方群组据信已经移交管理权限给新团队。

根据 Alist 文档页面挂出的收款码，贵州某公司还拥有 Java 工具类库 hutool[.]cn。

2023 年，Linux 环境部署工具 LNMP 和 OneinStack 被曝代码投毒。在此之前，这些项目也经历了从开源到被出售给国内公司的过程。鉴于购买这些开源项目的同类公司曾被曝存在供应链攻击历史，本频提醒读者不要使用中文文档中提供的镜像地址，并注意新版本中可能存在的后门。

本频建议读者固定使用当前由 xhofe 上传的 Alist 版本，并不再更新该程序。（3.40.0 版本及更早）

22:22 · 2025年6月10日 · 周二

一个小站的自留地

OpenAI 正面临服务部分宕机。ChatGPT 内使用 GPT-4o模型有概率遇到输出中断或生成失败的问题。官网状态页面显示，API 用户也受到影响。截至发稿，故障已经持续 5 小时。OpenAI 官方仍未宣布事故解决或提供更多信息。 —————— 当地时间 6 月 10 日至 11 日，OpenAI 经历了一次持续超过 24 小时的服务中断事件，官方将其定性为「部分宕机 (Partial outage)」。此次事件导致其 API 接口和 ChatGPT 服务在全球范围内出现高错误率和高延迟，影…

OpenAI 宣布将 o3 模型定价降低 80%，更新后定价为输入 2 美元 /M Tokens，输出 8 美元 /M Tokens，甚至低于 gpt-4o 模型。

外界猜测，此举是为即将推出的 o3-pro 模型设计的营销手段。

20:00 · 2025年6月10日 · 周二

一个小站的自留地

OpenAI API 与 ChatGPT 出现大规模服务中断 2024 年 12 月 12 日，OpenAI 旗下的 API、ChatGPT 和 Sora 系统遭遇了严重服务中断问题，导致用户无法正常调用 API 和登录平台。根据 OpenAI 的更新公告，问题于北京时间 12 月 12 日上午 7:17 开始被调查，在此之后快速展开修复工作。 OpenAI 在 8:24 宣布已经找到了问题的原因，并正在全力推出解决方案。尽管中断期间 ChatGPT、Sora 以及 API 功能受到了较大影响，工程团…

OpenAI 正面临服务部分宕机。ChatGPT 内使用 GPT-4o模型有概率遇到输出中断或生成失败的问题。官网状态页面显示，API 用户也受到影响。

截至发稿，故障已经持续 5 小时。OpenAI 官方仍未宣布事故解决或提供更多信息。

——————

当地时间 6 月 10 日至 11 日，OpenAI 经历了一次持续超过 24 小时的服务中断事件，官方将其定性为「部分宕机 (Partial outage)」。此次事件导致其 API 接口和 ChatGPT 服务在全球范围内出现高错误率和高延迟，影响了大量用户和依赖其服务的第三方应用。

事件于 6 月 10 日上午开始，OpenAI 迅速响应并展开调查。在确定根本原因后，团队实施了修复措施，API 服务于当天下午开始恢复。ChatGPT 的恢复过程则持续了更长时间，其中语音模式是最后一个被完全修复的功能。直到 6 月 11 日下午，OpenAI 才正式宣布所有服务恢复正常。

OpenAI 承诺将在 5 个工作日内公布此次事件的详细根本原因分析报告，以向外界说明故障的具体技术细节。

Before

After

Home

个人博客

讨论组