太平洋夏令时间 2025 年 6 月 12 日 10 时 49 分(北京时间 6 月 13 日凌晨 1 时 49 分),Google Cloud Platform(GCP)发生全球性重大故障,导致包括 Gmail、Google Drive、YouTube 在内的数十项 Google 服务以及依赖 GCP 的第三方服务出现大面积中断。故障持续约 3 小时,其中美国中部地区 us-central1 的恢复时间长达 2 小时 40 分钟。
根据 Google 发布的详细事故报告,故障源于 Service Control 系统 —— 负责 Google 所有 API 请求授权和配额管理的核心组件。5 月 29 日,Google 向 Service Control 部署了一项新的配额策略检查功能,但该代码变更存在致命缺陷:缺乏适当的错误处理机制,且未受功能标志位(Feature Flag)保护。
6 月 12 日,当一项包含空白字段的策略变更被推送到全球数据库时,触发了有问题的代码路径。空指针异常导致 Service Control 二进制文件进入崩溃循环,由于配额管理的全球性质,故障在数秒内蔓延至所有地区。
Google 工程团队在 2 分钟内开始响应,10 分钟内识别根本原因,25 分钟内部署缓解措施。然而,在 us-central1 等大型地区,Service Control 任务重启时产生的「雷群效应」(Thundering Herd)过载了底层基础设施,延长了恢复时间。
此次故障影响了超过 80 项 Google Cloud 服务,包括身份和访问管理(IAM)、Cloud Storage、BigQuery、Vertex AI 等,以及 Gmail、Google Calendar、Google Drive 等 Workspace 产品。Spotify、Discord、Cloudflare、Anthropic Claude、OpenAI 等依赖 GCP 的第三方服务也受到波及。
Google 承诺采取一系列补救措施,包括模块化 Service Control 架构以实现故障开放(Fail-Open)、审查所有消费全球复制数据的系统、强制关键二进制文件变更必须受功能标志保护,以及改进错误处理和测试实践。公司还计划确保监控和通信基础设施在 Google Cloud 主要服务宕机时仍能正常运行。
(Google Cloud)
GitHub 官方宣布,Copilot 的高级请求(Premium Requests)将于 2025 年 6 月 18 日起正式计费,适用于所有订阅计划。在此之前,用户可免费使用 Copilot 的高级模型,无需为额外的高级请求支付费用。计费开始后,用户的高级请求计数器将重置为零,并可在后台实时追踪用量。部分请求可能会因高需求而受到速率限制。
高级请求主要用于 Copilot Chat、Copilot coding agent、Copilot 代码审查、Copilot Extensions 等高级功能。不同 AI 模型对应不同的高级请求倍率(Multiplier),如 GPT-4.5 单次请求计为 50 个高级请求,Claude Opus 4 为 10,Gemini 2.0 Flash 为 0.25,o3-mini 和 o4-mini 为 0.33。付费用户使用 GPT-4.1 或 GPT-4o 基础模型时不计入高级请求额度,免费用户则每次计 1 个。
微软 Office 团队完成从 Source Depot 到 Git 的大规模迁移
微软 Office 工程团队完成了一项历时数年的重大技术迁移,将版本控制系统从内部专有的 Source Depot 全面转向开源的 Git。这一迁移项目涉及超 4000 名工程师。
Source Depot 是微软基于 Perforce 技术在 2000 年代初开发的定制版本控制系统,专门用于管理 Windows 和 Office 等大型代码库。当时 Git 尚未诞生,Subversion 也不够成熟,Source Depot 承担了管理数百万行代码的重任。然而,随着时间推移,这一集中式系统的局限性逐渐暴露:获取 Office 代码库需要数小时,分支操作异常复杂,合并变更的流程更是令开发者苦不堪言。
迁移面临的最大技术挑战是 Office 代码库的庞大规模 —— 超过 270 GB 的大小和数百万个文件,远超标准 Git 的处理能力。为解决这一问题,微软开发了 Virtual File System for Git (VFS for Git) 技术,通过虚拟化文件系统实现按需下载文件,将克隆时间从 12 小时缩短至几分钟,检出操作从 2 至 3 小时缩短至 30 秒,状态检查从 10 分钟缩短至 4 至 5 秒。
为此,微软采用了「平行宇宙」迁移策略,创建与 Source Depot 持续同步的 Git 代码库,确保迁移过程的平稳进行。团队还为开发者提供了沙箱环境进行培训,并设置了「红色按钮」回滚机制以应对可能出现的问题。
(danielsada.tech)
微软 Office 工程团队完成了一项历时数年的重大技术迁移,将版本控制系统从内部专有的 Source Depot 全面转向开源的 Git。这一迁移项目涉及超 4000 名工程师。
Source Depot 是微软基于 Perforce 技术在 2000 年代初开发的定制版本控制系统,专门用于管理 Windows 和 Office 等大型代码库。当时 Git 尚未诞生,Subversion 也不够成熟,Source Depot 承担了管理数百万行代码的重任。然而,随着时间推移,这一集中式系统的局限性逐渐暴露:获取 Office 代码库需要数小时,分支操作异常复杂,合并变更的流程更是令开发者苦不堪言。
迁移面临的最大技术挑战是 Office 代码库的庞大规模 —— 超过 270 GB 的大小和数百万个文件,远超标准 Git 的处理能力。为解决这一问题,微软开发了 Virtual File System for Git (VFS for Git) 技术,通过虚拟化文件系统实现按需下载文件,将克隆时间从 12 小时缩短至几分钟,检出操作从 2 至 3 小时缩短至 30 秒,状态检查从 10 分钟缩短至 4 至 5 秒。
为此,微软采用了「平行宇宙」迁移策略,创建与 Source Depot 持续同步的 Git 代码库,确保迁移过程的平稳进行。团队还为开发者提供了沙箱环境进行培训,并设置了「红色按钮」回滚机制以应对可能出现的问题。
(danielsada.tech)
2025 年 6 月 13 日凌晨 1 时 51 分(北京时间),Google 云平台 (Google Cloud Platform, GCP) 发生全球性重大故障,导致包括 Spotify、Discord、YouTube、Gmail、Cloudflare 在内的众多互联网服务出现大面积中断。
故障根因指向 Google 内部身份和访问管理 (Identity and Access Management, IAM) 服务异常。据了解,Google 云内部代号为「Chemist」的核心服务出现问题,该服务负责所有 API 请求的项目状态和策略检查。当这一关键组件失效时,几乎所有云服务的权限验证都被阻断,导致「一票否决」式的连锁故障。
Anthropic 的 Claude、Cursor AI 编程助手、Weights & Biases 机器学习平台均出现服务中断。OpenAI 也因「外部供应商问题」影响了单点登录功能。
Cloudflare 作为承载全球 20% 互联网流量的基础设施提供商,因部分服务依赖 GCP 而被波及,进一步放大了故障影响范围。截至6 月 13 日上午 8 时 33 分,大部分服务开始恢复,但 Google Cloud Dataflow 和 Vertex AI 仍有残留问题。
12 日晚,哔哩哔哩(下称 B 站)主站和周边服务出现服务不稳定现象,部分用户出现视频无法加载、评论区空白、信息流报错等问题。
本频测试发现,并非所有用户都受到故障影响,考虑到故障面广,很有可能为基础设施的单点故障。
B 站暂未发布声明。
B 站上一次出现 大规模故障 是在 2024 年 7 月,彼时阿里云上海数据中心因光纤被挖断导致机房整体断网,引发 B 站大规模服务异常导致服务降级。
开源网盘程序 Alist 项目出现异动。项目中文文档被篡改,替换为了贵州某公司的收款码、群聊,Docker Hub 镜像被从原作者的 xhofe/alist 修改为 alist666/alist。新主的 Github 账号并无活动记录,身份存疑。
目前 Alist 原开发者已暂时无法联系上,官方群组据信已经移交管理权限给新团队。
根据 Alist 文档页面挂出的收款码,贵州某公司还拥有 Java 工具类库 hutool[.]cn。
2023 年,Linux 环境部署工具 LNMP 和 OneinStack 被曝代码投毒。在此之前,这些项目也经历了从开源到被出售给国内公司的过程。鉴于购买这些开源项目的同类公司曾被曝存在 供应链攻击历史 ,本频提醒读者不要使用中文文档中提供的镜像地址,并注意新版本中可能存在的后门。
本频建议读者固定使用当前由 xhofe 上传的 Alist 版本,并不再更新该程序。(3.40.0 版本及更早)
外界猜测,此举是为即将推出的 o3-pro 模型设计的营销手段。
截至发稿,故障已经持续 5 小时。OpenAI 官方仍未宣布事故解决或提供更多信息。
——————
当地时间 6 月 10 日至 11 日,OpenAI 经历了一次持续超过 24 小时的服务中断事件,官方将其定性为「部分宕机 (Partial outage)」。此次事件导致其 API 接口和 ChatGPT 服务在全球范围内出现高错误率和高延迟,影响了大量用户和依赖其服务的第三方应用。
事件于 6 月 10 日上午开始,OpenAI 迅速响应并展开调查。在确定根本原因后,团队实施了修复措施,API 服务于当天下午开始恢复。ChatGPT 的恢复过程则持续了更长时间,其中语音模式是最后一个被完全修复的功能。直到 6 月 11 日下午,OpenAI 才正式宣布所有服务恢复正常。
OpenAI 承诺将在 5 个工作日内公布此次事件的详细根本原因分析报告,以向外界说明故障的具体技术细节。
北京时间 6 月 10 日凌晨,苹果 WWDC25 全球开发者大会正式开幕。本次大会的最大亮点是推出名为「液态玻璃」(Liquid Glass) 的全新设计语言。
苹果将这套源自 visionOS 的设计体系应用到所有平台,采用半透明玻璃质感、实时反射折射效果和景深层次,覆盖应用图标、锁屏界面、控制中心等系统各处。新设计主打通透感和动态响应,旨在让界面元素更加融入主题环境。
在命名上,苹果首次统一所有操作系统版本号,从传统递增编号改为年份标识,如iOS 19 变更为 iOS 26。
功能方面,iOS 26 新增独立的游戏应用,集成 Apple Arcade 和 Game Center 功能;电话应用增加来电筛选、呼叫保持助理等 AI 驱动功能;相机界面简化,首屏仅保留拍照和录影两个核心模式。iMessage 补强了聊天背景、群投票、群收发等此前缺失的功能。
iPadOS 26 在生产力方面实现突破,支持类似 macOS 的自由窗口调整、三色窗口按钮、App Exposé 和菜单栏等功能,进一步缩小与桌面系统的操作差距。
macOS Tahoe 26 推出新的 Metal 4 引擎和游戏叠层功能。watchOS 26 引入基于 Apple Intelligence 的「运动搭子」(Workout Buddy),能在锻炼过程中提供个性化指导和鼓励。
Apple Intelligence 功能虽有更新,但苹果表示 Siri 的升级仍需时间完善。同时,这些 AI 功能何时在国行设备上线仍未明确。
新系统的开发者预览版已于今日推出,公测版将于 7 月发布,正式版预计今年秋季随新硬件一同推出。
2025 年 5 月 19 日,安全研究员 Bob Dyachenko 与 Cybernews 团队发现一个容量达 631 GB 的 MongoDB 数据库因未设置密码保护而完全暴露在公网上,导致超过 40 亿条中国用户记录泄露,成为迄今已知最大规模的中国个人数据泄露事件。
该数据库包含 16 个数据集,涵盖从社交通信到金融支付的全方位个人信息。其中最大的「wechatid_db」集合包含 8.05 亿条微信 ID 数据,「address_db」存储 7.8 亿条带地理标识的住址信息,「bank」集合则含有 6.3 亿条银行卡号、姓名、生日等金融数据。名为「三要素校验」的数据集收录 6.1 亿条身份证、手机号、用户名信息,「wechatinfo」集合的 5.77 亿条记录疑似包含微信元数据、通讯日志甚至聊天内容。
支付宝相关数据同样大量泄露,「zfbkt_db」集合包含 3 亿条支付宝卡片及 Token 信息。其余数据集还涵盖赌博、车辆登记、就业、养老保险等多领域信息,甚至包括标注为「tw_db」的台湾相关数据。
研究团队指出,如此海量且多样的数据类型表明这极可能是一个集中式聚合枢纽,用于为几乎任何中国公民建立详尽的行为、经济与社会画像。数据规模之大意味着威胁行为者可将其用于钓鱼诈骗、敲诈勒索、金融欺诈,甚至国家级情报收集与信息操控。
数据库在被发现后于 5 月 20 日迅速下线,但研究团队无法确认数据库所有者身份。
MongoDB 至今仍采用无密码的默认设置,导致大量监听公网的数据库处于「裸奔」状态,为此类大规模泄露事件埋下隐患。
本频提醒,读者务必注意 MongoDB 默认配置的安全隐患。非必要不暴露在公网,且必须做好鉴权设置。
(Cybernews)
2025 年 6 月 6 日凌晨,阿里云核心域名 aliyuncs.com 发生解析异常,导致多项云服务在全球范围内无法访问。
北京时间 6 月 6 日凌晨 2 时 57 分,阿里云监控发现 aliyuncs.com 域名解析出现异常。受影响的服务包括对象存储 OSS、内容分发网络 CDN、容器镜像服务 ACR、云解析 DNS 等多项核心云产品。
凌晨 4 时 4 分,阿里云工程师初步确认导致域名解析异常的原因并开始紧急处理。阿里云同时向客户发送通知邮件,建议将本地 DNS 服务器指向 223.5.5.5 和 223.6.6.6 以降低业务影响,并提供了负载均衡等服务的临时解决方案。
上午 8 时 11 分,阿里云宣布解析异常问题已完成修复,受影响云产品开始逐步恢复。上午 9 时左右,所有受影响的云产品已全部恢复正常运行。
——————
根据技术社区分析,此次异常的直接原因是 aliyuncs.com 域名的 NS 记录被修改,指向了 Shadowserver 基金会的 DNS 服务器。Shadowserver 是国际知名的非营利网络安全组织,通常协助执法机构接管恶意域名进行流量监测。
由于 NS 记录控制着域名的权威解析服务器,这一变更导致所有对 aliyuncs.com 及其子域名的 DNS 查询都被导向错误的服务器,进而造成解析失败。
阿里云在故障通告中确认了域名解析异常,但未公布具体原因。事件修复后,阿里云为该域名增加了包括禁止转移、禁止更新、禁止删除在内的锁定措施。
受 DNS 缓存机制影响,即使在官方宣布修复后,部分地区的完全恢复仍需要额外时间等待缓存刷新。目前未发现客户数据泄露的证据。
截至发稿,阿里云尚未发布详细的事故调查报告。
(综合媒体报道)
OpenAI 的 ChatGPT 早在同类功能上线之初就采用类似方案。
早前,Anthropic 还将 AI 编程助手 Claude Code 下放给 Cluade Pro 用户而无需按量付费,但 Pro 用户使用的是轻量化的版本,也面临更严格的速率限制。
6 月 6 日,通义千问(Qwen)团队正式发布 Qwen3-Embedding 系列模型。该系列模型基于 Qwen3 基础模型训练,支持超过 100 种自然语言及多种编程语言。
该系列模型架构灵活,提供 0.6B、2B、8B 三种参数规模。
训练方面,Embedding 模型采用三阶段训练范式:首先利用超大规模弱监督数据进行对比学习预训练,随后基于高质量标注数据进行监督训练,最后通过模型融合提升整体性能。
Reranker 模型则直接基于高质量标注数据进行监督训练。值得一提的是,Embedding 模型在弱监督阶段通过多任务适配的 Prompt 体系,动态生成大规模弱监督文本对,突破了传统数据获取方式的局限。
Qwen3-Embedding 系列已在 Hugging Face、ModelScope 和 GitHub 平台开源。
(通义千问)
该版本新增支持「thinking budget」(推理预算),允许用户控制思考成本/响应时长。
5 月 29 日,德国 AI 初创公司 BlackForestLabs (BFL) 正式发布 FLUX.1 Kontext。
FLUX.1 Kontext 包含两个核心模型:Kontext [pro] 专为迭代编辑工作流设计,支持局部编辑、场景变换和多步骤细化,同时保持角色和风格一致性;Kontext [max] 则提供最高性能,在提示遵循、高级排版处理和渲染质量方面表现出色,且不影响生成速度。
该模型的核心创新在于将传统的文本生图与图像编辑功能融合在单一的「流匹配架构」中,用户可以通过简单的文本指令对现有图像进行精确修改,无需微调或复杂的编辑工作流。
FLUX.1 Kontext 的主要能力包括:角色一致性保持(在不同场景中保持角色身份特征)、局部编辑(针对特定元素进行修改而不影响其他部分)、风格迁移(保持参考图像的独特风格生成新场景)以及交互式的多轮迭代编辑。
目前 Kontext [pro] 和 [max] 模型已通过 BFL API 及 KreaAI、Freepik、Lightricks、LeonardoAI、Replicate、FAL、TogetherAI 等合作平台提供服务,在 Replicate 平台的推理费用约为每张图像 0.04 美元。BFL 还计划推出开放权重的 Kontext [dev] 版本,目前正在进行定向测试。
Google 于 6 月 2 日紧急发布 Chrome 137.0.7151.68 版本,修复了一个正在被野外利用的高危零日漏洞 CVE-2025-5419。该漏洞位于 Chrome 的 V8 JavaScript 引擎中,属于越界读写 (out-of-bounds read/write) 类型,CVSS 评分高达 8.8。
攻击者可通过构造恶意 HTML 或 JavaScript 页面触发此漏洞,导致 V8 引擎错误地读写越界内存,从而实现远程代码执行。利用过程无需特殊权限,仅需诱导用户访问特制页面即可成功攻击。Google Threat Analysis Group 于 5 月 27 日发现并报告了此漏洞,次日 Google 即推送热修复,6 月 2 日在正式通道发布了补丁版本。
所有基于 Chromium 的浏览器均受此漏洞影响。目前 Microsoft Edge 已于 6 月 3 日发布 137.0.3296.62 版本完成修复,Brave 浏览器同日发布 1.79.119 版本 (内置 Chromium 137.0.7151.68),Vivaldi 于 6 月 4 日推出 7.4.x 更新 (升级至 Chromium 136.0.7103.162)。Arc 浏览器的最新版本仍使用存在漏洞的 Chromium 137.0.7151.56,用户需等待官方更新。
(helpnetsecurity)
另外,通过设置页面新增的网络调试功能,用户可以自主选择是否使用 HTTP/2,这对部分代理场景有兼容性提升。
北京时间 6 月 5 日凌晨,OpenAI 发布了两项ChatGPT 企业功能更新:连接器 (Connectors) 和记录模式 (Record Mode),标志着 ChatGPT 开始深度融入企业工作流程 。
连接器功能可将 ChatGPT 直接连接到企业内部系统,目前支持 Outlook、Microsoft Teams、Gmail、Google Drive、Linear、SharePoint、Dropbox、Box 等主流企业工具 。结合深度研究功能,用户可以通过自然语言指令让 ChatGPT 自动跨平台搜索、分析数据并生成结构化报告。系统严格遵循用户权限体系,仅调用用户有权访问的文档,确保数据安全 。
记录模式首先在 macOS 版 ChatGPT 上线,支持一键录音转写、自动生成会议纪要和提取关键决策要点 。用户可通过自然语言检索会议内容,并要求 ChatGPT 基于历史会议记录生成汇报材料或分析文档 。
企业还可通过模型上下文协议 (Model Context Protocol, MCP) 构建自定义连接器,将私有数据库和内部系统接入 ChatGPT。HubSpot 已成为首个通过 MCP 发布官方连接器的合作伙伴 。
这些功能已向 ChatGPT Team、Enterprise、Edu 用户开放,Plus 和 Pro 用户可使用部分功能。受 GDPR 限制,欧盟地区用户暂时无法使用连接器功能。OpenAI 承诺企业和教育用户的数据不会用于模型训练 。
(综合媒体报道)