一个小站的自留地

起于小站，终于生活。
现实之外，一个普通人的思考。

博客地址：ygxz.in
讨论组：https://t.me/ygxz_group

19:21 · 2025年5月19日 · 周一

一个小站的自留地

英伟达 COMPUTEX 2024 主题演讲速评 NVIDIA 在此次演讲中备受关注，不仅业界对其寄予厚望，各路分析师也纷纷发表看法，希望这家 AI 芯片巨头能够推动一场真正的「新工业革命」。在此次 COMPUTEX 2024 演讲中，NVIDIA 释放了三大重要信号： 1. 生成式 AI 将引领新工业革命。 2. NVIDIA 正在构建完整的生成式 AI 生态，强化全栈实力。 3. NVIDIA 布局机器人、自动驾驶等新兴领域，抢占未来增长点。英伟达发布了下一代 GPU 架构 Black…

英伟达 COMPUTEX 2025 主题演讲要点总结

NVIDIA 创始人兼 CEO 黄仁勋 19 日在 Computex 2025 发表主题演讲。

黄仁勋强调，AI 已成为继电力和互联网之后的新一代基础资源，NVIDIA 正致力于打造「AI 工厂」。他在演讲中提出「The more you buy, the more you make」的理念，认为 AI 算力将成为驱动各行各业创新和增长的核心引擎。

黄仁勋宣布，NVIDIA 将与富士康、台积电等台湾伙伴合作，在台建设首个大型 AI 超级计算机，还将在台北北投士林区建立新的大型办公园区「Nvidia Constellation」。

AI 算力方面，NVIDIA 宣布其旗舰 Blackwell 平台将迎来重大升级，今年第三季度将推出 Grace Blackwell GB300 超级芯片，预计带来 1.5 倍的推理性能和 HBM 显存提升，以及 2 倍的网络能力增强。

针对个人开发者和研究者，NVIDIA 推出了 DGX Spark（搭载 GB10 芯片）个人 AI 计算机。更为强大的 DGX Station（搭载 GB300，内存高达约 800GB）则能让用户在桌面上运行万亿参数级别的 AI 大模型。

此外，NVIDIA 还展示了包括用于创建数字孪生的 Omniverse 平台、与谷歌 DeepMind 和迪士尼合作开发的 Newton 物理引擎（7 月开源）、包含 Jetson Thor 处理器和 GR00T 基础模型的 Isaac GR00T 机器人平台、面向企业负载的 RTX PRO 服务器、AI 数据平台「IQ」和 AI Ops 生态系统等成果。

（综合媒体报道，图：REUTERS）

15:04 · 2025年5月19日 · 周一

一个小站的自留地

OpenAI 推出深度研究智能体 Deep Research 北京时间 2 月 3 日，OpenAI 宣布面向深度研究领域推出智能体产品「Deep Research」，该产品能够通过推理综合大量在线信息完成多步骤研究任务。目前该功能已面向 Pro 用户开放，月均查询上限为 100 次，将逐步向 Plus、Team 和企业用户推广。免费用户也将获得「相当小」的额度。 Deep Research 基于 o3 模型构建，针对网页浏览和 Python 数据分析进行优化，具备三项核心能力： - 支持解析互联网文本、图像和…

OpenAI 更新 Deep Research 配额：

- 免费用户：基于 o4-mini 的阉割版，5 次 / 月
- Plus&Team：基于 o3 的完全版 25 次 / 月；基于 o4-mini 的阉割版，额外 15 次 / 月
- Pro：基于 o3 的完全版 250 次 / 月；基于 o4-mini 的阉割版，额外 150 次 / 月

（OpenAI）

13:40 · 2025年5月17日 · 周六

一个小站的自留地

OpenAI 图像生成模型 gpt-image-1 登陆 API 2025 年 4 月 23 日，OpenAI 最新的图像生成模型 gpt-image-1 正式通过 API 向开发者和企业开放。该模型是一个原生多模态模型，能够理解复杂的文本指令、结合世界知识生成图片，并可按照指令调整风格、内容和细节。与 DALL-E 系列相比，gpt-image-1 在图片中准确生成清晰、可读文本的能力有显著提升，解决了以往图像中出现「乱码」的问题。 Adobe、Figma、Airtable、Gamma、HeyGen…

OpenAI 发布编程智能体 Codex

OpenAI 发布了 Codex，一款集成在 ChatGPT 中的云端软件工程智能体 (Agent)，旨在提升开发者的编码效率。Codex 由 codex-1 模型驱动，这是 OpenAI o3 模型的一个特调版本，专为软件工程任务进行了优化。

Codex 能够并行处理多项任务，如编写新功能、解答代码库疑问、修复程序错误 (bug) 及提交拉取请求 (Pull Request) 以供审核。每项任务均在独立的云端沙盒环境中执行，并预加载用户代码库，开发者可通过 AGENTS.MD 文件指导其行为。OpenAI 表示，codex-1 通过强化学习训练，力求生成风格贴近人类且能精确遵循指令的代码，并可持续迭代测试直至通过。

该功能已开始向 ChatGPT Pro、Team 和 Enterprise 用户推送，Plus 及 Edu 用户也将「很快」获得访问权限。初期，Codex 作为研究预览版免费提供，后续将引入用量限制和按需付费方案。

此外，OpenAI 还更新了其本地终端工具 Codex CLI，将默认采用 codex-mini-latest 模型 (codex-1 的 o4-mini 版本)。该模型通过 API 调用的价格为每百万输入词元 (Token) 1.50 美元，每百万输出词元 (Token) 6 美元。

——————

另外，AI 编程公司 Windsurf 在其被 OpenAI 收购的消息传出后，发布了自研的 SWE-1 AI 编程模型系列。该系列旨在覆盖整个软件工程流程，核心理念为「流动感知」 (Flow Awareness)，强调 AI 与开发者间的自然协作。

SWE-1 系列包含三款模型：核心模型 SWE-1，官方称其具备与 Claude 3.5 Sonnet 类似的工具调用推理能力且成本更低，推广期内付费用户可免费使用；SWE-1-lite 模型，将取代此前的 Cascade Base 版本，向所有用户免费开放；以及体积最小、速度最快的 SWE-1-mini 模型，专为 Windsurf Tab 中的低延迟体验设计，亦适用于所有用户。SWE-1 系列模型目前均已在 Windsurf 中上线。

（综合媒体报道）

18:44 · 2025年5月13日 · 周二

一个小站的自留地

支付宝宣布更新LOGO 1月19日，支付宝宣布更新LOGO，新LOGO去掉了外框与文字，仅保留最具辨识度的「支」字标识，围绕「开放、科技、温暖」三个核心理念，同时引入立体的然光，增加通透感和流动感。 2024年，是支付宝诞生第20年。这是支付宝时隔4年再次更换 LOGO，上一次是2020年。（标志情报局）

Google 更新其移动应用程序的 Icon

Google 近日在其手机应用程序的 Icon 上应用了新的 LOGO 设计，原本四种标准色块的「G」标识，被赋予了更自然流动的渐变处理——从块状颜色转向柔和过渡，质感更高级、情绪更丰富。

Google 暂未更新其网页端的完整 LOGO，官方也暂未提供新 Icon 的解读和新闻稿。

（品牌美）

10:58 · 2025年5月7日 · 周三

洛杉矶 CoreSite LA1 数据中心断电影响多家托管商

2025年5月7日7时41分（北京时间），位于洛杉矶 West 7 Center 的 CoreSite LA1 数据中心因双路电源故障断电，导致包括 DMIT、搬瓦工 DC1、ZgoCloud 洛杉矶在内的多家云服务中断。
事故起因是一家第三方施工团队在街道作业时意外损坏了水管，触发建筑防火机制切断了主供电和备用电源。断电后，UPS 系统未能正常接管，机柜断电但环境照明及冷却系统仍在运行，消防喷淋和水压均无异常。

– 8时10分，（DMIT）确认网站和管理系统部署在该机房，其他区域服务不受影响，但控制面板仍然离线；
– 8时14分，工程师闻到机房局部烟味，机柜与机房无可见热损或水损，冷却系统和环境照明正常；
– 8时19分，确认并非真实停电，而是火警报警后为防火自动切断；未触发喷淋，无人员疏散；
– 8时48分，UPS 供应商工程师正在赶赴现场，电气工程师已到位，初步判定 UPS 自动切换出现故障，未能接管断电；
– 10时50分，UPS 技术人员即将抵达并开展修复。

（综合DMIT 公告、Bandwagonhost 状态页面）

——————

本站核心服务由CDN 集群托管，容灾策略已经完成切换；后端部署于美国东部，不受事故影响.

——————

北京时间 12:30 许，机房已经恢复供电。

08:42 · 2025年5月7日 · 周三

一个小站的自留地

谷歌即将推出 Gemini 2.5 Flash 在 Google Cloud Next '25 活动上，Google 发布了其 Gemini AI 模型家族的新成员 Gemini 2.5 Flash。该模型被定位为「主力（workhorse）」模型，特别针对低延迟和成本效益进行了优化，旨在满足高容量、实时应用场景的需求。 Gemini 2.5 Flash 的一个关键特性是其动态可控的计算能力，模型能根据提示的复杂性调整其「思考预算」或推理深度，从而在速度、准确性和成本之间取得平衡。该模型将很快通过…

Google 发布了 Gemini 2.5 Pro 的最新更新版本Gemini 2.5 Pro (I/O edition)。

Google 称其编程能力大幅提升，在所有编程排行榜上名列第一，超越 Claude 3.7 Sonnet (20250219)。

12:38 · 2025年4月29日 · 周二

一个小站的自留地

据媒体报道，阿里最快将于本月中旬发布旗舰模型的升级版，大概率是 Qwen 3。

阿里开源 Qwen3 系列模型，最小仅 6 亿参数，最大达 2350 亿参数

4 月 29 日，阿里巴巴开源了第三代千问大模型 Qwen3 系列，一口气发布了 8 个不同参数规模的模型。其中包括 6 个稠密模型和 2 个混合专家模型（MoE），覆盖从手机端到企业级服务器的各种应用场景：最小的 Qwen3-0.6B 仅有 6 亿参数，量化后只需 0.6GB 显存；最大的旗舰模型 Qwen3-235B-A22B 总参数量达 2350 亿，推理时激活 22 亿参数。

Qwen3 系列最大的创新是支持混合推理模式，通过 enable_thinking 参数控制，用户可将同一模型切换为快速响应或深度思考模式。对数学、编程等需要逻辑推理的问题启用思考模式，而摘要等简单任务则使用非推理模式提升速度。

在性能方面，旗舰模型 Qwen3-235B-A22B 在 LiveCodeBench 编程评测中得分达 70.7 分，超过了 OpenAI 的 o1、DeepSeek-R1 等顶级模型。体积较小的 Qwen3-4B 性能已可媲美上一代的 Qwen2.5-72B-Instruct。此外，Qwen3 系列支持 119 种语言（上一代仅 29 种），强化了 Agent 能力和 MCP 协议支持，并将上下文窗口扩展至最大 128K。

所有 Qwen3 系列模型均采用 Apache 2.0 协议开源，完全免费商用，部署成本约为 DeepSeek-R1 的三分之一。用户可在 Hugging Face、ModelScope 和 Kaggle 等平台获取模型权重。

（DataLearner）

00:42 · 2025年4月29日 · 周二

一个小站的自留地

中国 IPv6 活跃用户数占比达 73% IPv6 是全球公认的下一代互联网发展方向，近年来取得了显著增长。截至 2024 年 5 月，全球 IPv6 支持率约为 39%。在此背景下，中国 IPv6 规模部署也取得了显著进展。截至 2024 年 4 月，中国 IPv6 地址拥有量为 67459 块/32，位居全球第二，占全球 IPv6 地址的 15.05%。截至 2024 年 4 月，中国 IPv6 活跃用户数达 7.878 亿，占网民总数的 73.01%，相比 2019 年的 24.35% 大幅提升。此外，中国移动网…

亚太地区IPv6支持率超50%

4月25日，APNIC（亚太互联网络信息中心）实验室的记录显示，在所有56个APNIC经济体中，IPv6支持率30天平均值持续超50%，这是亚太地区自开始使用IPv6的25年后抵达的一个重要里程碑。

18:57 · 2025年4月26日 · 周六

Clash Verge Rev 存在提权漏洞，多平台可提权至 root/SYSTEM

2025 年 4 月 26 日，@KawaiiZapic 披露，Tauri 框架打造的跨平台代理客户端 Clash Verge Rev（最新 2.2.4‑alpha 版本）后台服务组件存在本地提权漏洞。在 macOS 和 Linux 平台上，攻击者可提升至 root 权限；在 Windows 平台上，则可获取 SYSTEM 权限。

18:03，Clash Verge 开发组表示已定位漏洞原因，正在紧急修复中。@KawaiiZapic 还建议用户采取以下临时对策：
- Windows：打开「服务管理」，禁用 clash‑verge‑service 服务
- Linux：执行 systemctl 停止并禁用 clash‑verge‑service
- macOS：在「系统设置」中关闭名为 “won fen” 的后台自启动权限

（Github issue）（X）

17:16 · 2025年4月24日 · 周四

一个小站的自留地

OpenAI 正式发布 o3 与 o4-mini OpenAI 于 2025 年 4 月 17 日凌晨正式发布了全新推理模型 o3 与 o4-mini。 o3 模型在 Codeforces、SWE-bench、MMMU 等权威测试中得分均超 2700 分，全球排名前 200，外部专家评价其「接近或达到天才水平」。不过，这一智力提升的代价是算力需求达到 o1 的十倍以上。 o4-mini 则以小巧高效著称，在 2025 年 AIME 数学竞赛中配合 Python 解释器取得 99.5% 的高分，性能全面超越…

OpenAI 图像生成模型 gpt-image-1 登陆 API

2025 年 4 月 23 日，OpenAI 最新的图像生成模型 gpt-image-1 正式通过 API 向开发者和企业开放。

该模型是一个原生多模态模型，能够理解复杂的文本指令、结合世界知识生成图片，并可按照指令调整风格、内容和细节。与 DALL-E 系列相比，gpt-image-1 在图片中准确生成清晰、可读文本的能力有显著提升，解决了以往图像中出现「乱码」的问题。

Adobe、Figma、Airtable、Gamma、HeyGen 等平台已集成该模型。在计价方面，输入文本 5 美元/百万词元，图片输入 10 美元/百万词元，图片输出 40 美元/百万词元，平均每张图片成本约 2-19 美分。所有开发者层级均可访问，但需通过 OpenAI API 实名验证。

09:14 · 2025年4月17日 · 周四

一个小站的自留地

OpenAI 发布 GPT-4.1 系列模型，支持百万 token 上下文北京时间 2025 年 4 月 15 日凌晨，OpenAI 发布 GPT-4.1 系列模型，包括 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano 三款产品。这系列模型主要有三大特点：编程能力大幅提升、指令遵循更加精准以及支持高达 100 万 token 的超长上下文。在 SWE-bench Verified 测试中，GPT-4.1 得分 54.6%，比 GPT-4o 提升 21.4 个百分点，比 GPT…

OpenAI 正式发布 o3 与 o4-mini

OpenAI 于 2025 年 4 月 17 日凌晨正式发布了全新推理模型 o3 与 o4-mini。

o3 模型在 Codeforces、SWE-bench、MMMU 等权威测试中得分均超 2700 分，全球排名前 200，外部专家评价其「接近或达到天才水平」。不过，这一智力提升的代价是算力需求达到 o1 的十倍以上。

o4-mini 则以小巧高效著称，在 2025 年 AIME 数学竞赛中配合 Python 解释器取得 99.5% 的高分，性能全面超越 o3-mini，适合高并发和成本敏感场景。

两款模型均已在 ChatGPT Plus、Pro 和 Team 用户端上线，并通过 API 向开发者开放。o3-pro 版本预计数周内发布。

（综合媒体报道）

10:33 · 2025年4月15日 · 周二

一个小站的自留地

OpenRouter 推出匿名模型 Quasar Alpha，疑似 GPT-4.5 Preview 蒸馏版本 OpenRouter 于 2025 年 4 月 4 日上线一个匿名模型 Quasar Alpha。这是一个来自某个模型实验室的基础模型 (foundation model) 的预发布版本，目前已在 OpenRouter 平台上免费提供给所有用户试用。 Quasar Alpha 拥有 100 万词元 (Token) 的上下文长度，专为编码进行了优化，同时也具备通用能力。用户报告称，尽管该模型并…

OpenAI 发布 GPT-4.1 系列模型，支持百万 token 上下文

北京时间 2025 年 4 月 15 日凌晨，OpenAI 发布 GPT-4.1 系列模型，包括 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano 三款产品。

这系列模型主要有三大特点：编程能力大幅提升、指令遵循更加精准以及支持高达 100 万 token 的超长上下文。

在 SWE-bench Verified 测试中，GPT-4.1 得分 54.6%，比 GPT-4o 提升 21.4 个百分点，比 GPT-4.5 提升 26.6 个百分点。

GPT-4.1 mini 表现超越 GPT-4o，同时较后者延迟降低近 50%，成本降低 83%。

最小型号 GPT-4.1 nano 是 OpenAI 目前速度最快、成本最低的模型，输入价格仅 0.7 元/百万 token。

GPT-4.1 系列目前仅能通过 API 使用，不会直接出现在 ChatGPT 中，但 ChatGPT 的 GPT-4o 已整合部分 GPT-4.1 功能。同时，OpenAI 宣布 GPT-4.5 Preview 将于 2025 年 7 月 14 日下线。

据传 OpenAI 还在开发类似费曼式的推理模型，能跨学科整合概念提出创新实验，甚至打算推出月费高达 14 万元的博士级研究服务。

（综合媒体报道）

14:37 · 2025年4月13日 · 周日

一个小站的自留地

微软中国区外包团队受美国数据安全新规影响被裁撤 2025 年 4 月 7 日上午，一张声称「微软停止中国区运营」的邮件截图在网络流传。该邮件称，由于地缘政治及国际业务环境变化，微软将调整全球战略布局，并于 2025 年 4 月 8 日起正式停止在中国区的运营。经钛媒体向微软内部人士求证，该邮件实为微软在中国的众多外包服务商之一——上海微创软件股份有限公司（Wicresoft）发给其内部微软项目团队的通知。邮件中提及的「停止在中国区的运营」实际上是指上海微创的微软项目团队将终止相关工作，而非微软中国（Microsoft…

Github 现已屏蔽来自中国大陆的未登录访问。已登录用户目前不受影响。

本频测试，在不开启代理的情况下，仍然能打开登录页面，但是有几率登录失败。

（Github Discussion）
——————
4月14日更新：

根据 GitHub 官方状态页面发布的信息，由于一项配置变更产生了意外影响，未登录状态下尝试从中国访问 GitHub.com 的用户在过去一天内暂时无法访问该网站。

该事件于北京时间 2025 年 4 月 13 日凌晨 4:01 开始，直到当天晚上 22:55 才得到缓解，影响持续了近 19 个小时。

GitHub 官方表示，此次事件仅影响未登录用户，已登录的用户在此期间仍能正常访问平台服务。GitHub 在其官方状态页面上发布了回溯性报告，确认「导致此影响的配置变更已被撤销，用户在尝试访问 GitHub.com 时应不再遇到问题。」

（Github）

23:27 · 2025年4月9日 · 周三

一个小站的自留地

谷歌发布 Gemini 2.5 Pro 实验模型谷歌称， Gemini 2.5是其最新的AI模型，具备推理能力，能够处理复杂问题，首次发布的实验版本Gemini 2.5 Pro在多个基准测试中表现优异，位列LMArena排行榜第一。 Gemini 2.5 Pro支持1百万个令牌的上下文窗口，能够处理来自文本、音频、图像和视频的复杂数据，提升了对多种信息源的理解能力。该模型在编码方面取得了显著进步，能够创建视觉吸引力强的网页应用和代码转换，SWE-Bench Verified测试中得分为63.8%。…

谷歌即将推出 Gemini 2.5 Flash

在 Google Cloud Next '25 活动上，Google 发布了其 Gemini AI 模型家族的新成员 Gemini 2.5 Flash。该模型被定位为「主力（workhorse）」模型，特别针对低延迟和成本效益进行了优化，旨在满足高容量、实时应用场景的需求。

Gemini 2.5 Flash 的一个关键特性是其动态可控的计算能力，模型能根据提示的复杂性调整其「思考预算」或推理深度，从而在速度、准确性和成本之间取得平衡。

该模型将很快通过 Google Cloud 的 Vertex AI 平台提供。

(Google Cloud Blog)

23:13 · 2025年4月9日 · 周三

一个小站的自留地

阿里 Qwen 首个推理模型发布，擅长数学和编程，将推出独立应用阿里通义 Qwen 团队于 2 月 25 日在其网页版对话平台上推出了首个推理模型——深度思考 (QwQ)。该模型由 QwQ-Max-Preview 支持，基于 Qwen2.5-Max 构建，在数学理解、编程、AI 智能体等领域表现优异。在 LiveCodeBench 编程测试中，QwQ-Max-Preview 预览版排名第 5，超过了 OpenAI 的 o1 中档推理版本和 DeepSeek-R1 预览版。 QwQ 具有类似 Claude…

据媒体报道，阿里最快将于本月中旬发布旗舰模型的升级版，大概率是 Qwen 3。

12:35 · 2025年4月8日 · 周二

一个小站的自留地

Open AI 更新了 GPT-4o 的图像生成功能，现在 GPT-4o 可以利用其多模态能力和上下文信息生成高质量图像。这一功能无论是文字渲染还是风格控制上，都已达到图片生成的第一梯队。这一功能最早于 26 日凌晨面向 Pro 用户可用，正逐步向 Plus 用户开放。

OpenRouter 推出匿名模型 Quasar Alpha，疑似 GPT-4.5 Preview 蒸馏版本

OpenRouter 于 2025 年 4 月 4 日上线一个匿名模型 Quasar Alpha。这是一个来自某个模型实验室的基础模型 (foundation model) 的预发布版本，目前已在 OpenRouter 平台上免费提供给所有用户试用。

Quasar Alpha 拥有 100 万词元 (Token) 的上下文长度，专为编码进行了优化，同时也具备通用能力。用户报告称，尽管该模型并非主要设计为推理模型，但其在数学推理和竞技编程方面表现出色，并支持图像识别功能。根据 Aider 多语言编码基准测试，其得分率为 55%，与 DeepSeek V3 和 Claude 3.5 Sonnet 相当。

所有提交给 Quasar Alpha 的提示 (prompt) 和生成内容都将被 OpenRouter 及模型提供方记录，用于理解模型使用情况并进行改进。

关于 Quasar Alpha 的开发者身份，尽管官方保持沉默，但大量技术证据指向了 OpenAI。分析发现，该模型的 API 响应中包含 OpenAI 特有的「chatcmpl-」前缀，工具调用 ID 格式也与 OpenAI 完全一致，而与其他主要 AI 开发商 (如 Google、Mistral) 不同。此外，Quasar Alpha 分词器 (tokenizer) 中一个独特的中文响应错误，与 OpenAI 分词器系统已知的问题高度相似。AI 研究员 Sam Paech 使用生物信息学聚类工具进行的分析也显示，Quasar Alpha 在模型家族树中与 GPT-4.5 Preview 最为接近。

(OpenRouter, Reddit)

14:20 · 2025年4月7日 · 周一

微软中国区外包团队受美国数据安全新规影响被裁撤

2025 年 4 月 7 日上午，一张声称「微软停止中国区运营」的邮件截图在网络流传。该邮件称，由于地缘政治及国际业务环境变化，微软将调整全球战略布局，并于 2025 年 4 月 8 日起正式停止在中国区的运营。

经钛媒体向微软内部人士求证，该邮件实为微软在中国的众多外包服务商之一——上海微创软件股份有限公司（Wicresoft）发给其内部微软项目团队的通知。邮件中提及的「停止在中国区的运营」实际上是指上海微创的微软项目团队将终止相关工作，而非微软中国（Microsoft China）停止运营。上海微创软件股份有限公司是一家全球数字化转型服务商，于 2002 年由微软与上海市政府共同创办。

此次上海微创微软项目团队的终止，与美国拜登政府于 2024 年 2 月 28 日签署并要求美国司法部制定具体规则的第 14117 号行政令 (Executive Order 14117, Preventing Access to Americans' Bulk Sensitive Personal Data and United States Government-Related Data by Countries of Concern) 有关。该行政令及其最终规则旨在阻止包括中国（含香港和澳门特别行政区）、俄罗斯、伊朗、朝鲜、古巴和委内瑞拉在内的「受关注国家 (Countries of Concern)」以及相关「受涵盖人员 (Covered Persons)」访问美国人的「批量敏感个人数据 (Bulk U.S. Sensitive Personal Data)」和「美国政府相关数据 (United States Government-related Data)」。

根据 EO 14117 的最终规则，自 2025 年 4 月 8 日起，位于受关注国家（包括中国大陆）的个人（包括美国公司的员工以及外包团队成员）将被限制访问特定类型的美国敏感个人数据和政府相关数据，特别是托管在北美的数据中心的数据。这项限制将在 2025 年 10 月 6 日进一步扩展至全球范围，即身在中国大陆的人员将不能访问其他地区的部分数据（内部业务、工具类等不包含个人、用户信息的数据除外）。

（综合媒体报道）

08:57 · 2025年4月6日 · 周日

一个小站的自留地

Meta 将于2025年4月29日举办LlamaCon大会。据悉，Llama 4 届时将会发布。（AGI Hunt）

Meta 开源 Llama 4 系列模型，首次采用 MoE 架构并支持千万级上下文

Meta 于 2025 年 4 月 5 日发布并开源了其最新的 Llama 4 系列人工智能模型，标志着 Llama 系列首次采用混合专家 (Mixture of Experts, MoE) 架构并原生支持多模态能力。此次发布了 Llama 4 Scout 和 Llama 4 Maverick 两款模型，同时预告了更大规模的 Llama 4 Behemoth 模型。

Llama 4 Scout 是一款拥有 16 个专家、170 亿激活参数 (总参数约 1090 亿) 的 MoE 模型。其 Int4 量化版本可在单张 NVIDIA H100 GPU 上运行。该模型最大的亮点之一是支持业界领先的 1000 万词元 (token) 上下文窗口。
Llama 4 Maverick 同样拥有 170 亿激活参数，但配备了 128 个专家，总参数量达到 4000 亿。
这两款模型均通过知识蒸馏自 Llama 4 Behemoth，后者是一个拥有 16 个专家、2880 亿激活参数、总参数量近 2 万亿的教师模型，目前仍在训练中。

Llama 4 系列采用了多项新技术，包括 MoE 架构、通过早期融合实现的原生多模态、改进的基于 MetaCLIP 的视觉编码器、名为 MetaP 的超参数设置技术、FP8 精度训练、通过中期训练扩展上下文长度以及名为 iRoPE 的长上下文架构。后训练流程也经过改进，采用轻量级监督微调 (SFT) > 在线强化学习 (RL) > 轻量级直接偏好优化 (DPO) 的策略。模型在超过 30 万亿词元 (token) 的多样化文本、图像和视频数据集上进行了预训练，涵盖 200 种语言。

Llama 4 Scout 和 Llama 4 Maverick 模型目前已在 llama.com 和 Hugging Face 开放下载。

(Meta AI Blog)

——————

Llama 4 发布后，互联网普遍表示失望。有自称 Llama 团队内部人士透露，Llama 项目倾尽了团队的所有资源，但仍然未能达到 SOTA，因此团队选择将其所有语料投入后训练中，目前看来仍然收效甚微。该网友表示，Llama 4 将成为自己「简历上的污点」。
与此同时，网友体验大多负面，认为 Llama 的体积与其性能严重错配，甚至不如体积小得多的 Qwen 模型。

10:24 · 2025年4月3日 · 周四

一个小站的自留地

腾讯云广州地域服务出现大面积故障，历时近 4 小时 2025 年 4 月 2 日下午，腾讯云广州地域及部分非区域性服务出现大面积网络异常，导致云服务器、容器服务、数据库、腾讯会议等多项核心服务无法正常使用，影响持续近 4 小时。腾讯云于当日 15 时 50 分首次确认故障，表示已启动应急预案并着手进行问题排查。根据官方健康看板显示，本次受影响的产品涵盖云服务器、云硬盘、容器服务、各类数据库服务、负载均衡、私有网络、实时音视频、云直播、腾讯会议等数十项关键服务。在故障期间，腾讯会议官方微博于 15…

腾讯云对昨日腾讯会议的故障发布了简短说明。

说明说，4月2日15时50分，腾讯会议由于存储系统的网络变更导致网络访问规则配置异常，进而影响存储系统的访问，发生腾讯会议运行故障，造成腾讯会议登录、预定会议、加入会议等功能受限，期间也收到客户侧的咨询投诉。经采取对网络访问规则进行恢复并优化的应急处置措施，业务已全部恢复。

说明还指，腾讯云会在其后发布事故的详细复盘。本频会随后将复盘结果更新在本条消息中。

10:21 · 2025年4月3日 · 周四

字节旗下图像生成模型即梦 3.0 开始灰度测试

字节旗下即梦 AI 于 4 月 2 日开始灰度测试其 3.0 版本图像生成模型，预计将于 4 月 7 日全量上线。已经获得灰度测试权限的自媒体表示，新版本在中文文字表现上取得重大突破。

即梦 3.0 最突出的改进在于中文文字控制能力，不仅将大字的准确性、设计感和丰富度提升至新高度，同时解决了小字的稳定性问题。模型现可直出 2K 高清图像（16:9 分辨率达 2560×1440），远超同类产品，画面质感显著增强。

据自媒体测试，即梦 3.0 在电商产品图、摄影写真图、电影海报和艺术文字图等方面均有明显提升。

（数字生命卡兹克）

Before

After

Home

个人博客

讨论组