一个小站的自留地

起于小站，终于生活。
现实之外，一个普通人的思考。

博客地址：ygxz.in
讨论组：https://t.me/ygxz_group

一个小站的自留地

OpenAI 发布了 GPT-5.5 及 GPT-5.5 Pro。在性能方面，GPT-5.5 在现实服务中保持了与 GPT-5.4 相同的单词元 (Token) 延迟，但智能水平大幅提升，且完成相同 Codex 任务所需的词元数量显著减少。该模型在智能体编程、计算机操作、知识工作和早期科学研究领域的提升尤为明显。在 Terminal-Bench 2.0 测试中，GPT-5.5 取得了 82.7% 的准确率；在 SWE-Bench Pro 测试中达到 58.6%。此外，GPT-5.5 还在 GeneBench…

OpenAI 开启 GPT-5.6 系列模型早期预览

6 月 26 日，OpenAI 宣布开启新一代模型 GPT-5.6 系列的有限预览。该系列采用了全新的命名体系，包含三款模型：旗舰模型 Sol、日常办公均衡模型 Terra 以及主打快速低价的 Luna。其中 Terra 的性能可媲美 GPT-5.5，但成本降低了一半。

GPT-5.6 Sol 在代码编写、生物学和网络安全等需要长期规划的任务中展现出更强的能力。根据 OpenAI 的准备框架，旗舰模型 Sol、均衡模型 Terra 和低成本模型 Luna 在网络安全以及生物和化学风险类别中均被评定为「高」级别，但在人工智能自我提升能力方面尚未达到该阈值。OpenAI 为此引入了全新的 max 推理模式以为模型提供更深度的思考时间，同时推出了 ultra 模式，该模式可通过调用多个子代理来加速处理复杂工作。在 Terminal-Bench 2.1 等基准测试中，Sol 创下了新的行业纪录。

测试发现，GPT-5.6 Sol 的思维链可控性高于前代模型，意味着它能更好地遵循有关如何思考的内部指令，但也增加了模型主动混淆或隐藏真实推理过程的潜在风险。此外，模型在部分评估中表现出明显的「元游戏」特征，即主动推理并猜测评估机制本身，而非单纯解决当前问题。

伴随能力提升，GPT-5.6 配备了 OpenAI 迄今最严格的分层安全防护栈。评估显示，尽管模型能够识别漏洞并提供漏洞利用的构建模块，但在测试条件下不会自主生成功能完整的全链条漏洞利用程序。

定价方面，按每百万词元计算，Sol 的输入为 5 美元，输出为 30 美元；Terra 的输入为 2.50 美元，输出为 15 美元；Luna 的输入为 1 美元，输出为 6 美元。新模型还引入了更可预测的提示词缓存机制，支持显式缓存断点和最低 30 分钟的缓存寿命，缓存写入按未缓存费率的 1.25 倍计费，读取则享受 90% 的折扣。

GPT-5.6 模型目前仅通过应用程序编程接口和 Codex 优先向少量受政府知悉的受信任合作伙伴开放。今年 7 月，OpenAI 将在 Cerebras 平台上推出处理速度高达每秒 750 个词元的 GPT-5.6 Sol。在未来几周内，该系列模型将逐步面向 ChatGPT 广泛发布。

（OpenAI）

5 天前

我们正在构建你想要的 LLM 网关。

CCH Plus 使用 Golang 重写整个后端，为高负载和高可用场景设计，并补全 CCH 缺失的商业功能和并发能力；预计将以 AGPL 许可证免费开源，继续回馈社区，并接受来自社区的建议和贡献。

CCH Plus 不是一款用来“收割”社区的产品。在 AGPL 许可证允许的范围内，任何人都可以免费部署、使用、分发 CCH Plus，也可以使用它进行生产部署或盈利性活动。我们始终坚信，开放与包容是开源社区的根基，只有借助开源社区的力量， CCH Plus 才能够获得持续的成长、为社区带来更多好用的功能，成为可信赖的 LLM 网关。

CCH Plus 的产品规划将会广泛吸收来自社区的呼声和建议。我们不希望闭门造车，因为我们是在和社区一起构建下一代 LLM 网关。

——————

CCHP 致力于成为体验优先的全功能 LLM 网关，预计将于今年秋天正式公测。在正式发布前，通过下面的链接关注最新项目进展和官方演示 ⬇️

x.com

14:43 · 2026年6月13日 · 周六

一个小站的自留地

Anthropic 因美国政府指令暂停 Fable 5 和 Mythos 5 模型服务根据美国政府出于国家安全考虑下发的出口管制指令，Anthropic 宣布暂停所有用户对 Claude Fable 5 和 Mythos 5 模型的访问。这项针对非美国公民的限制要求迫使 Anthropic 切断了这两款模型的全网访问以确保合规，但其旗下 Opus 4.8 等其他 Claude 模型的运作均不受影响，平台已为受阻用户重置了速率限制。据 Anthropic 披露，该指令于当地时间 17 时 21 分（…

在一些前沿模型突然变得不可用的时刻，我们选择相信另一条路：前沿智能不应只属于少数人，也不应被少数规则随时收回。它应该开放、可用、可构建，并服务于每一位开发者。
GLM-5.2 是智谱迄今能力最强的开源模型，支持真正可用的 1M 上下文，并在长程任务中继续保持领先。它也依旧是我们心中最强的国产 Coding 模型。
今晚 5:21，GLM-5.2 将面向 GLM Coding Plan 全量用户开放，覆盖 Lite / Pro / Max / 团队版。
GLM-5.2 API 将于下周上线，模型下周正式开源，遵循 MIT 协议。

（智谱）

12:45 · 2026年6月13日 · 周六

一个小站的自留地

Anthropic 发布 Claude Fable 5 Claude Fable 5 是 Anthropic 最新的旗舰模型，全新模型家族 Fable 脱胎于 Mythos，是 Anthropic 迄今为止最智能的模型。该模型现已于 Claude Code 2.1.170 及各平台中可用。 Claude Fable 5 定价为输入 10 $/M Token，输出 50$/M Token。 6.22 前，Claude Fable 5 使用量包含在付费计划中，此后需按量付费。与此同时，市场预计智谱很快会发布…

Anthropic 因美国政府指令暂停 Fable 5 和 Mythos 5 模型服务

根据美国政府出于国家安全考虑下发的出口管制指令，Anthropic 宣布暂停所有用户对 Claude Fable 5 和 Mythos 5 模型的访问。这项针对非美国公民的限制要求迫使 Anthropic 切断了这两款模型的全网访问以确保合规，但其旗下 Opus 4.8 等其他 Claude 模型的运作均不受影响，平台已为受阻用户重置了速率限制。

据 Anthropic 披露，该指令于当地时间 17 时 21 分（美国东部时间）下发，原因为政府担忧一种被发现的 Fable 5 越狱（Jailbreak）绕过手段。对此 Anthropic 解释称，该手段仅能暴露极少数轻微且已知的漏洞，同级别的 OpenAI 竞品（如 GPT-5.5）亦能复现类似程度的能力。Anthropic 已采取深度防御策略且有 30 天数据保留政策追踪滥用行为，公司不赞同因发现局部漏洞而直接召回已服务海量用户的商业模型，认为这是监管上的技术误解，并将设法让有关模型早日重新上线。

（Anthropic）

01:10 · 2026年6月10日 · 周三

一个小站的自留地

Anthropic 发布 Claude Opus 4.8 Anthropic 宣布将 Claude Opus 升级至 4.8 版本。新版本在各项基准测试中均有显著提升，并能更高效地进行协同工作。Claude Opus 4.8 现已全面上线，常规使用价格与上一代保持一致。在网页端应用 claude.ai 及 Cowork 中，用户现在可以通过思考力度控制 (Effort control) 功能自主调节 Claude 执行任务时投入的精力。面向开发场景，Claude Code 新增了动态工作流 (Dynamic…

Anthropic 发布 Claude Fable 5

Claude Fable 5 是 Anthropic 最新的旗舰模型，全新模型家族 Fable 脱胎于 Mythos，是 Anthropic 迄今为止最智能的模型。该模型现已于 Claude Code 2.1.170 及各平台中可用。

Claude Fable 5 定价为输入 10 $/M Token，输出 50$/M Token。

6.22 前，Claude Fable 5 使用量包含在付费计划中，此后需按量付费。

与此同时，市场预计智谱很快会发布 GLM 5.2。

01:07 · 2026年6月9日 · 周二

一个小站的自留地

Apple 宣布今年的全球开发者大会（WWDC）将于北京时间 6 月 10 日凌晨 1 点正式开幕。据爱范儿，今年 WWDC 主题演讲的重点将放在苹果软件生态的更新上，包括 iPhone 操作系统 iOS 19 在内的多套操作系统将迎来新的接近于 visionOS的视觉风格，以及大量的交互和功能升级。

苹果 WWDC26 开幕演讲发布一系列新系统

Apple 年度全球开发者大会（WWDC26）开幕。在主题演讲中，Apple 发布了 iOS 27、iPadOS 27 及新版 macOS 等操作系统更新，带来设计、性能与基础体验的多项改进。

设计语言 Liquid Glass 获得升级。新增了可调节通透度和色调的滑块，macOS 的窗口圆角半径减小，且应用程序图标融入了多层折射效果。在性能表现上，系统响应速度显著提升，iPhone 和 iPad 的应用启动速度最高提升 30%，新照片加载速度提升 70%，隔空投送 (AirDrop) 传输速度提升 80%。得益于 CPU调度器的算法优化，iOS 27 将继续兼容包括 iPhone 11 在内的所有运行 iOS 26 的旧款机型。此外，系统重构了聚焦 (Spotlight)、照片和邮件应用的搜索索引架构，并优化了无线局域网 (Wi-Fi) 与蜂窝网络之间的切换逻辑。

更为严密的儿童安全与家长控制功能。Apple 与美国儿科学会合作，引入了基于年龄定制的防范机制。家长可以利用全新的「时间额度」功能限制孩子在娱乐、游戏和社交媒体上的设备使用时长，未满 13 岁的儿童账户将默认限制使用社交媒体。

Apple 与 Google 达成深度合作，共同打造新一代 Apple 智能。作为 Apple 智能的核心体现，Apple 在 WWDC26 上正式推出了全面重构的 Siri AI。新版 Siri 拥有屏幕感知与执行跨应用操作 (App Actions) 的能力，能根据用户屏幕上的内容和个人情境提供智能化操作。Siri AI 显著增强了对话能力，支持自然的来回连续交互，并新增了可回看历史对话的专属 Siri 应用。此外，Siri AI 还集成了系统级写作与自动校对工具，并在各个平台提供视觉智能功能，如在 iPhone 上可通过相机识别食物营养成分或扫描账单分摊费用，在 macOS 上则整合进了 Spotlight 聚焦功能和右键关联菜单。Siri AI 将率先以英语推出，并在今年晚些时候发布 Beta 版，但在中国大陆和欧盟地区暂不提供。

在开发者生态方面，Apple 推出了全新工具与平台技术。全新的 Core AI 框架允许开发者更轻松地将第三方模型引入 Apple 芯片本机运行，同时可通过 Swift API 和 App Intents 框架将应用内容接入 Siri 搜索及操作。开发工具 Xcode 的编程助理现已支持应用本地化以及与模拟设备交互，不仅能够连接 Figma 和 GitHub，还支持接入 Gemini 模型。此外，全新的 Device Hub 整合了所有模拟与实体设备的测试界面，支持模拟多点触控操作并能动态调整应用大小，以便开发者进行快速迭代。

23:31 · 2026年6月4日 · 周四

一个小站的自留地

Rolldown 1.0 正式发布基于 Rust 编写的高性能 JavaScript 打包工具 Rolldown 正式发布 1.0 稳定版，标志着其 API 已经稳定并可用于生产环境。从 Vite 8 开始，Rolldown 已经成为 Vite 默认的底层打包工具，直接惠及广大 Vite 用户。 Rolldown 的核心目标之一是统一 Vite 之前的双打包工具架构。它结合了现有工具的优势，不仅提供了媲美 esbuild 的打包速度，在项目规模增大时甚至比 Rollup 快 10 到 30 倍，而且保持了对…

VoidZero 加入 Cloudflare

Vue 和 Vite 的作者 Evan You 宣布，VoidZero 团队将整体加入 Cloudflare。

包括 Vite、Vitest、Rolldown、Oxc 和 Vite+ 在内的所有核心项目将继续保持开源，并沿用 MIT 许可证。尤雨溪及 VoidZero 团队将继续领导这些项目，并获得 Cloudflare 的全力支持。

（VoidZero)

16:55 · 2026年6月1日 · 周一

一个小站的自留地

英伟达 COMPUTEX 2025 主题演讲要点总结 NVIDIA 创始人兼 CEO 黄仁勋 19 日在 Computex 2025 发表主题演讲。黄仁勋强调，AI 已成为继电力和互联网之后的新一代基础资源，NVIDIA 正致力于打造「AI 工厂」。他在演讲中提出「The more you buy, the more you make」的理念，认为 AI 算力将成为驱动各行各业创新和增长的核心引擎。黄仁勋宣布，NVIDIA 将与富士康、台积电等台湾伙伴合作，在台建设首个大型 AI 超级计算机，还…

NVIDIA GTC 2026 速览：发布专为智能体打造的 RTX Spark 芯片与 Vera 处理器

2026 年 6 月 1 日，英伟达 ( NVIDIA ) 创始人兼首席执行官 Jensen Huang 在台北 GTC 大会上发表演讲，宣布有用（Useful） AI 和智能体 ( Agent ) 时代全面到来，并发布了涵盖个人电脑、数据中心和物理 AI 领域的全新硬件与软件生态。

在个人计算领域，英伟达联合微软 ( Microsoft ) 与联发科 ( MediaTek ) 推出了基于 Arm 架构的超级芯片 RTX Spark。该芯片采用台积电 3 纳米工艺，集成拥有 6144 个 CUDA 核心的 Blackwell RTX GPU 和定制的 20 核处理器，最高支持 128GB 统一内存，提供 1 Petaflop 的 AI 算力。RTX Spark 旨在重塑运行了四十年的 PC 形态，使终端设备能够脱离云端，在本地安全运行 AI 智能体。首批搭载该芯片的 Windows PC 涵盖轻薄笔记本、桌面端以及拥有 768GB 内存的 DGX Station 工作站，Adobe 等专业创作应用已原生适配并实现最高 2 倍的 AI 处理加速。

在数据中心方面，专为智能体打造的 Vera CPU 正式亮相。英伟达指出，传统处理器为人类交互设计，而智能体对响应延迟有更严苛的要求。Vera CPU 具备单核每时钟周期执行 10 条指令的能力，采用 PCIe Gen 6 标准并提供 1.2TB/s 的 LPDDR5X 带宽。与传统 x86 处理器相比，其 SQL 处理速度和实时流处理速度分别提升至 3 倍和 6 倍。同时，Vera Rubin AI 超级计算机已全面投入量产，系统采用无电缆、无风扇的全液冷设计，将单个机架的组装时间从两小时大幅缩短至五分钟。

软件与生态层面，英伟达推出了企业级 AI 工具包，包含 5500 亿参数的开源大语言模型 Nemotron 3 Ultra 以及开源安全运行时 OpenShell。此外，面向机器人与自动驾驶领域，英伟达发布了物理 AI 基础模型 Cosmos 3、自动驾驶模型 Alpamayo 2 Super 以及 Isaac GR00T 人形机器人参考设计平台。

（综合媒体报道）

16:44 · 2026年6月1日 · 周一

一个小站的自留地

MiniMax 发布 MiniMax M2.7 MiniMax 正式发布 M2.7 模型。这是 MiniMax 首个深度参与迭代自身的模型，标志着其开启了模型和组织的自我进化。 M2.7 能够自行构建复杂的智能体脚手架 (Agent Harness) ，并基于多智能体协作 (Agent Teams) 、复杂技能 (Skills) 以及工具搜索工具 (Tool Search Tool) 等能力，完成高度复杂的生产力任务。在涵盖多种编程语言的 SWE-Pro 基准测试中，M2.7 取得了 56.22%…

MiniMax 发布 MiniMax M3

MiniMax 正式发布 MiniMax M3。官方表示，该模型在编程和智能体任务上达到了前沿的能力水平，具备 100 万词元 (Token) 的超长上下文窗口，并原生支持多模态功能，旨在通过单一模型满足用户的全面需求。

根据官方公布的基准测试图表，MiniMax M3 在 SWE Bench Pro、Terminal Bench 2.1、VIBE V2、SVG-Bench 以及 KernelBench Hard 等多项严格的编程与开发环境测试中，与 GPT 5.5、Opus 4.7 和 Gemini 3.1 Pro 等同期前沿模型进行了对比，并展现出同级别的竞争力。此外，在 BrowseComp、MCP Atlas 和 OSWorld-verified 等涉及浏览器操作、工具调用及操作系统级智能体任务的评测中，MiniMax M3 也取得了出色的成绩。

发布首 7 日内，通过官方 API 平台调用可获得 5 折优惠。

（MiniMax）

Before

After