一个小站的自留地

起于小站，终于生活。
现实之外，一个普通人的思考。

博客地址：ygxz.in
讨论组：https://t.me/ygxz_group

09:44 · 2024年12月28日 · 周六

一个小站的自留地

OpenAI 高层地震：多名元老离职，马斯克再度起诉近日，OpenAI 迎来一系列重大人事变动。多位关键高管相继宣布离职，其中包括： - 联合创始人 John Schulman 离职，加入竞争对手 Anthropic。 - 公司总裁 Greg Brockman 开始长期休假。 - 产品负责人 Peter Deng 离职。这一连串人事变动引发了外界对 OpenAI 管理层稳定性的担忧。据 The Information 报道，这可能是去年 11 月「宫斗大戏」的余波。与此同时，特斯拉 CEO 埃隆·马斯克…

OpenAI 调整组织结构：成立公共利益公司，加强非营利部门

2024 年 12 月 27 日，OpenAI 发布博客宣布，其董事会正在评估公司结构，以确保通用人工智能 (Artificial General Intelligence, AGI) 能够造福全人类。OpenAI 计划通过调整其营利与非营利结构，进一步推动其使命的实现。

OpenAI 成立于 2015 年，最初是一个非营利研究实验室，致力于推动数字智能的发展，不受资金回报需求的限制。随着人工智能 (Artificial Intelligence, AI) 技术的进步，尤其是大语言模型 (Large Language Model, LLM) 的发展，OpenAI 意识到需要更多的计算资源和资本来继续其使命。因此，2019 年 OpenAI 成立了一个营利性公司，由非营利组织控制，旨在通过营利性公司的成功来支持非营利组织的长期发展。

OpenAI 的董事会提出了三个主要目标：

一是选择最适合长期使命的非营利/营利结构，计划将其现有的营利性公司转变为特拉华州公共利益公司 (Public Benefit Corporation, PBC)，以平衡股东利益、利益相关者利益和公共利益；

二是确保非营利组织的可持续发展，通过营利性公司的成功，非营利组织将获得更多的资源，成为历史上资源最丰富的非营利组织之一；

三是让每个部门各司其职，PBC 将负责 OpenAI 的运营和业务，而非营利组织将专注于医疗、教育和科学等慈善事业。

OpenAI 计划在 2025 年进一步转型，成为一家可持续的企业。通过将营利性公司转变为 PBC，OpenAI 将能够以常规条款筹集更多资本，同时确保非营利组织获得充足的资源。PBC 将负责 OpenAI 的运营，而非营利组织将专注于慈善事业。

部分网友对 OpenAI 的营利性转变表示质疑，认为这可能与其最初的「非营利」初衷相悖。此外，OpenAI 的创始人之一 Elon Musk 曾因公司转向营利性而提起诉讼，进一步加剧了外界的质疑。

（OpenAI）

11:45 · 2024年12月27日 · 周五

一个小站的自留地

OpenAI 发布大规模服务中断复盘当地时间 2024 年 12 月 11 日，OpenAI 遭遇了一次严重的全平台服务中断事件。本次事件起因于一个新的遥测服务部署，意外导致了 Kubernetes 控制平面崩溃，进而引发了全系统性的服务降级。事件发生在当地时间下午 3 时 16 分，直至晚间 7 时 38 分才完全恢复。本次事件的主要原因在于一个新部署的遥测服务配置错误，导致集群中每个节点都执行了大量资源密集型的 Kubernetes API 操作。由于这些操作的开销随集群规模增长，最终使得 Kubernetes…

ChatGPT、API 和 Sora 服务中断，疑因微软数据中心电力故障

当地时间 2024 年 12 月 26 日下午，OpenAI 的 ChatGPT、API 和 Sora 服务出现大面积中断，影响了全球用户。此次中断报告于美国东部时间下午 1:30 左右开始激增，用户无法正常访问或使用这些服务。Downdetector.com 上报告了超过 50,000 起 ChatGPT 服务中断事件，用户尝试使用 ChatGPT 时收到「内部服务器错误」的消息。

OpenAI 在美国东部时间下午 4:05 发布更新，表示正在修复问题，问题由一个未具名的互联网服务提供商引起。截至美国东部时间下午 7:05，ChatGPT 正在恢复，但聊天记录仍未加载，API 和 Sora 已恢复运行。OpenAI 于太平洋标准时间下午 6:04 更新称，ChatGPT 已基本恢复，他们将继续致力于全面修复。

故障原因可能与微软 Azure 数据中心有关。作为 OpenAI 的独家云服务提供商，微软 Azure 当天报告了数据中心出现「电源」问题，这可能是导致 OpenAI 服务中断的原因。The Verge 报道称，南美中部数据中心出现电力故障，影响了多项服务。

这是 ChatGPT 本月第二次中断，此前两周曾发生过一次约 6 小时的中断。

（综合媒体报道）

19:25 · 2024年12月26日 · 周四

一个小站的自留地

DeepSeek-R1-Lite 预览版上线 DeepSeek 发布了R1系列推理模型，使用强化学习训练，推理过程包含大量反思和验证，思维链长度可达数万字。该系列模型在数学、代码以及各种复杂逻辑推理任务上，取得了媲美 o1-preview 的推理效果，并为用户展现了 o1 没有公开的完整思考过程。该模型目前可以仅在网页版使用，DeepSeek 方面表示，之后，正式版 DeepSeek-R1 模型将完全开源，DeepSeek 也将公开技术报告，并部署 API 服务。（DeepSeek）

DeepSeek V3 开源发布，全部权重免费可商用

2024 年 12 月 26 日，DeepSeek AI 正式发布新一代混合专家模型 DeepSeek V3。该模型已在官网 chat.deepseek.com 上线，API 服务同步更新且接口配置无需改动。

DeepSeek V3 采用了混合专家 (MoE) 架构，总参数量达 671B，其中每个词元激活 37B 参数。在预训练阶段共消耗超过 14.8 万亿高质量词元。在三重评测中，该模型展现了强大实力：在美国数学竞赛和全国高中数学联赛上超越所有已知模型；在算法类代码场景远超其他普通模型；特别是在知识类评测上，DeepSeek V3 已经接近目前最强的 Claude-3.5-Sonnet-1022。

DeepSeek V3 在教育知识评测 MMLU 上达到 88.5，显著超越其他开源模型；在代码竞赛基准 Codeforces 上位列前 51.6%，大幅领先业内表现；在数学能力评测 MATH-500 上取得 90.2 的成绩，创下了非 o1 类语言模型的新记录。特别值得一提的是，该模型在 AlpacaEval 2.0 上获得 70.0 的成绩，这一指标是评估模型开放式对话能力的重要标准。

——————

DeepSeek V3 采用了一种无需额外损失函数的负载均衡策略，并设置了多次词元预测的训练目标。这两项创新分别解决了混合专家模型中的两大难题：负载均衡与推理速度。

在工程实现层面，DeepSeek V3 首次在超大规模模型上验证了 FP8 混合精度训练的可行性，并通过算法、框架和硬件的协同设计，几乎完全消除了跨节点通信的额外开销。

在部署方面，DeepSeek V3 原生采用 FP8 训练并开源权重。目前 SGLang 和 LMDeploy 已支持原生 FP8 推理，TensorRT-LLM 和 MindIE 则支持 BF16 推理。开发者可通过 Hugging Face 获取模型权重和部署工具。

价格方面，从即日起至 2025 年 2 月 8 日，API 服务将维持优惠价格：每百万输入词元 0.1 元（缓存命中）或 1 元（缓存未命中），每百万输出词元 2 元。优惠期结束后，价格将调整为每百万输入词元 0.5 元（缓存命中）或 2 元（缓存未命中），每百万输出词元 8 元。除了 API 服务外，DeepSeek V3 还提供了完整的开源授权，支持商业化应用。

（综合 DeepSeek AI 官方微信公众号，DeepSeek V3 技术报告，GitHub Page）

20:52 · 2024年12月21日 · 周六

小红书悄然推出「点点」AI 搜索产品

今年 6 月，小红书曾推出 AI 功能「达芬奇」，以一种试验性方式上线。但「达芬奇」自 7 月后再无更新，仿佛被遗忘。然而，小红书日前推出了一款新 AI 搜索产品——「点点」，已上线各大应用商店。

「点点」专注于生活场景搜索，由上海生动诗章科技有限公司开发，法人为小红书产品经理魏旷，其主要功能包括：定位用户位置，推送相关旅游、美食信息；根据需求总结全网信息，尤其是小红书内容；用户可拍照提问，获取视频回复。

此外，小红书正在其平台内小范围测试新功能「问『点点』」，用户可在搜索栏中直接跳转至「点点」获取 AI 生成的答案。这表明小红书正在逐步将 AI 功能巧妙地融入到现有内容生态中，以增强用户体验，而非颠覆，从而潜移默化地引导用户适应 AI 的辅助作用。小红书似乎正小心翼翼地增强其平台功能，确保用户逐渐接受 AI 增强的内容创作和搜索体验。

（特工宇宙）

02:09 · 2024年12月21日 · 周六

一个小站的自留地

OpenAI 12 天连更的第四天，ChatGPT Canvas 现支持直接运行 Python 代码，也支持在 GPTs 内使用 Canvas。 —————— 在本次直播中，OpenAI 研究员 Karina Nguyen 展示的新功能界面中出现了ChatGPT ε（第五个希腊字母，读作Epsilon）。网友猜测，这极可能就是之前被传出的下一代模型「猎户座 Orion」。这一模型将有可能在本次 OpenAI 12 天连更中亮相。媒体此前报道，由于训练「猎户座」使用了先前模型（GPT-4和o1）生成…

OpenAI 发布新一代推理模型 o3

OpenAI 于 12 月 21 日发布了新一代推理引擎 o3 及其轻量版 o3-mini。新模型在数学、编程等多个领域展现出惊人的能力提升，但也因其高昂的计算成本引发关注。

o3 在编程能力上取得重大突破。在著名编程竞赛平台 CodeForces 上获得 2727 分，位列全球第 175 名，超过了 OpenAI 首席科学家 2665 分的历史最高分。在软件工程基准 SWE-bench Verified 测试中，o3 准确率达到 71.7%，比前代 o1 模型高出约 20 个百分点。

在数学领域，o3 在美国数学竞赛 AIME 2024 中取得 96.7% 的准确率，仅错一题。在由 60 多位顶尖数学家共同开发的 Frontier Math 基准测试中，o3 解决了 25.2% 的问题，远超此前其他模型不足 2% 的表现。OpenAI 研究副总裁 Mark Chen 表示，即使专业数学家解决其中一道题目也需要数小时到数天时间。

值得关注的是，o3 在 ARC-AGI 基准测试中首次超越人类水平。在高计算资源配置下，o3 达到 87.5% 的准确率，超过了人类 85% 的基准线。然而，ARC-AGI 创始人 François Chollet 指出，o3 在许多简单任务上仍表现不佳，这表明其与真正的通用人工智能（AGI）仍有本质差距。

o3 的高性能背后是极高的计算成本。据 Keras 之父 François Chollet 披露，o3 在低计算量模式下每个任务需要花费约 20 美元，而在高计算量模式下单个任务成本可达数千美元。相比之下，o1 的成本要低得多。

OpenAI 同时推出了面向普及的轻量版本 o3-mini，支持低、中、高三种推理时间选项。北大校友、OpenAI 研究科学家任泓宇展示了 o3-mini 在代码生成和科学问答等任务上的出色表现。o3-mini 预计将于 2025 年 1 月底向公众开放。

目前 o3 和 o3-mini 仍处于安全测试阶段，仅向特定研究人员开放。感兴趣的用户可通过 OpenAI 官网申请早期测试资格。OpenAI CEO Sam Altman 表示，公司计划在明年初正式推出这两款模型。

（综合媒体报道）

20:00 · 2024年12月20日 · 周五

一个小站的自留地

Google即将发布一个代号为「质心」（centaur) 的模型，这是一个类似 o1风格的推理模型。该模型目前正在LMSYS竞技场收集反馈。（AGI Hunt）

Google 在 Google AI Studio 中上线了 Gemini 2.0 Flash Thinking，这是一个增强了推理能力的模型，可以像 OpenAI 的 o1 模型一样展现思考过程。

有网友体验表示，该模型的智力和 OpenAI 的 o1 仍有较大差距，但得益于这是一个 Flash 模型，推理速度较 o1 有显著优势。

19:56 · 2024年12月20日 · 周五

WordPress 因商业纠纷暂停插件主题等审核服务

WordPress.org 于 2024 年 12 月 20 日宣布，因商业诉讼压力暂停多项免费服务，包括新账户注册、插件及主题目录的新提交和评论功能、照片目录新提交等。本次暂停不影响本地化和论坛等基础服务。恢复时间未定。

WordPress.org 称，此举是为了让疲惫的志愿者在假期得到休息。但背后的原因是 WP Engine 对 Automattic 和 WordPress.org 所有者的诉讼。如果败诉，后者可能面临数百万美元赔偿。值得注意的是，WP Engine 不受此次服务暂停影响。

此前，WP Engine 刚刚在与 Automattic 的诉讼中获得初步禁令支持。此次服务暂停被认为是对该判决的回应。这一决定已在开发者社区引发争议，有意大利开发者因新增的"披萨偏好"必选项感到不满。

（薇晓朵）

15:38 · 2024年12月14日 · 周六

一个小站的自留地

Gemini Flash 2.0 已经向部分用户推出。该模型并未在面向开发者的 AI Studio 上出现过，而是直接灰度推送给了 Gemini 的部分用户。 —————— Google 发布 Gemini 2 Flash。开发者现在就可以在AI Studio和Vertex AI上试用Gemini 2.0 Flash，完整版本将于明年1月全面推出。 Google 宣称新的 Gemini 2.0 支持实时的文本、视频、语音和屏幕共享，速度是上代的两倍，性能和 Gemini 1.5 Pro 相近。

Google即将发布一个代号为「质心」（centaur) 的模型，这是一个类似 o1风格的推理模型。

该模型目前正在LMSYS竞技场收集反馈。

（AGI Hunt）

19:43 · 2024年12月13日 · 周五

一个小站的自留地

OpenAI API 与 ChatGPT 出现大规模服务中断 2024 年 12 月 12 日，OpenAI 旗下的 API、ChatGPT 和 Sora 系统遭遇了严重服务中断问题，导致用户无法正常调用 API 和登录平台。根据 OpenAI 的更新公告，问题于北京时间 12 月 12 日上午 7:17 开始被调查，在此之后快速展开修复工作。 OpenAI 在 8:24 宣布已经找到了问题的原因，并正在全力推出解决方案。尽管中断期间 ChatGPT、Sora 以及 API 功能受到了较大影响，工程团…

OpenAI 发布大规模服务中断复盘

当地时间 2024 年 12 月 11 日，OpenAI 遭遇了一次严重的全平台服务中断事件。本次事件起因于一个新的遥测服务部署，意外导致了 Kubernetes 控制平面崩溃，进而引发了全系统性的服务降级。事件发生在当地时间下午 3 时 16 分，直至晚间 7 时 38 分才完全恢复。

本次事件的主要原因在于一个新部署的遥测服务配置错误，导致集群中每个节点都执行了大量资源密集型的 Kubernetes API 操作。由于这些操作的开销随集群规模增长，最终使得 Kubernetes API 服务器不堪重负。虽然 Kubernetes 的数据平面可以独立运行，但 DNS 服务依赖于控制平面，这导致了服务发现系统的级联故障。

时间线：
- 12 月 10 日：新遥测服务在临时集群测试通过
- 12 月 11 日 14 时 23 分：变更合并，部署流程启动
- 14 时 51 分至 15 时 20 分：变更应用到所有集群
- 15 时 13 分：系统告警触发
- 15 时 16 分：用户开始受到影响
- 19 时 38 分：所有服务完全恢复

OpenAI 表示，此次事件源于一次内部变更，与安全事件或产品发布无关。具体原因是新部署的遥测服务意外导致 Kubernetes 控制平面过载，进而引发连锁故障。目前所有服务已恢复正常运行，公司正在落实多项技术改进措施以防止类似事件再次发生。

(OpenAI)

09:14 · 2024年12月13日 · 周五

一个小站的自留地

OpenAI 即将发布面向公众开放的视频生成模型 Sora V2。该模型将可以生成长达一分钟的视频，并且支持文本转视频或文本+图像/文本+视频的组合作为输入。 OpenAI的Chad Nelson在伦敦的C21Media主题演讲中展示了Sora v2的效果，并表示：正如Sam Altman所预示的，我们将很快看到这一切。另外，OpenAI 还将发布支持视频输入的高级语音模式，也就是 OpenAI 在发布会上演示的视频对话功能。该功能允许用户向 ChatGPT 展示摄像头或电脑屏幕中的内容。预计以上两个功能都将包含在…

作为 12 天连更的一部分，OpenAI 已经灰度推送支持视频输入的高级语音模式。未来一周内将全量推送给所有付费用户。

09:23 · 2024年12月12日 · 周四

一个小站的自留地

ChatGPT 遭遇 6 小时全球性重大故障 2024 年 8 月 15 日,OpenAI 旗下广受欢迎的 AI 聊天机器人 ChatGPT 经历了一次严重的全球性故障,影响了数百万用户。故障始于美国东部时间上午 9:30 左右,直到下午 4:15 才恢复正常,持续约 6 小时 45 分钟。根据中断跟踪网站 Downdetector 的数据,用户报告的问题数量在美东时间中午 12 时左右达到峰值。大多数用户在这段时间内无法访问 ChatGPT 平台,一些用户还遇到了 OpenAI 网站或 ChatGPT…

OpenAI API 与 ChatGPT 出现大规模服务中断

2024 年 12 月 12 日，OpenAI 旗下的 API、ChatGPT 和 Sora 系统遭遇了严重服务中断问题，导致用户无法正常调用 API 和登录平台。根据 OpenAI 的更新公告，问题于北京时间 12 月 12 日上午 7:17 开始被调查，在此之后快速展开修复工作。

OpenAI 在 8:24 宣布已经找到了问题的原因，并正在全力推出解决方案。尽管中断期间 ChatGPT、Sora 以及 API 功能受到了较大影响，工程团队表示正在加紧恢复服务，并对给用户带来的不便表示歉意。

截至 8:55，部分流量已经恢复正常，团队继续努力将所有服务返回到正常状态。OpenAI 重申正在推进修复，尽快恢复完整功能。

（OpenAI Status）

22:15 · 2024年12月11日 · 周三

一个小站的自留地

今日，Google 发布了 Gemini-exp-1206 模型，重回大模型竞技场榜首。该模型拥有完整的 2M 上下文，支持 API 调用。作为连更的第二天，OpenAI 则发布了强化微调（Reinforcement Fine-Tuning, RFT），允许用户基于少量数据，通过强化学习优化模型的推理能力，显著提升其在特定领域（比如编程、金融、法律、医疗和科学研究）的专业表现。

Gemini Flash 2.0 已经向部分用户推出。

该模型并未在面向开发者的 AI Studio 上出现过，而是直接灰度推送给了 Gemini 的部分用户。

——————

Google 发布 Gemini 2 Flash。开发者现在就可以在AI Studio和Vertex AI上试用Gemini 2.0 Flash，完整版本将于明年1月全面推出。

Google 宣称新的 Gemini 2.0 支持实时的文本、视频、语音和屏幕共享，速度是上代的两倍，性能和 Gemini 1.5 Pro 相近。

10:51 · 2024年12月11日 · 周三

AI Copilot

#Update #ChatGPT OpenAI 刚刚发布了 ChatGPT Canvas 功能： - 专为代码和写作场景设计 - Canvas 在独立窗口打开 - 为写作场景提供的快捷方式：建议、修改长度、修改写作水平等 - 为代码场景提供的快捷方式：代码审查、添加日志、修复 bug、代码语言转换等从今天开始，向 Plus 和 Team 用户灰度推出，选择 GPT-4o with canvas 模型即可体验。

OpenAI 12 天连更的第四天，ChatGPT Canvas 现支持直接运行 Python 代码，也支持在 GPTs 内使用 Canvas。

——————

在本次直播中，OpenAI 研究员 Karina Nguyen 展示的新功能界面中出现了ChatGPT ε（第五个希腊字母，读作Epsilon）。网友猜测，这极可能就是之前被传出的下一代模型「猎户座 Orion」。这一模型将有可能在本次 OpenAI 12 天连更中亮相。

媒体此前报道，由于训练「猎户座」使用了先前模型（GPT-4和o1）生成的数据，可能导致它重现旧模型的一些行为，最终质量提升小于从GPT-3到GPT-4的飞跃。因此 OpenAI 大概率不会将其命名为 GPT-5。

09:38 · 2024年12月10日 · 周二

一个小站的自留地

OpenAI Sora API 意外泄露三小时后紧急关闭北京时间 11 月 26 日，OpenAI 旗下视频生成模型 Sora 的 API 访问权限意外泄露。该 API 原本仅提供给特定艺术家进行测试，但被部分测试者在 Hugging Face 平台上部署了公开访问的前端界面。泄露的版本为 Sora Turbo，支持生成 1080p 分辨率、10 秒长度的视频。根据请求负载显示，完整版本包含多种模型和风格选项，但泄露版本仅开放了「自然」风格。 OpenAI 在泄露大约三小时后即关闭了相关访问权限…

OpenAI 正式发布 Sora 视频生成工具

OpenAI 于 12 月 10 日凌晨在其连续 12 天直播活动的第三天，正式向公众发布了期待已久的文生视频模型 Sora。这是自今年 2 月首次展示以来，Sora 首次面向大众开放。

本次发布的是全新的 Sora Turbo 模型，相比 2 月版本在性能和效率上都有显著提升。用户可以通过 sora.com 网站生成视频，该服务已整合进 ChatGPT 的会员体系。20 美元每月的 ChatGPT Plus 会员每月可生成最多 50 个视频，最高支持 720p 分辨率和 5 秒时长；200 美元每月的 Pro 会员则可生成最多 500 个视频，支持 1080p 分辨率和 20 秒时长，并可无水印下载。

Sora 的产品体验超出预期，不仅是简单的视频生成工具，更像是一个完整的创意工作平台。其核心功能包括：

故事板（Storyboard）：允许用户在时间轴上设计分镜，为每一帧添加不同的文本描述，实现连贯的故事叙述。
重混（Remix）：用户可通过文本提示词修改已生成视频的特定元素，且支持调节修改强度。
混合（Blend）：能将两段不同视频无缝融合，创造出独特的过渡效果。
循环（Loop）：可生成完美循环的视频片段。
风格预设：提供多种预设风格模板，包括纸版、黑白电影、怀旧录像等。

平台还设有社区功能，用户可以在 Featured 和 Recent 版块浏览他人作品，查看生成提示词，汲取创作灵感。

在技术层面，Sora 采用了扩散模型和 Transformer 架构，借鉴了大语言模型在互联网规模数据上训练的范式。OpenAI 引入了视觉块（visual patches）的概念，有效统一了视频和图像的表示方式。这种技术创新使得 Sora 能够生成具有连贯性的长视频，并保持画面中物体的一致性。

为确保安全使用，OpenAI 采取了多重防护措施。所有由 Sora 生成的视频都会嵌入 C2PA 元数据以标明其 AI 生成属性，并默认添加可见水印。系统还限制了人物照片和视频的上传，禁止生成包含未成年人、暴力和色情的内容。在技术层面，OpenAI 通过多模态审核分类器、自定义大语言模型过滤、图像输出分类器等多重机制进行内容审核。

不过，目前的 Sora 仍存在一些局限性。据早期测试者反馈，模型在物理规律模拟方面还不够完善，经常出现物体突然消失或穿透等问题。在处理包含腿部运动的对象时，也会出现前后腿位置混乱的情况。此外，由于访问量过大，目前 Sora 的新用户注册已暂时关闭。该服务目前在全球大部分地区可用，但受限于监管原因，英国和欧盟地区暂未开放。

OpenAI 表示，将继续完善安全机制，并计划在明年推出针对不同用户群体的定制定价方案。

（综合媒体报道）

22:55 · 2024年12月9日 · 周一

一个小站的自留地

OpenAI 的推理模型 o1 即将提出其完全体 o1 Pro，拥有更长更深入的思考能力。包含这一模型的新套餐定价每月200美元/200英镑/229欧元，可无限制使用o1、o1-mini、GPT-4o 和高级语音功能。（AGI Hunt）（小道消息，待核实） —————— Google Deepmind 早前发布了最新基础世界模型 Genie 2。 OpenAI 也宣布将启动为期 12 天的特别活动。在未来 12 天的每个工作日举行直播发布一个更新。据媒体报道，OpenAI 大概率会至少发布…

OpenAI 即将发布面向公众开放的视频生成模型 Sora V2。该模型将可以生成长达一分钟的视频，并且支持文本转视频或文本+图像/文本+视频的组合作为输入。

OpenAI的Chad Nelson在伦敦的C21Media主题演讲中展示了Sora v2的效果，并表示：正如Sam Altman所预示的，我们将很快看到这一切。

另外，OpenAI 还将发布支持视频输入的高级语音模式，也就是 OpenAI 在发布会上演示的视频对话功能。该功能允许用户向 ChatGPT 展示摄像头或电脑屏幕中的内容。

预计以上两个功能都将包含在 ChatGPT Pro 订阅中，在未来几天内陆续发布。

（小道消息，待核实）

11:36 · 2024年12月9日 · 周一

一个小站的自留地

GitHub Universe 2024：AI 驱动开发体验迈向新纪元 GitHub 于近日举办的 2024 年 Universe 大会上发布了一系列重磅更新，进一步强化其作为全球最大开发者社区的地位。据 GitHub 官方博客报道，自 10 年前首次举办以来，GitHub Universe 一直致力于优化开发者体验。今年的活动标志着该平台在 AI 驱动开发方面的重要里程碑。 AI 原生体验全面升级 GitHub 为其 AI 编程助手 Copilot 引入了多种新的 AI 模型，包括 Anthropic…

GitHub Copilot Chat 支持 GPT-4o 64K 上下文窗口

GitHub 宣布，Copilot Chat 在其官方网站、移动应用、命令行工具及支持的集成开发环境中，已支持 OpenAI GPT-4o 的 64K 词元上下文窗口。此次升级将为用户处理大型文件和代码仓库时提供更好的响应体验。

GitHub 表示，所有 Copilot 用户无需任何操作即可使用此功能。新版本将帮助 Copilot 在执行技能时检索更多信息，从而提供更贴合上下文的回应。

值得一提的是，Visual Studio Code Insiders 版本的 GitHub Copilot 用户可以使用高达 128K 的上下文窗口，这也是 GPT-4o 支持的最大容量。

（GitHub Blog）

11:26 · 2024年12月7日 · 周六

一个小站的自留地

Meta 发布 Llama 3.2 北京时间2024 年 9 月 26 日凌晨，Meta 发布 Llama 3.2。本次发布，包含 4 种尺寸的模型，包括 1B、3B、11B 和 90B，以及一些硬件：一款新的雷朋 AI 眼镜和 Meta Quest 3S： 1B/3B：旨在提供边缘算力，也就是可以在如移动设备上运行，目前已支持Arm、高通（Qualcomm）和联发科（MediaTek） 11B/90B：具备多模态能力，并可直接替代 Llama 3.1 8B 和 70B。 Llama St…

Meta 发布 Llama 3.3

Meta 发布了新一代大语言模型 Llama 3.3 70B，该模型采用优化的 Transformer 架构，支持 128k 的上下文长度，并通过监督式微调 (SFT) 和基于人类反馈的强化学习 (RLHF) 进行训练。

官方宣称，Llama 3.3 70B 的性能与 Llama 3.1 405B 模型相当。

Llama 3.3 的主要特点包括：
- 支持英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语等 8 种语言
- 在多个基准测试中展现出色表现，如在 MMLU 测试中达到 86%，HumanEval 代码评估达到 88.4%
- 训练数据量超过 15 万亿词元，训练截止日期为 2023 年 12 月

据 Meta 介绍，Llama 3.3 在合成数据生成和知识蒸馏等应用场景中表现优异。模型已通过 Llama 3.3 社区许可协议开源，可用于商业和研究用途。

（Meta）

11:17 · 2024年12月7日 · 周六

一个小站的自留地

OpenAI 的推理模型 o1 即将提出其完全体 o1 Pro，拥有更长更深入的思考能力。包含这一模型的新套餐定价每月200美元/200英镑/229欧元，可无限制使用o1、o1-mini、GPT-4o 和高级语音功能。（AGI Hunt）（小道消息，待核实） —————— Google Deepmind 早前发布了最新基础世界模型 Genie 2。 OpenAI 也宣布将启动为期 12 天的特别活动。在未来 12 天的每个工作日举行直播发布一个更新。据媒体报道，OpenAI 大概率会至少发布…

今日，Google 发布了 Gemini-exp-1206 模型，重回大模型竞技场榜首。该模型拥有完整的 2M 上下文，支持 API 调用。

作为连更的第二天，OpenAI 则发布了强化微调（Reinforcement Fine-Tuning, RFT），允许用户基于少量数据，通过强化学习优化模型的推理能力，显著提升其在特定领域（比如编程、金融、法律、医疗和科学研究）的专业表现。

08:29 · 2024年12月6日 · 周五

一个小站的自留地

OpenAI 的推理模型 o1 即将提出其完全体 o1 Pro，拥有更长更深入的思考能力。包含这一模型的新套餐定价每月200美元/200英镑/229欧元，可无限制使用o1、o1-mini、GPT-4o 和高级语音功能。（AGI Hunt）（小道消息，待核实） —————— Google Deepmind 早前发布了最新基础世界模型 Genie 2。 OpenAI 也宣布将启动为期 12 天的特别活动。在未来 12 天的每个工作日举行直播发布一个更新。据媒体报道，OpenAI 大概率会至少发布…

OpenAI 官宣此次更新。除上述内容外，满血版 o1 已经取代 o1 preview，还支持了图片输入。

而 o1 Pro，作为比满血版更昂贵的存在，仅限ChatGPT Pro 套餐用户使用。

满血版 o1 现已面向 ChatGPT Plus 和 Team 用户推出，而 Enterprise 和 Edu 用户将从下周开始使用。

01:08 · 2024年12月6日 · 周五

一个小站的自留地

OpenAI 推出新模型 o1：推理能力大幅提升北京时间 9 月 13 日凌晨，OpenAI 发布了全新的推理模型系列——o1 系列。该系列包含两个版本：o1-preview 和 o1-mini，分别面向不同的用户群体。据 OpenAI 官方消息，o1 系列在复杂推理任务上的表现显著提升，尤其是在科学、编程和数学等领域。为了彰显这一突破性进展，OpenAI 将计数器重置为 1，并将该系列命名为 o1。 o1 系列的推理能力远超此前的 GPT-4o 模型。例如，在国际数学奥林匹克（IMO）资格考试中，GPT…

OpenAI 的推理模型 o1 即将提出其完全体 o1 Pro，拥有更长更深入的思考能力。

包含这一模型的新套餐定价每月200美元/200英镑/229欧元，可无限制使用o1、o1-mini、GPT-4o 和高级语音功能。

（AGI Hunt）
（小道消息，待核实）

——————

Google Deepmind 早前发布了最新基础世界模型 Genie 2。

OpenAI 也宣布将启动为期 12 天的特别活动。在未来 12 天的每个工作日举行直播发布一个更新。据媒体报道，OpenAI 大概率会至少发布 Sora 和 o1 的完整版。

有小道消息称，Google 正加快 Gemini 下一代模型的发布进度。

Before

After