中央广播电视总台发布了“2025年春节联欢晚会”主题和LOGO。
2025年是乙巳蛇年,因此春晚主题定为“巳巳如意,生生不息”。春晚 LOGO 以甲骨文“巳”字为创意元素,两个“巳”字对称设计寓意“双巳合璧,事事如意”,既像生肖蛇,又像数字“5”或“2”。
阿里 Qwen 团队发布了专注于推理和思维链的新一代大语言模型 QwQ-32B-Preview。该模型基于 Qwen2.5 32B 的架构,采用 Apache 2.0 许可证开源,支持商用。
QwQ 在多个复杂推理基准测试上展现出突出表现:在 GPQA(研究生级问答)得分 65.2%,在 AIME(美国数学邀请赛)达到 50.0%,在 MATH-500 基准测试中达到 90.6%,在 LiveCodeBench(实际编程场景)测评中达到 50.0%。这些分数显示其在推理、数学和编程领域均具有较强实力。
该模型特点是通过深入思考和自省方式解决问题。在处理复杂问题时,它不会直接给出结论,而是模拟人类思维,通过分步推导和不断反思来得出答案。然而,模型目前也存在一些限制,如语言切换不稳定、可能陷入递归推理循环、部分安全机制尚待完善等。
Qwen 团队 指出 ,该模型本质上体现了推理缩放规律 (inference scaling law):允许模型有更长的思考时间,推理能力会相应提升。QwQ 作为开源领域首个专注推理能力的大模型,为开发者提供了一个可直接使用的基础工具。
(DataLearner)
北京时间 11 月 26 日,OpenAI 旗下视频生成模型 Sora 的 API 访问权限意外泄露。该 API 原本仅提供给特定艺术家进行测试,但被部分测试者在 Hugging Face 平台上部署了公开访问的前端界面。
泄露的版本为 Sora Turbo,支持生成 1080p 分辨率、10 秒长度的视频。根据请求负载显示,完整版本包含多种模型和风格选项,但泄露版本仅开放了「自然」风格。
OpenAI 在泄露大约三小时后即关闭了相关访问权限。在此期间,众多用户已通过该接口生成了大量测试视频,这些视频均带有 OpenAI 的视觉水印。
参与测试的艺术家发布了一封措辞强烈的公开信。这些艺术家在信中表示,他们在为这家估值 1500 亿美元的公司提供无偿的错误测试和反馈。艺术家们的创作需要经过 OpenAI 团队的审批才能对外分享,这让他们感觉更像是一场公关活动,而非真正的创意合作。
公开信呼吁艺术家们转向开源工具,并列举了包括 CogVideoX、Mochi 1、LTX Video、Pyramid Flow 等替代方案。目前该公开信已获得 68 位签名者支持。
这一事件引发了对 AI 时代艺术创作者权益的讨论。艺术家们认为,新技术本身的价值不应凌驾于艺术创作的价值之上,AI 企业需要重新思考与创作者的合作方式。
(机器之心、数字生命卡兹克)
2024 年 11 月 25 日,Microsoft 的 Outlook 和 Teams 等核心服务出现全球性中断。故障最早于当日上午 8 时(北京时间 21 时)左右开始出现,并在随后数小时内持续发酵,影响了全球范围内的企业和个人用户。
Microsoft 表示,此次事件源于一项近期的配置变更,导致用户无法访问 Exchange Online 或使用 Microsoft Teams 日历功能。公司随即着手回滚相关更改并部署修复方案,同时对部分处于异常状态的服务器进行手动重启。
到当地时间 11 时,Microsoft 表示修复方案已覆盖约 98% 的受影响环境,但恢复进度比预期要慢。直至当日晚间 11 时左右,公司宣布已恢复大部分受影响服务的功能,仅有少量用户的网页版 Outlook 仍受影响。Microsoft 预计于 11 月 26 日凌晨完成所有服务的全面恢复。
此次服务中断虽然规模较大,但与今年夏季由 CrowdStrike 软件问题引发的、被称为「史上最大 IT 中断」的事件相比仍有差距。后者曾导致航班停飞、医院系统瘫痪,并给财富 500 强企业造成超过 50 亿美元的直接损失。
(综合 NBC New York、Windows Central、CNN)
国内 AI 大模型公司月之暗面推出 k0-math 模型驱动的 Kimi 数学版,官方宣称「k0-math 模型数学能力对标 o1 系列」。
(月之暗面)
——————
根据SuperCLUE-Math6o「小学奥数」基准测评总榜,数学模型 k0-math 在数学任务中表现出对应用题和计算较强的处理能力,但在行程问题和几何任务上略显薄弱。
与o1-preview相比,数学模型 k0-math 在 SC-math6o 上仍有 18 分的差距,尚有较大的提升空间,目前排名国内第2。国内排名第一是深度求索早前发布的 DeepSeek-R1-Lite-Preview 模型。
DeepSeek 发布了R1系列推理模型,使用强化学习训练,推理过程包含大量反思和验证,思维链长度可达数万字。
该系列模型在数学、代码以及各种复杂逻辑推理任务上,取得了媲美 o1-preview 的推理效果,并为用户展现了 o1 没有公开的完整思考过程。
该模型目前可以仅在网页版使用,DeepSeek 方面表示,之后,正式版 DeepSeek-R1 模型将完全开源,DeepSeek 也将公开技术报告,并部署 API 服务。
(DeepSeek)
部分网友反映支付宝 App 无法正常使用,他们遇到了同一笔订单被扣款三次、余额宝转账至余额后余额显示为0、线下支付后商家未收到款项但银行卡已被扣款等问题。
据支付宝官方微博,因系统消息库出现局部故障,导致部分用户的支付功能受到影响。该故障不会影响用户的资金安全,截止上午10点50分故障已经修复。
(新浪财经)
——————
本频信源从蚂蚁员工处了解到,故障复盘后,蚂蚁科技向内部技术员工发布邮件,宣布由 CTO 在内的 4 位高管承担此次故障主要责任。该内部邮件同时对双十一期间的值班员工表达了感谢。
Anthropic 和 xAI 分别在今日宣布开放其最新大语言模型的 API 访问。Anthropic 的 Claude 3.5 Haiku 现已可通过 Anthropic API、Amazon Bedrock 和 Google Cloud Vertex AI 使用,而 xAI 的 Grok 则开启了公测。
Claude 3.5 Haiku 在性能上接近 Sonnet,在编程和代理任务上超越了除 3.5 Sonnet 外的所有此前 Claude 模型。该模型具备更新至 2024 年 7 月的知识库。然而,其定价引发争议 —— 输入价格为每百万词元 1 美元,输出价格为每百万词元 5 美元,较前代产品涨价 4 倍。对比同类产品,如 GPT-4o Mini 和 Gemini 1.5 Flash,Haiku 在性能相近的情况下价格明显偏高。
与此同时,xAI 推出的代号「grok-beta」的新版本 Grok 支持 128,000 词元的上下文长度,并提供函数调用和系统提示词功能。值得一提的是,Grok API 完全兼容 OpenAI 和 Anthropic 的 API,开发者只需修改基础 URL 和 API 密钥即可完成迁移。xAI 还宣布将在下周推出支持图像输入的多模态版本。
在价格方面,Grok API 将提供每月 25 美元的免费额度直至 2024 年底。对于已购买预付费额度的用户,将在 11 月和 12 月获得额外的免费额度。
(新智元)
腾讯在北京举办的混元发布会上宣布开源两款人工智能模型:混元 Large (Hunyuan-Large) 和混元 3D 1.0 (Hunyuan3D-1.0)。
混元 Large 是目前业界最大规模的开源混合专家 (MoE) 大语言模型,总参数量达到 389B,实际激活参数量为 52B。该模型具备 256K 的上下文长度,通过优化的 KV 缓存压缩技术可节省 50% 的 GPU 内存使用。在 MMLU、MMLU-Pro 和 CMMLU 等多个基准测试中,混元 Large 表现优于同规模的 Llama 405B 和 Mixtral-8x22B 等模型。
混元 3D 1.0 是首个同时支持文字和图像生成的开源 3D 生成模型。该模型采用级联架构,通过多视图扩散模型和前馈重建模型两个阶段,可在约 11 秒内完成 3D 模型生成。目前该模型已在腾讯地图、元宝 APP 等多个产品中落地,支持 UGC 3D 创作、商品素材合成等应用场景。
腾讯还将推出一个专门用于评估大模型长文本处理能力的测试数据集「企鹅卷轴」。
两款模型已在 GitHub 和 Hugging Face 平台开源。其中混元 Large 将同步支持在腾讯云 TI 平台上的业务精调及部署,而混元 3D 1.0 的体验入口则开放在元宝 APP 的「3D 角色梦工厂」功能中。
混元 Large:https://github.com/Tencent/Hunyuan-Large
混元 3D:https://github.com/Tencent/Hunyuan3D-1
(综合媒体报道)
ChatGPT 推出实时网络搜索功能:无广告、支持免费用户
OpenAI 正式为 ChatGPT 推出联网搜索功能。新功能支持实时网页搜索,并可在对话中展示包括天气、股市、地图等多媒体内容。所有回答都会注明信息来源,并提供原文链接。
该功能目前已向付费用户和 SearchGPT 候补名单用户开放,未来数周内将向企业和教育用户开放,数月内将向所有免费用户开放。
与传统搜索引擎不同,OpenAI 明确表示 ChatGPT 搜索不会投放广告。
——————
谷歌 AI Studio 迎来重要更新:Flash-8B 正式发布、支持搜索导航
谷歌宣布了 AI Studio 的三项重要更新:
性能与 1.5 模型相当的 Gemini 1.5 Flash-8B 正式发布,其特点是成本降低 50%,处理速度提升一倍,适用于聊天、翻译等高频场景。
所有 Gemini 1.5 模型现已支持谷歌搜索导航功能,可通过搜索结果提供更准确的实时信息。
新增的 Compare Mode 功能支持同时测试多个 Gemini 和 Gemma 模型,方便开发者选择最适合的解决方案。
OpenAI 正式为 ChatGPT 推出联网搜索功能。新功能支持实时网页搜索,并可在对话中展示包括天气、股市、地图等多媒体内容。所有回答都会注明信息来源,并提供原文链接。
该功能目前已向付费用户和 SearchGPT 候补名单用户开放,未来数周内将向企业和教育用户开放,数月内将向所有免费用户开放。
与传统搜索引擎不同,OpenAI 明确表示 ChatGPT 搜索不会投放广告。
——————
谷歌 AI Studio 迎来重要更新:Flash-8B 正式发布、支持搜索导航
谷歌宣布了 AI Studio 的三项重要更新:
性能与 1.5 模型相当的 Gemini 1.5 Flash-8B 正式发布,其特点是成本降低 50%,处理速度提升一倍,适用于聊天、翻译等高频场景。
所有 Gemini 1.5 模型现已支持谷歌搜索导航功能,可通过搜索结果提供更准确的实时信息。
新增的 Compare Mode 功能支持同时测试多个 Gemini 和 Gemma 模型,方便开发者选择最适合的解决方案。
@fofr ,Sam Altman 在 DevDay 上表示:「不想剧透什么,但你们应该很快就能看到图像模型的重大改进。」这番话是在讨论 o1 推理技术应用于图像模型的背景下说的。
据 同日,多个号商的信源表示,用于预付费 OpenAI 额度的账号或 Azure 账号被封禁。此次封禁规模是自 GPT-4o 发布以来最大。
早些时候,ChatGPT 网页版面向会员用户推出了历史记录检索功能。
另外,根据网传图片,OpenAI 在其面向开发者的 DevDay 活动上表示,o1 模型即将推出包括流式输出、图片输入、结构化输出、工具调用等新特性。
GitHub 于近日举办的 2024 年 Universe 大会上发布了一系列重磅更新,进一步强化其作为全球最大开发者社区的地位。据 GitHub 官方博客报道,自 10 年前首次举办以来,GitHub Universe 一直致力于优化开发者体验。今年的活动标志着该平台在 AI 驱动开发方面的重要里程碑。
AI 原生体验全面升级
GitHub 为其 AI 编程助手 Copilot 引入了多种新的 AI 模型,包括 Anthropic 的 Claude 3.5 Sonnet、Google 的 Gemini 1.5 Pro 以及 OpenAI 的 o1-preview 和 o1-mini。这些模型将首先在 Copilot Chat 中推出,并在未来几周内陆续上线。无论是个人开发者还是企业团队,都可以根据具体需求选择最适合的 AI 模型。
新推出的 Copilot Workspace 整合了 Copilot Code Review、Copilot Autofix 以及第三方 Copilot Extensions 功能,旨在加速代码审查和修复流程。开发者可以更快速地完善、验证和实施 Copilot 自动生成的代码建议,显著提升合并请求的准备速度。
GitHub Spark:让创意变为现实
GitHub 发布了全新产品 GitHub Spark,这是一款以自然语言驱动的工具,专注于个人和趣味性的软件开发。Spark 旨在帮助更多人实现成为开发者的梦想,用户可以通过它快速开发小型应用程序,将创意转化为现实。
提升开发效率与安全性
GitHub 还宣布了一系列更新,旨在提高软件开发的速度和安全性。这些更新包括代码补全改进、隐式代理选择以及对 C++ 和 .NET 的更好支持,以提升各类集成开发环境(IDE)中的工作效率。
在安全方面,GitHub 推出了 Copilot Autofix 功能,可以快速修复代码中的漏洞,确保从 IDE 到生产环境的代码更为安全。
企业级体验增强
为满足企业对治理和合规性的需求,GitHub 引入了新功能,为管理员提供了更多用户管理、仓库策略和安全工作流的控制权。同时,GitHub Actions 和 API 活动中新增了基于 Arm64 的运行器和性能跟踪功能,以提升计算资源和工作流效率。
Arc 浏览器近日宣布将停止开发新功能,转而专注于一款全新浏览器产品的开发。这一决定主要源于 Arc 浏览器的复杂性导致用户上手难度过高,从而限制了其成为主流产品的可能性。
据 The Verge 报道,The Browser Company 的首席执行官 Josh Miller 表示,尽管 Arc 的用户十分喜爱其侧边栏、空间和配置文件等自定义功能,但这些功能也成为了其吸引更多用户的障碍。Miller 指出,用户更希望浏览器能够「更快、更流畅和更安全」,而不是不断添加新特性。
根据 Android Authority 的报道,The Browser Company 计划将资源投入到一个全新浏览器的开发上。这款新浏览器预计将在明年年初推出,采用水平选项卡设计,并深度集成 AI 工具,以帮助用户简化工作流程。Miller 强调,新产品将更易于普通用户接受,同时逐步揭示其高级功能。公司希望通过这种方式,缩小普通用户和高级工具之间的差距。
值得注意的是,尽管 Arc 浏览器将不再积极开发新功能,但现有用户仍可继续使用,并获得稳定性更新和错误修复。据蓝点网报道,Arc 浏览器不会被彻底抛弃,而是转向维护更新模式。
据 The Verge 报道,OpenAI 计划于今年 12 月推出其最新的前沿模型 Orion。与近期发布的 GPT-4o 和 Q* 不同,Orion 不会通过 ChatGPT 广泛发布,而是首先向与 OpenAI 密切合作的公司提供访问权限,以便它们构建自己的产品和功能。
消息人士透露,作为 OpenAI 的主要合作伙伴,微软内部工程师正准备在 11 月于 Azure 上托管 Orion。虽然 Orion 在 OpenAI 内部被视为 GPT-4 的继任者,但尚未决定是否将其外部命名为 GPT-5。对此,OpenAI 和微软均拒绝发表评论。
一位 OpenAI 高管曾调侃 Orion 可能比 GPT-4 强大多达 100 倍。OpenAI 的目标是将大语言模型(LLMs)结合,逐步创造出更强大的模型,最终可能达到人工通用智能(AGI)。据悉,OpenAI 正在使用代号为「草莓」的 Q* 模型生成合成数据来训练 Orion。
今年 9 月,OpenAI 的研究人员曾举办庆祝活动,纪念新模型训练的完成。这一时间点也与 OpenAI 首席执行官 Sam Altman 在 X 上的一条神秘帖文相吻合,他提到「期待冬季星座很快升起」,这被解读为指向「猎户座」(Orion)。
OpenAI 最近完成了一轮 66 亿美元的融资,这促使公司转型为营利实体。此外,公司还经历了显著的员工流动,包括首席技术官 Mira Murati 和首席研究官 Bob McGrew 的离职。
熟悉微软 AI 计划的消息人士透露,公司工程师正在准备托管 OpenAI 的 Orion 模型。然而,大多数参与项目的工程师尚未被告知具体细节,以保持机密性。微软对此同样拒绝发表评论。
据了解,OpenAI 已请求访问更多托管 Nvidia H100 GPU 的微软服务器。H100 芯片在 AI 推理和训练方面表现优异,是新一代模型的理想选择。然而,两家公司之间的关系因高昂的计算能力需求而出现紧张。OpenAI 抱怨微软未能提供足够的计算能力以实现其 AGI 目标,并尝试重新谈判此前达成的独家云合作协议。尽管如此,微软仍然是 OpenAI 的主要云合作伙伴,并继续支持其产品和研究工作负载。
(The Verge 1, 2)
10 月 24 日,在科大讯飞全球 1024 开发者节上,讯飞星火 4.0 Turbo 全新升级,七大能力全面超过 GPT-4 Turbo,数学能力、代码能力超过 GPT-4o,星火 4.0 Turbo 效率相对提升 50%。
在数学能力上,讯飞星火已完成超长思维链、树搜索和自我反思评价等算法验证,预计今年底可实现类 o1 的高难度数学能力显著提升。在国内外中英文 14 项主流测试集中,星火 4.0 Turbo 实现 9 项第一。
Stability AI 近日发布了全新的 SD3.5 模型系列,标志着该公司在经历一段低迷期后重返 AI 图像生成领域的竞争前沿。此次发布的 SD3.5 系列包括三个开源且可商用的模型:Large、Large Turbo 和即将于 10 月 29 日推出的 Medium。
SD3.5 系列的三个模型各具特色:
- SD 3.5 Large:拥有 80 亿参数,是该系列中最强大的基础模型,适合 1M 像素的专业应用。
- SD 3.5 Large Turbo:Large 版本的精简型,仅需 4 步即可生成高质量图像,速度更快。
- SD 3.5 Medium:采用 MMDiT-X 架构,拥有 25 亿参数,支持普通硬件,能够输出 0.25 至 2M 像素的图像。
这些模型不仅强调高适配性和硬件友好性,还支持多元化的人物形象生成和多种视觉风格。Large 版本在提示词理解力方面表现突出,更重要的是,SD3.5 支持对模型进行微调,为社区开发者提供了更大的创新空间。
在社区支持方面,ComfyUI 已经更新支持 SD3.5,用户只需更新到最新版本即可使用。此外,Liblib 也迅速上线了三个 SD3.5 的 Lora 模型供下载,分别是 Linear Red Light、Futuristic Bronze Colored 和 Chinese Line Art。