起于小站,终于生活。
现实之外,一个普通人的思考。

博客地址:ygxz.in
讨论组:https://t.me/+a5Clq4jLuJc4YWQ9
一个小站的自留地
Anthropic 推出 Claude 提示缓存功能,可大幅降低成本 人工智能公司 Anthropic 于 8 月 14 日宣布,在其 API 上推出名为「提示缓存」(Prompt Caching)的新功能。该功能允许开发者在 API 调用之间缓存频繁使用的上下文信息,从而为 Claude 模型提供更丰富的背景知识和输出示例,同时显著降低成本和延迟。 提示缓存功能目前已在 Claude 3.5 Sonnet 和 Claude 3 Haiku 模型的公测版中提供。对于长提示,该功能可以将成本降低高达 90%…
Anthropic 推出 Claude Enterprise

Anthropic 于 2024 年 9 月 4 日宣布推出面向企业用户的新订阅计划 Claude Enterprise,旨在为需要更多管理控制和增强安全性的企业客户提供服务。这一举措将使 Anthropic 直接与 OpenAI 的 ChatGPT Enterprise 展开竞争。

据 TechCrunch 报道,Claude Enterprise 允许企业将专有的公司知识上传至 Anthropic 的 AI 聊天机器人 Claude。Claude 随后可以分析这些信息,回答相关问题,创建图形和简单网页,或充当公司特定的 AI 助手。Claude Enterprise 的上下文窗口扩展至 500K 个词元,使得 Anthropic 的模型能够在一次提示中处理多达 20 万行代码、数十个 100 页文档或两个小时的音频转录。

此外,Claude Enterprise 还包括 GitHub 集成功能,使工程团队能够将其 GitHub 存储库与 Claude 同步。这一集成功能可用于快速培训新工程师、创建新功能或解决错误等任务。

TechCrunch 引述 Anthropic 产品负责人 Scott White 的话称,Claude Enterprise 的具体定价尚未公开,但预计将高于 Anthropic 的 Team 计划(每位成员每月 30 美元)。White 解释道,由于企业客户可以从 Claude 中获得更多收益,因此其价格也相应更高。在早期测试阶段,包括 GitLab、Midjourney 和 IG Group 等知名企业客户已经开始使用 Claude Enterprise,并反映出显著的生产力提升。
一个小站的自留地
智谱 AI 发布三款大模型

智谱 AI 近日发布了三款新的大型语言模型及其 API,包括 GLM-4-Plus、GLM-4V-Plus 和 CogView-3-Plus。

- 语言基座模型 GLM-4-Plus:在语言理解、指令遵循及长文本处理等方面性能全面提升,保持国际领先水平。该模型已上线智谱 AI 开放平台(bigmodel.cn),并将在「清言 APP」中提供体验。

- 文生图基座模型 CogView-3-Plus:性能接近当前最优的 MJ-V6 和 FLUX 等模型。该模型已上线智谱 AI 开放平台提供 API 服务,并正式上线「清言 APP」。

- 图像/视频理解基座模型 GLM-4V-Plus:具备卓越的图像理解能力,并具有基于时间感知的视频理解能力。该模型已上线智谱 AI 开放平台,成为国内首个通用视频理解模型 API。

除此之外,KDD 2024 大会上,智谱还宣布了其他更新:

- 视频生成基座模型 CogVideoX:在发布并开源 2B 版本后,5B 版本也正式开源。其性能进一步增强,成为当前开源视频生成模型中的最佳选择。

- 「清言 APP」上线视频通话功能:这是国内首个面向 C 端用户开放的 AI 视频通话服务,具备实时推理能力。该功能将于 2024 年 8 月 30 日上线,首批面向部分用户开放,接受外部申请。

- GLM-4-Flash API:智谱 AI 宣布将 GLM-4-Flash API 全面免费开放,以支持用户快速构建专属模型和应用。同时,该服务还提供微调功能以满足不同需求。
一个小站的自留地
OpenAI 新 GPT-4o 模型重夺 LMSYS Chatbot Arena 榜首 OpenAI 近日更新了 ChatGPT 背后的 GPT-4o 模型,新版本在 LMSYS Chatbot Arena 测试中以 1314 分的成绩重新夺回第一名,超越了谷歌的 Gemini-1.5-Pro-Exp 模型。 此次更新的主要改进包括: - 编码能力显著提升,得分提高 30 分 - 指令跟随能力增强 - 处理复杂提示的能力提升 新模型在各项分类排名中均位列第一。OpenAI 已将新版本命名为 chatgpt…
谷歌发布三款 Gemini 实验 AI 模型,1.5 Pro 冲榜第二

2024 年 8 月 28 日,谷歌 AI Studio 产品总监 Logan Kilpatrick 在 X 平台宣布推出三款实验性 Gemini 模型:

- Gemini 1.5 Flash-8B:这是 Gemini 1.5 Flash 的精简版本,拥有 80 亿参数,专为多模态任务设计,包括大容量任务和长文本摘要。
- Gemini 1.5 Pro Exp-0827:该模型主要增强编程和复杂提示词功能,现已通过 Google AI Studio 和 Gemini API 免费提供。
- Gemini 1.5 Flash Exp-0827:在性能上有显著提升,排名从之前的第 23 位提升至第 6 位。


据 VentureBeat 报道,新的 Gemini 1.5 Pro Exp 0827 型号在各方面都优于 8 月初发布的实验型号,目前在 LMSYS 上的排名为第 2 位,仅次于 OpenAI 的 chatgpt-4o-latest 模型。

此外,从 9 月 3 日起,系统将自动将对 gemini-1.5-pro-exp-0801 模型的请求重定向到新的 gemini-1.5-pro-exp-0827 模型,旧型号将从 Google AI Studio 和 API 中移除。

用户可以通过 Gemini API 和 Google AI Studio 访问上述两个模型,名称分别为 gemini-1.5-pro-exp-0827 和 gemini-1.5-flash-exp-0827。

Google
一个小站的自留地
IBM 中国与思杰马克丁签署 SPSS 产品独家转售协议 2024年7月1日,IBM 中国宣布将与苏州思杰马克丁软件有限公司(简称思杰马克丁)拓展合作。根据协议,思杰马克丁将全面独家负责 IBM SPSS 系列产品在中国大陆地区的转售模式发行业务。 IBM 大中华区董事长兼总经理陈旭东表示,此次合作旨在针对性满足国内客户需求,提供更灵活高效的支持。思杰马克丁董事长金勇表示,将与 IBM 合作推出新的渠道政策和奖励计划,共建正版软件生态系统。 SPSS 是业界领先的数据科学和统计分析软件。思杰马克丁成立于2009年…
IBM 大规模裁撤中国研发部门,涉及超 1000 名员工

IBM 近日宣布将彻底关闭其在中国的研发部门,包括 IBM 中国开发中心(CDL)和 IBM 中国系统中心(CSL),涉及员工超过 1000 人。此举意味着 IBM 在国内彻底裁撤了研发部门。

据本频信源拿到的会议全文,IBM 全球企业系统开发副总裁 Jack Hergenrother 在会议中表示,为了支持全球客户和业务战略,IBM 基础设施部门决定将中国系统实验室的开发任务转移到其他海外 IBM 基础设施地点。他强调,这一决定是基于市场动态和激烈竞争的影响,近年来 IBM 在中国的基础设施业务有所下降

IBM Z 和 Linux One 总经理 Ross Moury 以及存储工程副总裁 Danny Mace 也在会议中发言,感谢员工的贡献,并表示这是一个艰难但必要的决定。

据《科创板日报》报道,CDL 和 CSL 分别成立于 1999 年和 2004 年,是 IBM 在中国的重要研发基地。IBM 方面表示,此次调整是为了聚焦混合云和人工智能等高增长领域,以适应市场变化。

据新智元报道,8 月 25 日晚间,IBM 中国区突然关闭了研发和测试岗位的访问权限。在被收回权限之前,这些员工均正常上下班,甚至有部分员工还在加班。关闭权限后,他们被移除出工作群组,无法登录公司内网,但仍可以访问邮件。

一线经理于 8 月 25 日晚上收到裁员通知,而普通员工直到 8 月 28 日早上才正式被告知。据报道,员工在一场仅持续三分钟的全员会议上被告知裁员决定,会议结束后直接切断了连接。一位员工表示:「大家听完之后很气愤,感觉受到了侮辱。」

IBM 官方以协商离职的方式处理此次裁员,并提供了分级的补偿方案:

- 若在 2024 年 9 月 13 日之前签字,将获得 N+3 的补偿;
- 在 9 月 13 日至 9 月 20 日之间签字,补偿金额为 N+1;
- 2024 年 10 月 31 日之后签字则没有补偿。

此次裁员并不涉及咨询及售后等支持团队。

近年来,IBM 在中国的经营压力加大。2023 年,IBM 全球营收为 619 亿美元,同比增长 2%,但中国市场收入却骤降 19.6%。截至 2023 年底,IBM 共拥有约 282,200 名员工,相比 2022 年减少 6100 人。一位大连的 IBM 员工提到:「很多员工已经一年多没太有项目可做,这次裁员只能说 IBM 已经很良心了,没见过哪个公司能白养员工一两年,还正常发工资。」

对于此次裁员是否与 AI 替代人工相关,许多员工表示否认。内部知情人士透露,目前 AI 替代人力的项目在 IBM 内部尚属少数,短时间内研发人员的工作仍无法被 AI 替代。此外,此次裁员的筹备工作早在三四年前就已启动
一个小站的自留地
苹果正式宣布,将于北京时间 9 月 10 日凌晨 1 点在加利福尼亚州库比蒂诺的总部举办特别活动,主题为「高光时刻(It 's Glowtime)」。

发布会上有望带来 iPhone 16 系列手机、Apple Watch Series 10 以及 AirPods 4 等新品。

苹果还计划在今年晚些时候开始将其 Mac 换用M4 处理器,但 Mac 更新通常要等到每年 iPhone 发布后约一个月才会发布。
上海电信宽带大面积断网

2024 年 8 月 26 日 17:30 左右,上海电信部分宽带业务发生异常。对此,上海电信表示正在全力抢修排障,并对用户所带来的不便深表歉意。

据 IT 之家报道,当天有大量网友在社交平台反馈上海电信宽带网络出现问题。18:00 左右,不少用户反映宽带信号消失,甚至无法拨打电信 10000 号进行报修。一些网友称,他们最初怀疑是自家网络出现问题,甚至联系了维修师傅,后来才得知是全市范围内的网络故障。

相关话题登上微博热搜第二。在「中国电信上海客服」微博下,不少用户已留言反馈。

上海电信回应称,17时30分左右,上海电信部分宽带业务发生异常,经紧急抢修,已于18时05分全面恢复正常。电信宽带受理人员对此表示,是电信数据有问题导致了断网情况。

(图源网络)
一个小站的自留地
FLUX 模型:AI 图像生成新标杆 Black Forest Labs 公司(原Stable Diffusion团队成员创立)近日发布了革命性的 FLUX 系列图像生成模型。FLUX 采用创新的混合架构,结合 Transformer 和扩散技术,拥有 120 亿参数,在图像质量、提示词响应和输出多样性方面均达到了新高度。 模型版本: - FLUX.1 [pro]:顶级商业版本,提供最高质量的图像生成能力。 - FLUX.1 [dev]:开放权重的非商业版本,适合研究和开发使用。 -…
Ideogram 2.0 发布,AI 图像生成再上新台阶

Ideogram 2.0 现已向所有用户免费开放,用户可在 ideogram.ai 平台和全新 iOS 应用上使用这一最新的文本到图像生成模型。

官方表示,Ideogram 2.0 不仅增强了创作能力,还推出了 iOS 应用、API 和视觉搜索系统。用户可以选择五种不同风格生成图像,包括一般风格、写实风格、设计风格、3D 风格和动漫风格,满足不同创作需求。其写实风格能够生成近乎真实的照片,设计风格则显著提升了文本渲染的准确性

在功能方面,用户现在可以在生成图像时选择特定的颜色调色板,以确保品牌一致性和艺术控制。此外,Ideogram 还推出了公测版 API,为开发者提供灵活的集成方案。

Ideogram 2.0 允许用户每天生成多达 40 张图像,而付费计划则提供更多优先生成的积分,帮助企业和内容创作者更高效地进行视觉内容制作。该平台还提供多种订阅选项,从每月 7 美元的基础计划到 48 美元的专业计划不等,每个计划都提供不同数量的优先生成积分和其他福利。

——————

Midjourney 宣布其网站正式向所有用户开放

在面对来自 Elon Musk 的 xAI 及其 Grok 2 模型,以及 Ideogram 2 等竞争对手的挑战下,Midjourney 选择通过开放网站来吸引更多用户。

Midjourney 近日宣布其网站正式向所有用户开放,新用户可免费生成约 25 张 AI 图像。这一举措标志着 Midjourney 摆脱了此前仅限于 Discord 平台使用的限制,为更广泛的用户群体提供了探索其 AI 图像生成功能的机会。

据 VentureBeat 报道,Midjourney 联合创始人兼首席执行官 David Holz 在 Discord 上透露了这一消息。这一变化被许多用户视为从「Discord 孤岛」中解放出来,因为过去 Discord 的注册要求限制了不少人尝试 Midjourney 服务
一个小站的自留地
Gemini API 现可调用多模态能力阅读 PDF Gemini API 和 AI Studio 现在支持通过文本和视觉识别理解 PDF。 如果 PDF 包含图形、图像,或其他可视内容,模型会使用内置的多模态功能来处理 PDF。 用户可以通过 Google AI Studio 或 Gemini API 体验这一功能。
Google AI Studio 和 Gemini API 提升 PDF 上传限制至 1000 页或 2GB

Google 近日对其 AI Studio 和 Gemini API 进行了更新,将 PDF 文件的上传限制从原先的 300 页大幅提升至 1000 页或 2GB

Google 利用 Gemini 的文本理解和多模态功能来处理这些文档,每页支持一张图片。此外,用户可以在上传后通过文件 ID 进行多次请求,文件在默认情况下会保留 48 小时
一个小站的自留地
微软发布 Phi-3.5 系列模型,性能超越同规模模型

微软近日推出了新一代人工智能模型系列 Phi-3.5,包括 Phi-3.5-MoE-instruct、Phi-3.5-mini-instruct 和 Phi-3.5-vision-instruct 三款模型。这一系列模型旨在满足从基础推理到复杂推理及多模态任务等多种 AI 应用需求。

- Phi-3.5 Mini Instruct 是一款轻量级 AI 解决方案,专为计算资源有限的场景设计。尽管参数量仅为 3.8 亿,该模型仍能处理代码生成、数学问题解决及逻辑推理等复杂任务。它支持 128k 的词元上下文长度,能有效管理长时间交互,并在多语言和多轮对话任务中表现优异。

- Phi-3.5 MoE是微软首次尝试的专家混合(Mixture of Experts)模型,将多种模型类型结合为一。该模型总计拥有 420 亿个参数,在任何给定时间内激活 66 亿个参数,确保高效性能。Phi-3.5 MoE 在代码、数学及多语言理解等领域表现出色,在一些基准测试中超过了 GPT-4 等更大模型。

- Phi-3.5 Vision Instruct 专注于需要文本与图像处理能力的任务。这款模型在通用图像理解、光学字符识别、图表与表格理解以及视频摘要等领域表现突出。与其他两款模型相同,Vision Instruct 也支持 128k 的词元上下文长度,能够处理复杂的多帧视觉任务。

微软将所有三款 Phi-3.5 模型以 MIT 许可证形式开源发布,允许开发者自由使用、修改和分发这些模型。据报道,这些模型在多个基准测试中表现出色,超越了谷歌和 Meta 的同类模型,为用户提供了更强的推理和多模态任务支持。

据 Reddit 用户讨论,Phi-3.5 是目前最「安全」的模型之一,在安全性和有效性方面表现突出。微软声称,Phi-3.5 系列能够有效防止生成冒犯性内容。
一个小站的自留地
金山文档出现服务故障 8 月 21 日上午,多名网友反馈金山文档出现服务故障,导致 WPS 共享文档无法正常打开使用。这一情况迅速引起了广泛关注,许多用户在 WPS 客户服务官方微博下留言询问情况。 根据 IT 之家报道,WPS 客户服务官方在微博回应表示:「今日上午,WPS 出现服务故障,导致部分用户使用受到影响,目前已在逐步恢复中。如您在使用 WPS 的过程中遇到任何问题,请及时与我们联系。抱歉给大家工作日带来不便」。 本频于 21 日上午 8 时接到金山文档分享链接无法打开的报告,界面提示为「文件链接无效」。…
WPS 客服于 8 月 21 日 15:33 在微博发布更新称,经工程师紧急修复,WPS 服务已恢复。

作为补偿,8 月 22 日 0 点至 24 点,所有用户可以免费领取 15 天会员。用户可在最新版的 WPS 客户端搜索关键词「AI办公」,即可获取领取链接,具体规则见领取页面。

从官方公告算起,本次故障历时约 4 小时。但根据用户反馈,本次故障部分用户最长受影响时间超过 7 小时。

目前暂无关于故障原因的更多消息。
金山文档出现服务故障

8 月 21 日上午,多名网友反馈金山文档出现服务故障,导致 WPS 共享文档无法正常打开使用。这一情况迅速引起了广泛关注,许多用户在 WPS 客户服务官方微博下留言询问情况。

根据 IT 之家报道,WPS 客户服务官方在微博回应表示:「今日上午,WPS 出现服务故障,导致部分用户使用受到影响,目前已在逐步恢复中。如您在使用 WPS 的过程中遇到任何问题,请及时与我们联系。抱歉给大家工作日带来不便」。

本频于 21 日上午 8 时接到金山文档分享链接无法打开的报告,界面提示为「文件链接无效」。

据媒体报道,这已经是 WPS 今年第三次用户有感知的服务故障。今年7 月 8 日,金山 WPS 服务出现服务问题,包括但不限于云文档网站无法打开、小程序在线文档无法加载、WPS 无法登录账号等,而在6月28日下午,也曾有大量网友反映「WPS崩了」,金山文档无法打开。当时,金山办公回应媒体称,崩溃原因可能与云服务异常有关。

(IT 之家)
一个小站的自留地
网易旗下部分服务出现大范围故障 8 月 19 日下午,网易云音乐出现大范围服务器故障。网页版出现 HTTP 502 网关错误,客户端播放歌曲时提示「获取播放信息失败」,几乎所有平台均无法正常访问和使用。 网易云音乐官方于当日 15:22 在微博发布 声明 称:「因基础设施故障,导致网易云音乐各端无法正常使用,我们正在加紧修复,非常抱歉。感谢大家的等待。」 本频综合信源表示,此次故障发生时间为 19 日下午14:35 前后,截至发稿,故障已经持续超一小时。目前故障原因和具体恢复时间尚不明确。 (蓝点网,图:V2EX)…
网易云音乐官方回复新京报贝壳财经记者称:「目前故障与机房无关,内容有失实」。

——————

知情人士称,网易此次故障原因是云存储运维操作导致故障。本频信源确认了配图消息记录的真实性。该聊天确实来自网易员工。

本频信源表示,本次故障与机房迁移无关。贵州机房切流早在六月份就已完成。部分媒体的报道有差错。

网易云音乐在 B 站动态称,作为补偿,8月20日0-24时,网易云音乐搜「畅听音乐」,可领取7天会员权益。
一个小站的自留地
GitHub 全球宕机 36 分钟,Copilot 等服务全部瘫痪 北京时间 8 月 16 日 07:02 至 07:38,GitHub 遭遇全球性宕机,所有服务对全体用户不可用,包括代码托管、Pages、Actions、Packages 以及 AI 代码助手 Copilot。 GitHub 表示,此次宕机源于一项影响数据库基础设施内部流量路由的配置变更,导致关键服务意外失去数据库连接。GitHub 通过回滚该变更并确认恢复数据库连接来缓解事件影响。北京时间 07:38,流量恢复,所有服务重新正常运作。…
网易旗下部分服务出现大范围故障

8 月 19 日下午,网易云音乐出现大范围服务器故障。网页版出现 HTTP 502 网关错误,客户端播放歌曲时提示「获取播放信息失败」,几乎所有平台均无法正常访问和使用。

网易云音乐官方于当日 15:22 在微博发布 声明 称:「因基础设施故障,导致网易云音乐各端无法正常使用,我们正在加紧修复,非常抱歉。感谢大家的等待。」

本频综合信源表示,此次故障发生时间为 19 日下午14:35 前后,截至发稿,故障已经持续超一小时。目前故障原因和具体恢复时间尚不明确。

(蓝点网,图:V2EX)

——————

除网易云音乐外,网易方面同时崩溃的还有:

- 网易官网 netease.com (解析到杭州网易 IP)
- 网易集团官网 corp.163.com (502,融合 CDN)
- 网易体育 sports.163.com (502,融合 CDN)
- 网易严选 you.163.com (客户端正常,网页版 SSL 错误)
- 网易汽车 auto.163.com
- 网易公开课 open.163.com
- 网易科技 tech.163.com

网易门户网站 www.163.com (解析到杭州网易 IP)此前同样受到故障影响,当前访问会跳转至 m.163.com (融合 CDN)且可正常访问。

网易游戏、网易邮箱、网易新闻等服务均正常运行。

——————

网易方面,正常运行的服务,如m.163.com,由国内其他厂商提供 CDN 服务。而此次故障的服务,如网易云音乐,所有 IP 均解析到贵州,似乎并未使用第三方 CDN。

——————

19 日 17:00 起,本频观察到上述服务正陆续恢复中。

网易云音乐于 17:04:28 起间歇性恢复,但仍存在不稳定情况。
一个小站的自留地
ChatGPT 出现大规模长时间的全球宕机 OpenAI 的 ChatGPT 目前正在经历全球范围的部分宕机,多个平台的用户报告了问题,包括网页版、移动应用和桌面应用。截至发稿,本次故障已经持续约 4 小时。 据 DownDetector 报告,问题始于北京时间 6 月 4 日下午约 14:30。受影响的用户遇到了「500 内部服务器错误」的提示。在宕机报告平台DownDetector 上,世界各地均有故障报告。 根据 OpenAI 的状态页面,ChatGPT 正在经历重大宕机,OpenAI 于 6…
ChatGPT 遭遇 6 小时全球性重大故障

2024 年 8 月 15 日,OpenAI 旗下广受欢迎的 AI 聊天机器人 ChatGPT 经历了一次严重的全球性故障,影响了数百万用户。

故障始于美国东部时间上午 9:30 左右,直到下午 4:15 才恢复正常,持续约 6 小时 45 分钟。根据中断跟踪网站 Downdetector 的数据,用户报告的问题数量在美东时间中午 12 时左右达到峰值。

大多数用户在这段时间内无法访问 ChatGPT 平台,一些用户还遇到了 OpenAI 网站或 ChatGPT 应用程序的问题。社交媒体上充斥着用户反馈连接问题的帖子,反映出此次故障的广泛影响。

OpenAI 在官方声明中确认了此次中断,表示「部分用户无法使用 ChatGPT」。公司随后发布更新,称已发现问题并正在积极处理,但并未透露具体的故障原因。

(Downdetector、OpenAI)
一个小站的自留地
DeepSeek 启用上下文硬盘缓存技术,大模型的价格再降低一个数量级 8 月 2 日起, DeepSeek API 将默认启用上下文硬盘缓存技术,把预计未来会重复使用的内容,缓存在分布式的硬盘阵列中。如果输入存在重复,则重复的部分只需要从缓存读取,无需计算。该技术不仅降低服务的延迟,还大幅削减最终的使用成本。 缓存命中的部分,DeepSeek 费用为 0.1元 /百万 tokens。至此,大模型的价格再降低一个数量级。 硬盘缓存服务已经全面上线,用户无需修改代码,无需更换接口,硬盘缓存服务将自动运…
Anthropic 推出 Claude 提示缓存功能,可大幅降低成本

人工智能公司 Anthropic 于 8 月 14 日宣布,在其 API 上推出名为「提示缓存」(Prompt Caching)的新功能。该功能允许开发者在 API 调用之间缓存频繁使用的上下文信息,从而为 Claude 模型提供更丰富的背景知识和输出示例,同时显著降低成本和延迟。

提示缓存功能目前已在 Claude 3.5 Sonnet 和 Claude 3 Haiku 模型的公测版中提供。对于长提示,该功能可以将成本降低高达 90%,延迟降低高达 85%。Anthropic 表示,支持 Claude 3 Opus 模型的缓存功能即将推出。

该功能适用于多种场景,包括:

- 对话代理:减少长时间对话中的成本和延迟
- 代码辅助:通过保留代码库摘要来改进自动补全和问答功能
- 大型文档处理:在不增加响应延迟的情况下处理长篇内容
- 详细指令集:提供更多指令和示例来优化 Claude 的响应

Anthropic 为缓存的提示采用了新的定价模式。写入缓存的成本比基本输入令牌价格高 25%,而使用缓存内容的成本仅为基本价格的 10%。缓存的有效期为 5 分钟,每次使用都会重置计时。

DeepSeek 和 Gemini 都在早前宣布支持了上下文缓存,其中DeepSeek 的上下文缓存时间为约 24 小时。

(Anthropic)
一个小站的自留地
CrowdStrike 发布 Channel File 291 事件根因分析报告 网络安全公司 CrowdStrike 近日发布了 Channel File 291 事件的详细技术根因分析报告。该事件发生于 2024 年 7 月 19 日,导致全球约 850 万台 Windows 系统崩溃,影响了交通、金融、医疗、零售等多个行业。 报告指出,事件源于多个技术因素的叠加。2024 年 2 月发布的 Falcon 传感器 7.11 版本引入了新的 IPC(进程间通信)模板类型,用于检测滥用命名管道的新型攻击技术。然而,该模板类型定义了…
GitHub 全球宕机 36 分钟,Copilot 等服务全部瘫痪

北京时间 8 月 16 日 07:02 至 07:38,GitHub 遭遇全球性宕机,所有服务对全体用户不可用,包括代码托管、Pages、Actions、Packages 以及 AI 代码助手 Copilot。

GitHub 表示,此次宕机源于一项影响数据库基础设施内部流量路由的配置变更,导致关键服务意外失去数据库连接。GitHub 通过回滚该变更并确认恢复数据库连接来缓解事件影响。北京时间 07:38,流量恢复,所有服务重新正常运作。

软件行业对 GitHub 高度依赖。许多项目的软件分发、静态网站托管、持续集成等关键功能都依赖 GitHub 提供的服务。

GitHub 强调此次事件未造成数据丢失或损坏,并承诺在未来几天内提供更详细的调查报告。
一个小站的自留地
Apple Intelligence 首轮测试启动,暂不支持中国大陆及欧盟设备 Apple 于 7 月 30 日向开发者推送了 iOS 18.1、iPadOS 18.1 和 macOS Sequoia 15.1 的首个测试版,正式启动 Apple Intelligence 功能的首轮测试。 这些测试版仅面向支持 Apple Intelligence 的设备推送,包括非中国大陆和欧盟销售的 iPhone 15 Pro 和 iPhone 15 Pro Max, 以及搭载 M1 及更高版本芯片的 iPad 和…
苹果即将向开发者开放 iPhone NFC 权限

苹果发布公告,宣布将面向开发者开放 iPhone 的 NFC 芯片访问权限,开发者将可以使用安全元件在其应用内使用 NFC 功能。

苹果介绍,为了将这一新解决方案整合到 iPhone 应用中,开发人员需要与 Apple 签订商业协议,请求 NFC 和安全元件权限,并支付相关费用,确保只有满足行业和监管要求,并符合苹果安全和隐私标准的开发者才能访问相关 API。

NFC 和安全元件 API 会在即将推出的 iOS 18.1 测试版中向澳大利亚、巴西、加拿大、日本、新西兰、英国和美国的开发者开放,后续还会有更多地区支持。

(Apple)
一个小站的自留地
据财联社,当地时间周日(8月11日)晚间,特斯拉CEO埃隆·马斯克在X平台上发帖称,旗下xAI公司的人工智能模型Grok 2的测试版本即将发布。 截至目前,xAI已经推出了Grok 1和升级版Grok 1.5,而即将发布的Grok 2则是在此上述基础上进行了进一步升级。 上个月时,马斯克就曾证实Grok 2将在几周内发布。在回答用户关于新模型训练数据的问题时,马斯克称Grok 2在性能上进行了全面升级和优化,拥有「巨大的改进」。Grok 2测试版本的发布,标志着该模型距离正式商用又迈出一步。
xAI 正式发布 Grok-2 AI 模型

xAI 公司已正式发布 Grok-2 AI 模型,这是其 Grok 系列的最新版本。此次发布包括 Grok-2 和 Grok-2 mini 两个版本,均在 X 平台(原 Twitter)上以测试版形式推出。

Grok-2 相比前代模型有显著提升:

- 增强了聊天、编码和推理能力
- 新增图像生成功能,可在 X 平台上创建图像
- 性能有望超越当前主流 AI 模型

目前,Grok-2 仅向 X 平台的 Premium 和 Premium+ 订阅用户开放。xAI 计划于本月晚些时候推出企业版 API。

xAI 表示,将把 Grok-2 集成到 X 平台的多项功能中,包括增强搜索、帖子分析和回复功能等。公司希望通过 Grok-2 的开发,推动 AI 与人类价值观的进一步对齐。

x.ai
一个小站的自留地
据 ChatGPT 官方 X 账号,ChatGPT 已经于上周起上线了新的模型,这一新模型属于 GPT-4o 家族,并将最快于明日上线 API。 有消息称,这一新模型是此前在 LMSYS 大模型竞技场上匿名测试的anonymous-chatbot。 —————— 此前,Claude 3.5 Opus 和 Gemini 2 都被确认于今年内发布,但未有具体时间表。 有预测称 Claude 3.5 Opus 已经完成训练,发布时间大约在 11 月前后,但也可能提前。 Google 方面,此前发布的 Gemini…
OpenAI 新 GPT-4o 模型重夺 LMSYS Chatbot Arena 榜首

OpenAI 近日更新了 ChatGPT 背后的 GPT-4o 模型,新版本在 LMSYS Chatbot Arena 测试中以 1314 分的成绩重新夺回第一名,超越了谷歌的 Gemini-1.5-Pro-Exp 模型。

此次更新的主要改进包括:

- 编码能力显著提升,得分提高 30 分
- 指令跟随能力增强
- 处理复杂提示的能力提升

新模型在各项分类排名中均位列第一。OpenAI 已将新版本命名为 chatgpt-4o-latest,并在 API 中提供使用。
Back to Top