Anthropic 于 2024 年 9 月 4 日宣布推出面向企业用户的新订阅计划 Claude Enterprise,旨在为需要更多管理控制和增强安全性的企业客户提供服务。这一举措将使 Anthropic 直接与 OpenAI 的 ChatGPT Enterprise 展开竞争。
据 TechCrunch 报道,Claude Enterprise 允许企业将专有的公司知识上传至 Anthropic 的 AI 聊天机器人 Claude。Claude 随后可以分析这些信息,回答相关问题,创建图形和简单网页,或充当公司特定的 AI 助手。Claude Enterprise 的上下文窗口扩展至 500K 个词元,使得 Anthropic 的模型能够在一次提示中处理多达 20 万行代码、数十个 100 页文档或两个小时的音频转录。
此外,Claude Enterprise 还包括 GitHub 集成功能,使工程团队能够将其 GitHub 存储库与 Claude 同步。这一集成功能可用于快速培训新工程师、创建新功能或解决错误等任务。
TechCrunch 引述 Anthropic 产品负责人 Scott White 的话称,Claude Enterprise 的具体定价尚未公开,但预计将高于 Anthropic 的 Team 计划(每位成员每月 30 美元)。White 解释道,由于企业客户可以从 Claude 中获得更多收益,因此其价格也相应更高。在早期测试阶段,包括 GitLab、Midjourney 和 IG Group 等知名企业客户已经开始使用 Claude Enterprise,并反映出显著的生产力提升。
智谱 AI 近日发布了三款新的大型语言模型及其 API,包括 GLM-4-Plus、GLM-4V-Plus 和 CogView-3-Plus。
- 语言基座模型 GLM-4-Plus:在语言理解、指令遵循及长文本处理等方面性能全面提升,保持国际领先水平。该模型已上线智谱 AI 开放平台(bigmodel.cn),并将在「清言 APP」中提供体验。
- 文生图基座模型 CogView-3-Plus:性能接近当前最优的 MJ-V6 和 FLUX 等模型。该模型已上线智谱 AI 开放平台提供 API 服务,并正式上线「清言 APP」。
- 图像/视频理解基座模型 GLM-4V-Plus:具备卓越的图像理解能力,并具有基于时间感知的视频理解能力。该模型已上线智谱 AI 开放平台,成为国内首个通用视频理解模型 API。
除此之外,KDD 2024 大会上,智谱还宣布了其他更新:
- 视频生成基座模型 CogVideoX:在发布并开源 2B 版本后,5B 版本也正式开源。其性能进一步增强,成为当前开源视频生成模型中的最佳选择。
- 「清言 APP」上线视频通话功能:这是国内首个面向 C 端用户开放的 AI 视频通话服务,具备实时推理能力。该功能将于 2024 年 8 月 30 日上线,首批面向部分用户开放,接受外部申请。
- GLM-4-Flash API:智谱 AI 宣布将 GLM-4-Flash API 全面免费开放,以支持用户快速构建专属模型和应用。同时,该服务还提供微调功能以满足不同需求。
2024 年 8 月 28 日,谷歌 AI Studio 产品总监 Logan Kilpatrick 在 X 平台宣布推出三款实验性 Gemini 模型:
- Gemini 1.5 Flash-8B:这是 Gemini 1.5 Flash 的精简版本,拥有 80 亿参数,专为多模态任务设计,包括大容量任务和长文本摘要。
- Gemini 1.5 Pro Exp-0827:该模型主要增强编程和复杂提示词功能,现已通过 Google AI Studio 和 Gemini API 免费提供。
- Gemini 1.5 Flash Exp-0827:在性能上有显著提升,排名从之前的第 23 位提升至第 6 位。
据 VentureBeat 报道,新的 Gemini 1.5 Pro Exp 0827 型号在各方面都优于 8 月初发布的实验型号,目前在 LMSYS 上的排名为第 2 位,仅次于 OpenAI 的 chatgpt-4o-latest 模型。
此外,从 9 月 3 日起,系统将自动将对 gemini-1.5-pro-exp-0801 模型的请求重定向到新的 gemini-1.5-pro-exp-0827 模型,旧型号将从 Google AI Studio 和 API 中移除。
用户可以通过 Gemini API 和 Google AI Studio 访问上述两个模型,名称分别为 gemini-1.5-pro-exp-0827 和 gemini-1.5-flash-exp-0827。
(Google)
IBM 近日宣布将彻底关闭其在中国的研发部门,包括 IBM 中国开发中心(CDL)和 IBM 中国系统中心(CSL),涉及员工超过 1000 人。此举意味着 IBM 在国内彻底裁撤了研发部门。
据本频信源拿到的会议全文,IBM 全球企业系统开发副总裁 Jack Hergenrother 在会议中表示,为了支持全球客户和业务战略,IBM 基础设施部门决定将中国系统实验室的开发任务转移到其他海外 IBM 基础设施地点。他强调,这一决定是基于市场动态和激烈竞争的影响,近年来 IBM 在中国的基础设施业务有所下降。
IBM Z 和 Linux One 总经理 Ross Moury 以及存储工程副总裁 Danny Mace 也在会议中发言,感谢员工的贡献,并表示这是一个艰难但必要的决定。
据《科创板日报》报道,CDL 和 CSL 分别成立于 1999 年和 2004 年,是 IBM 在中国的重要研发基地。IBM 方面表示,此次调整是为了聚焦混合云和人工智能等高增长领域,以适应市场变化。
据新智元报道,8 月 25 日晚间,IBM 中国区突然关闭了研发和测试岗位的访问权限。在被收回权限之前,这些员工均正常上下班,甚至有部分员工还在加班。关闭权限后,他们被移除出工作群组,无法登录公司内网,但仍可以访问邮件。
一线经理于 8 月 25 日晚上收到裁员通知,而普通员工直到 8 月 28 日早上才正式被告知。据报道,员工在一场仅持续三分钟的全员会议上被告知裁员决定,会议结束后直接切断了连接。一位员工表示:「大家听完之后很气愤,感觉受到了侮辱。」
IBM 官方以协商离职的方式处理此次裁员,并提供了分级的补偿方案:
- 若在 2024 年 9 月 13 日之前签字,将获得 N+3 的补偿;
- 在 9 月 13 日至 9 月 20 日之间签字,补偿金额为 N+1;
- 2024 年 10 月 31 日之后签字则没有补偿。
此次裁员并不涉及咨询及售后等支持团队。
近年来,IBM 在中国的经营压力加大。2023 年,IBM 全球营收为 619 亿美元,同比增长 2%,但中国市场收入却骤降 19.6%。截至 2023 年底,IBM 共拥有约 282,200 名员工,相比 2022 年减少 6100 人。一位大连的 IBM 员工提到:「很多员工已经一年多没太有项目可做,这次裁员只能说 IBM 已经很良心了,没见过哪个公司能白养员工一两年,还正常发工资。」
对于此次裁员是否与 AI 替代人工相关,许多员工表示否认。内部知情人士透露,目前 AI 替代人力的项目在 IBM 内部尚属少数,短时间内研发人员的工作仍无法被 AI 替代。此外,此次裁员的筹备工作早在三四年前就已启动。
发布会上有望带来 iPhone 16 系列手机、Apple Watch Series 10 以及 AirPods 4 等新品。
苹果还计划在今年晚些时候开始将其 Mac 换用M4 处理器,但 Mac 更新通常要等到每年 iPhone 发布后约一个月才会发布。
2024 年 8 月 26 日 17:30 左右,上海电信部分宽带业务发生异常。对此,上海电信表示正在全力抢修排障,并对用户所带来的不便深表歉意。
据 IT 之家报道,当天有大量网友在社交平台反馈上海电信宽带网络出现问题。18:00 左右,不少用户反映宽带信号消失,甚至无法拨打电信 10000 号进行报修。一些网友称,他们最初怀疑是自家网络出现问题,甚至联系了维修师傅,后来才得知是全市范围内的网络故障。
相关话题登上微博热搜第二。在「中国电信上海客服」微博下,不少用户已留言反馈。
上海电信回应称,17时30分左右,上海电信部分宽带业务发生异常,经紧急抢修,已于18时05分全面恢复正常。电信宽带受理人员对此表示,是电信数据有问题导致了断网情况。
(图源网络)
Ideogram 2.0 现已向所有用户免费开放,用户可在 ideogram.ai 平台和全新 iOS 应用上使用这一最新的文本到图像生成模型。
官方表示,Ideogram 2.0 不仅增强了创作能力,还推出了 iOS 应用、API 和视觉搜索系统。用户可以选择五种不同风格生成图像,包括一般风格、写实风格、设计风格、3D 风格和动漫风格,满足不同创作需求。其写实风格能够生成近乎真实的照片,设计风格则显著提升了文本渲染的准确性。
在功能方面,用户现在可以在生成图像时选择特定的颜色调色板,以确保品牌一致性和艺术控制。此外,Ideogram 还推出了公测版 API,为开发者提供灵活的集成方案。
Ideogram 2.0 允许用户每天生成多达 40 张图像,而付费计划则提供更多优先生成的积分,帮助企业和内容创作者更高效地进行视觉内容制作。该平台还提供多种订阅选项,从每月 7 美元的基础计划到 48 美元的专业计划不等,每个计划都提供不同数量的优先生成积分和其他福利。
——————
Midjourney 宣布其网站正式向所有用户开放
在面对来自 Elon Musk 的 xAI 及其 Grok 2 模型,以及 Ideogram 2 等竞争对手的挑战下,Midjourney 选择通过开放网站来吸引更多用户。
Midjourney 近日宣布其网站正式向所有用户开放,新用户可免费生成约 25 张 AI 图像。这一举措标志着 Midjourney 摆脱了此前仅限于 Discord 平台使用的限制,为更广泛的用户群体提供了探索其 AI 图像生成功能的机会。
据 VentureBeat 报道,Midjourney 联合创始人兼首席执行官 David Holz 在 Discord 上透露了这一消息。这一变化被许多用户视为从「Discord 孤岛」中解放出来,因为过去 Discord 的注册要求限制了不少人尝试 Midjourney 服务。
Google 近日对其 AI Studio 和 Gemini API 进行了更新,将 PDF 文件的上传限制从原先的 300 页大幅提升至 1000 页或 2GB。
Google 利用 Gemini 的文本理解和多模态功能来处理这些文档,每页支持一张图片。此外,用户可以在上传后通过文件 ID 进行多次请求,文件在默认情况下会保留 48 小时。
微软近日推出了新一代人工智能模型系列 Phi-3.5,包括 Phi-3.5-MoE-instruct、Phi-3.5-mini-instruct 和 Phi-3.5-vision-instruct 三款模型。这一系列模型旨在满足从基础推理到复杂推理及多模态任务等多种 AI 应用需求。
- Phi-3.5 Mini Instruct 是一款轻量级 AI 解决方案,专为计算资源有限的场景设计。尽管参数量仅为 3.8 亿,该模型仍能处理代码生成、数学问题解决及逻辑推理等复杂任务。它支持 128k 的词元上下文长度,能有效管理长时间交互,并在多语言和多轮对话任务中表现优异。
- Phi-3.5 MoE是微软首次尝试的专家混合(Mixture of Experts)模型,将多种模型类型结合为一。该模型总计拥有 420 亿个参数,在任何给定时间内激活 66 亿个参数,确保高效性能。Phi-3.5 MoE 在代码、数学及多语言理解等领域表现出色,在一些基准测试中超过了 GPT-4 等更大模型。
- Phi-3.5 Vision Instruct 专注于需要文本与图像处理能力的任务。这款模型在通用图像理解、光学字符识别、图表与表格理解以及视频摘要等领域表现突出。与其他两款模型相同,Vision Instruct 也支持 128k 的词元上下文长度,能够处理复杂的多帧视觉任务。
微软将所有三款 Phi-3.5 模型以 MIT 许可证形式开源发布,允许开发者自由使用、修改和分发这些模型。据报道,这些模型在多个基准测试中表现出色,超越了谷歌和 Meta 的同类模型,为用户提供了更强的推理和多模态任务支持。
据 Reddit 用户讨论,Phi-3.5 是目前最「安全」的模型之一,在安全性和有效性方面表现突出。微软声称,Phi-3.5 系列能够有效防止生成冒犯性内容。
作为补偿,8 月 22 日 0 点至 24 点,所有用户可以免费领取 15 天会员。用户可在最新版的 WPS 客户端搜索关键词「
AI办公
」,即可获取领取链接,具体规则见领取页面。从官方公告算起,本次故障历时约 4 小时。但根据用户反馈,本次故障部分用户最长受影响时间超过 7 小时。
目前暂无关于故障原因的更多消息。
8 月 21 日上午,多名网友反馈金山文档出现服务故障,导致 WPS 共享文档无法正常打开使用。这一情况迅速引起了广泛关注,许多用户在 WPS 客户服务官方微博下留言询问情况。
根据 IT 之家报道,WPS 客户服务官方在微博回应表示:「今日上午,WPS 出现服务故障,导致部分用户使用受到影响,目前已在逐步恢复中。如您在使用 WPS 的过程中遇到任何问题,请及时与我们联系。抱歉给大家工作日带来不便」。
本频于 21 日上午 8 时接到金山文档分享链接无法打开的报告,界面提示为「文件链接无效」。
据媒体报道,这已经是 WPS 今年第三次用户有感知的服务故障。今年7 月 8 日,金山 WPS 服务出现服务问题,包括但不限于云文档网站无法打开、小程序在线文档无法加载、WPS 无法登录账号等,而在6月28日下午,也曾有大量网友反映「WPS崩了」,金山文档无法打开。当时,金山办公回应媒体称,崩溃原因可能与云服务异常有关。
(IT 之家)
——————
知情人士称,网易此次故障原因是云存储运维操作导致故障。本频信源确认了配图消息记录的真实性。该聊天确实来自网易员工。
本频信源表示,本次故障与机房迁移无关。贵州机房切流早在六月份就已完成。部分媒体的报道有差错。
网易云音乐在 B 站动态称,作为补偿,8月20日0-24时,网易云音乐搜「
畅听音乐
」,可领取7天会员权益。8 月 19 日下午,网易云音乐出现大范围服务器故障。网页版出现 HTTP 502 网关错误,客户端播放歌曲时提示「获取播放信息失败」,几乎所有平台均无法正常访问和使用。
网易云音乐官方于当日 15:22 在微博发布 声明 称:「因基础设施故障,导致网易云音乐各端无法正常使用,我们正在加紧修复,非常抱歉。感谢大家的等待。」
本频综合信源表示,此次故障发生时间为 19 日下午14:35 前后,截至发稿,故障已经持续超一小时。目前故障原因和具体恢复时间尚不明确。
(蓝点网,图:V2EX)
——————
除网易云音乐外,网易方面同时崩溃的还有:
- 网易官网 netease.com (解析到杭州网易 IP)
- 网易集团官网 corp.163.com (502,融合 CDN)
- 网易体育 sports.163.com (502,融合 CDN)
- 网易严选 you.163.com (客户端正常,网页版 SSL 错误)
- 网易汽车 auto.163.com
- 网易公开课 open.163.com
- 网易科技 tech.163.com
网易门户网站 www.163.com (解析到杭州网易 IP)此前同样受到故障影响,当前访问会跳转至 m.163.com (融合 CDN)且可正常访问。
网易游戏、网易邮箱、网易新闻等服务均正常运行。
——————
网易方面,正常运行的服务,如m.163.com,由国内其他厂商提供 CDN 服务。而此次故障的服务,如网易云音乐,所有 IP 均解析到贵州,似乎并未使用第三方 CDN。
——————
19 日 17:00 起,本频观察到上述服务正陆续恢复中。
网易云音乐于 17:04:28 起间歇性恢复,但仍存在不稳定情况。
2024 年 8 月 15 日,OpenAI 旗下广受欢迎的 AI 聊天机器人 ChatGPT 经历了一次严重的全球性故障,影响了数百万用户。
故障始于美国东部时间上午 9:30 左右,直到下午 4:15 才恢复正常,持续约 6 小时 45 分钟。根据中断跟踪网站 Downdetector 的数据,用户报告的问题数量在美东时间中午 12 时左右达到峰值。
大多数用户在这段时间内无法访问 ChatGPT 平台,一些用户还遇到了 OpenAI 网站或 ChatGPT 应用程序的问题。社交媒体上充斥着用户反馈连接问题的帖子,反映出此次故障的广泛影响。
OpenAI 在官方声明中确认了此次中断,表示「部分用户无法使用 ChatGPT」。公司随后发布更新,称已发现问题并正在积极处理,但并未透露具体的故障原因。
(Downdetector、OpenAI)
人工智能公司 Anthropic 于 8 月 14 日宣布,在其 API 上推出名为「提示缓存」(Prompt Caching)的新功能。该功能允许开发者在 API 调用之间缓存频繁使用的上下文信息,从而为 Claude 模型提供更丰富的背景知识和输出示例,同时显著降低成本和延迟。
提示缓存功能目前已在 Claude 3.5 Sonnet 和 Claude 3 Haiku 模型的公测版中提供。对于长提示,该功能可以将成本降低高达 90%,延迟降低高达 85%。Anthropic 表示,支持 Claude 3 Opus 模型的缓存功能即将推出。
该功能适用于多种场景,包括:
- 对话代理:减少长时间对话中的成本和延迟
- 代码辅助:通过保留代码库摘要来改进自动补全和问答功能
- 大型文档处理:在不增加响应延迟的情况下处理长篇内容
- 详细指令集:提供更多指令和示例来优化 Claude 的响应
Anthropic 为缓存的提示采用了新的定价模式。写入缓存的成本比基本输入令牌价格高 25%,而使用缓存内容的成本仅为基本价格的 10%。缓存的有效期为 5 分钟,每次使用都会重置计时。
DeepSeek 和 Gemini 都在早前宣布支持了上下文缓存,其中DeepSeek 的上下文缓存时间为约 24 小时。
(Anthropic)
北京时间 8 月 16 日 07:02 至 07:38,GitHub 遭遇全球性宕机,所有服务对全体用户不可用,包括代码托管、Pages、Actions、Packages 以及 AI 代码助手 Copilot。
GitHub 表示,此次宕机源于一项影响数据库基础设施内部流量路由的配置变更,导致关键服务意外失去数据库连接。GitHub 通过回滚该变更并确认恢复数据库连接来缓解事件影响。北京时间 07:38,流量恢复,所有服务重新正常运作。
软件行业对 GitHub 高度依赖。许多项目的软件分发、静态网站托管、持续集成等关键功能都依赖 GitHub 提供的服务。
GitHub 强调此次事件未造成数据丢失或损坏,并承诺在未来几天内提供更详细的调查报告。
苹果发布公告,宣布将面向开发者开放 iPhone 的 NFC 芯片访问权限,开发者将可以使用安全元件在其应用内使用 NFC 功能。
苹果介绍,为了将这一新解决方案整合到 iPhone 应用中,开发人员需要与 Apple 签订商业协议,请求 NFC 和安全元件权限,并支付相关费用,确保只有满足行业和监管要求,并符合苹果安全和隐私标准的开发者才能访问相关 API。
NFC 和安全元件 API 会在即将推出的 iOS 18.1 测试版中向澳大利亚、巴西、加拿大、日本、新西兰、英国和美国的开发者开放,后续还会有更多地区支持。
(Apple)
xAI 公司已正式发布 Grok-2 AI 模型,这是其 Grok 系列的最新版本。此次发布包括 Grok-2 和 Grok-2 mini 两个版本,均在 X 平台(原 Twitter)上以测试版形式推出。
Grok-2 相比前代模型有显著提升:
- 增强了聊天、编码和推理能力
- 新增图像生成功能,可在 X 平台上创建图像
- 性能有望超越当前主流 AI 模型
目前,Grok-2 仅向 X 平台的 Premium 和 Premium+ 订阅用户开放。xAI 计划于本月晚些时候推出企业版 API。
xAI 表示,将把 Grok-2 集成到 X 平台的多项功能中,包括增强搜索、帖子分析和回复功能等。公司希望通过 Grok-2 的开发,推动 AI 与人类价值观的进一步对齐。
(x.ai)