一个小站的自留地

起于小站，终于生活。
现实之外，一个普通人的思考。

博客地址：ygxz.in
讨论组：https://t.me/ygxz_group

16:03 · 2024年7月19日 · 周五

一个小站的自留地

ChatGPT 出现大规模长时间的全球宕机 OpenAI 的 ChatGPT 目前正在经历全球范围的部分宕机，多个平台的用户报告了问题，包括网页版、移动应用和桌面应用。截至发稿，本次故障已经持续约 4 小时。据 DownDetector 报告，问题始于北京时间 6 月 4 日下午约 14:30。受影响的用户遇到了「500 内部服务器错误」的提示。在宕机报告平台DownDetector 上，世界各地均有故障报告。根据 OpenAI 的状态页面，ChatGPT 正在经历重大宕机，OpenAI 于 6…

Windows出现全球大规模蓝屏事件

2024年7月19日,全球多地Windows用户遭遇大规模蓝屏故障,导致银行、航空、媒体等行业业务中断。事件始于日本时间13:30左右,随后迅速蔓延至澳大利亚、欧洲和美国。故障源于网络安全公司CrowdStrike的软件更新问题。受影响的Windows设备启动时会显示蓝屏,并进入恢复模式或重启循环。

澳大利亚国家广播公司、联邦银行、澳新银行、Qantas航空等多家企业系统受到影响。英国Sky News一度被迫中断直播。美国多家航空公司,包括Frontier、United、Delta和American Airlines被迫取消或延误航班。德国两家医院取消了非紧急手术,以色列有15家大型医院受到影响。阿拉斯加州的多个911紧急呼叫中心也遭受冲击。

CrowdStrike于当日确认问题与"内容部署"有关,并提供了临时解决方案。澳大利亚国家网络安全协调员Michelle McGuinness称,这是第三方软件平台的技术问题,非网络安全事件。澳大利亚政府召开紧急会议应对此次事件,总理安东尼·阿尔巴尼斯表示政府正与国家网络安全协调机关密切合作。

目前,IT专家建议通过安全模式启动并删除C:\Windows\System32\drivers\CrowdStrike目录中的"C-00000291*.sys"文件作为临时解决方案。CrowdStrike首席执行官George Kurtz在接受NBC采访时承认,"有些系统可能需要一段时间才能自动恢复"。据报道,全球超过1000班航班被取消,某些公司有高达70%的笔记本电脑无法启动。

此次事件还影响了克罗地亚的中央健康信息系统和空管系统,以及马来西亚的重要部门,包括电视台、机场和银行。英国杂货店Waitrose短暂停止了非接触式支付。

（综合The Guardian、Windows Latest、BBC News、CNBC、NBC News报道）

——————

Microsoft 365全球服务中断

2024年7月18日21:56(UTC),微软Azure云服务在美国中部地区开始出现故障,随后于7月19日05:56(中国时间)扩展至Microsoft 365应用程序和服务,导致全球范围内的大规模服务中断,影响众多企业用户,其中航空业受创最为严重。

美国多家航空公司受到严重影响。Frontier Airlines一度暂停所有航班,美国联合航空、美国航空和达美航空发布全面停飞指令。欧洲大型航空公司Ryanair报告IT问题影响航班起飞。德国柏林机场、英国爱丁堡机场、荷兰史基浦机场等多个国际机场的登机系统也出现故障。在亚洲,日本春秋航空、韩国济州航空、菲律宾宿雅太平洋航空和亚洲航空均报告系统问题。

此外,伦敦证券交易所报告全球性技术问题,导致新闻无法发布。澳大利亚国民银行、澳新银行、联邦银行、本迪戈银行和新科银行的移动银行应用受到影响。零售业方面,澳大利亚Woolworths和Coles超市的自助结账和在线订单系统无法使用。英国杂货店Waitrose也短暂停止了非接触式支付。

微软表示正在调查原因并采取措施恢复服务。美国联邦航空管理局(FAA)发言人Jeannie Shiffer表示正在密切监控影响美国航空公司IT系统的技术问题。美国交通部长布蒂吉格称,正在监控航班取消和延误情况,要求航空公司履行对乘客的责任。

截至7月19日,微软表示其Azure云服务已恢复正常,但Microsoft 365服务仍有残余影响。

CrowdStrike拥有约24,000名客户,主要为大型企业,此次事件影响的个人电脑数量难以估计,显示了现代社会对云服务和技术平台的高度依赖。

（综合路透社、cnBeta、The Verge、IT之家报道）

08:20 · 2024年7月19日 · 周五

一个小站的自留地

「upcoming-gpt-mini」可能是一个轻量级模型，旨在替代 GPT-3.5 或作为一个设备端模型使

OpenAI 推出新一代小型 AI 模型 GPT-4o mini

OpenAI 于凌晨发布了 GPT-4o mini 模型,旨在取代 GPT-3.5 Turbo 的小型 AI 模型。GPT-4o mini 的主要特点如下:

1. 性能卓越:在多项基准测试中均优于 GPT-3.5 Turbo 和同类小型模型。如在 MMLU 测试中得分 82%,高于 Gemini Flash 的 77.9% 和 Claude Haiku 的 73.8%。在编程能力测试 HumanEval 上,更是以 87.2% 的得分超越了 GPT-4。

2. 价格优势:每百万输入 token 仅需 15 美分,输出 token 60 美分,比 GPT-3.5 Turbo 便宜 60% 以上。OpenAI CEO Sam Altman 表示,与 2022 年最先进的 text-davinci-003 模型相比,GPT-4o mini 性能大幅提升,成本降低了 100 倍。（编注：约合输入 1¥/M Token，输出 4.4 ¥/M Token，略高于DeepSeek API 每百万输出 Tokens 2元）

3. 多模态能力:支持文本和图像输入输出,未来将支持音频和视频处理。

4. 长上下文:支持 128K token 的上下文窗口,每个请求最多支持 16K 个输出 token。

5. 安全性提升:采用新的「指令层次结构」方法,提高了抵御越狱和提示注入的能力。

6. 应用广泛:适用于需要低延迟、高频调用的场景,如客户服务聊天机器人等。

7. 即刻可用:从今天起,ChatGPT 的免费、Plus 和 Team 用户均可使用 GPT-4o mini,企业用户下周可用。API 用户立即可用。

尽管 GPT-4o mini 在多项测试中表现出色,但 OpenAI 并未公开其具体参数规模,仅表示与 Llama 3 8b、Claude Haiku 和 Gemini 1.5 Flash 等小型模型处于同一量级。这意味着在某些复杂任务或需要深度推理的场景中,GPT-4o mini 可能无法完全替代 GPT-4 等大型模型。

OpenAI 表示,GPT-4o mini 的发布旨在让更多人负担得起并使用先进的 AI 技术,推动 AI 在更多领域的应用。这一发布也标志着 ChatGPT 正式进入「4」时代,GPT-3.5 或将成为历史。

（OpenAI、TechCrunch、Reuters）

21:17 · 2024年7月18日 · 周四

一个小站的自留地

6 月 22 日，DeepSeek 官网的代码助手上线了代码在线执行功能。用户只需访问 coder.deepseek.com，选择「代码助手 V2」，输入提示词后点击「运行 HTML」，即可在浏览器中直接运行生成的代码。该功能目前支持 HTML、CSS 和 JavaScript，可实现网页设计、经典小游戏、计算器、音乐播放器、数据可视化等多种应用。DeepSeek 表示，目前仅支持 HTML 解释器，未来可能会加入 Python 等其他语言支持。（DeepSeek）

DeepSeek-V2-0628 发布，位列全球开源模型榜首

据深度求索，美国时间 2024年7月16日，LMSYS 组织的大模型竞技场（Chatbot Arena）更新结果发布，DeepSeek-V2-0628 超越 Llama3-70B、Qwen2-72B、Nemotron-4-340B、Gemma2-27B 等开源模型，荣登全球开源模型榜首。（编注：分数位于 Claude 3 Opus 和 GPT-4-1106-Preview 之间）

在Chatbot Arena 的国内参与者中，DeepSeek-V2-0628 同样名列前茅，排名国内所有模型第二位。（编注：国内第一是闭源的零一万物旗舰模型 yi-large）与备受好评的 Qwen2-72B 开源模型相比，DeepSeek-V2-0628展现了更强的竞争力，排名高出 10 名。

据官方介绍， DeepSeek-V2-0628 相较于 0507 开源 Chat 版本，在代码数学推理、指令跟随、角色扮演、JSON Output 等方面能力全面提升。

DeepSeek-V2-0628 模型开源地址：https://huggingface.co/deepseek-ai/DeepSeek-V2-Chat-0628

10:40 · 2024年7月18日 · 周四

一个小站的自留地

新神秘模型现身LMSYS 大模型竞技场近日,AI 爱好者在 LMSYS Chatbot Arena 大模型竞技场上发现了两个新模型,名为"im-also-a-late-june-chatbot"和"late-june-chatbot"。这两个模型仅在平台的随机对战模式中出现,尚未被列入直接聊天的可选列表。多位用户在与模型交互后发现，当被问及身份时，这两个模型均自称是 Google 的 Gemma。考虑到模型的表现和命名方式，社区普遍推测这可能是 Gemma 2 的预览版本。然而，由于模型有时会产生幻觉，这一说法尚未得到确认。…

LMSYS 大模型竞技场再现多个神秘新模型，谷歌 Gemini 2 呼之欲出？

近日，LMSYS Chatbot Arena 大模型竞技场上相继出现多个神秘模型，引发 AI 社区广泛关注和讨论。这些模型目前仅在竞技场的「对战」环节随机出现，包括「upcoming-gpt-mini」、「column-u」、「column-r」、「eureka-chatbot」、「gemini-test」和「im-a-little-birdie」。

据多位用户反馈，「upcoming-gpt-mini」模型自称为 ChatGPT，并表示其创建者为 OpenAI。而「column-u」和「column-r」则拒绝透露任何身份信息。有分析认为，「upcoming-gpt-mini」可能是一个轻量级模型，旨在替代 GPT-3.5 或作为一个设备端模型使用。也有观点认为，该模型是 OpenAI 的下一代开源大模型。（编注：OpenAI 上一次开源大语言模型是 2020 年的 GPT-3）

对于「column-u」和「column-r」，社区观点分歧较大。一些用户认为这两个模型可能来自 Anthropic，是 Claude 3.5 Haiku 和 Opus 的新版本。也有人推测它们可能是 Meta 即将发布的 Llama 3 系列模型，其中「column-r」可能是传闻已久的 405B 参数版本。

然而，更多的证据似乎指向这两个模型可能来自 Cohere 公司。有用户发现，「column-u」和「column-r」对某些越狱提示词（jailbreak prompts）的反应与 Cohere 的 Command 模型相似。此外，这两个模型的命名方式也与 Cohere 的风格相符。

值得注意的是，一位疑似内部人士在社交媒体上透露，「column-u」和「column-r」实际上是 DeepSeek 公司的新模型。但截至发稿时，这一说法尚未得到官方确认。

据用户反馈，「eureka-chatbot」模型的表现与 Llama 3 8b 相似，其输出格式类似于 Gemini 和 Gemma。有趣的是，谷歌员工 Logan Kilpatrick 在社交媒体上暗示有「eureka 时刻」，这一巧合进一步增强了该模型可能来自谷歌的推测。

「gemini-test」的名称则直接暗示了它可能是谷歌 Gemini 系列的测试版本。有报道称，该模型实际上包含两个不同的版本，可能是 Gemini 2.0 的 Flash 和 Pro 版本，或者 Pro 和 Ultra 版本。在竞技场中，该模型会随机分配给用户，这使得准确评估单个模型的性能变得困难。

而「im-a-little-birdie」这个有趣的名称则引发了多种猜测。一些用户认为它可能是 OpenAI 的新模型，因为该公司此前曾使用类似的命名方式。也有人推测它可能是谷歌的另一个测试模型，名称中的「birdie（意为“小鸟”）」暗指 Twitter（现为 X）的标志，又可能与社交媒体 AI 应用相关。

与此同时，关于谷歌可能发布 Gemini 2 的消息也引起了广泛关注。近期，多个搜索引擎（除谷歌外）显示了一条描述：「Gemini 是一系列可以对文本、代码、图像、音频和视频进行推理的 AI 模型。了解 Gemini 1.0、1.5 和 2.0 的最新更新、基准和应用。」这一描述强烈暗示 Gemini 2.0 可能即将发布。

然而，谷歌 AI 团队的一位成员在社交媒体上表示，新的 Gemini 功能可能还需要几个月的时间。这似乎与搜索引擎显示的信息相矛盾。有网友指出，搜索引擎的 SEO 内容并不可信，此前 OpenAI 就出现过内部测试内容错误被搜索引擎抓取导致 GPT-4.5 被报道的乌龙。

以上内容仅为网友讨论摘要，本频无法对上述任何消息进行独立验证。

（综合自 Reddit、Twitter 相关讨论，因来源众多恕不一一标出，敬请读者自行甄别）

22:11 · 2024年7月17日 · 周三

一个小站的自留地

安全研究人员发现,除 polyfill.io 外,此次攻击还波及了 bootcdn.net、bootcss.com、staticfile.net 和 staticfile.org 等多个 CDN 服务。针对这一大规模攻击,多方已采取应对措施: - uBlock 的「Badware risks」过滤器已阻断了这些受影响站点的访问。 - 域名注册商 Namecheap 已关停 polyfill.io 和 polyfill.com 域名。 - Google 开始停止向使用 polyfill.io 的网站投放广告。…

供应链投毒事件新进展:调查曝光背后关联企业网络,爆料者遭威胁

一名博主发文揭露Staticfile、BootCDN和Polyfill等多家知名CDN服务背后可能由同一批关联企业操控。该研究者通过梳理域名备案信息和企业关系,发现这些CDN域名的备案公司可以通过股东或实际控制人关联起来,其中包括运营51[.]La站点统计平台的郑州紫田网络科技有限公司,以及一家名为Funnull的公司。

7月17日,该研究者在技术社区V2EX上发帖称,自从发布相关调查结果后,收到了据称来自相关公司的威胁邮件,要求删除文章。邮件声称「已经联系公安网监部门」。巧合的是,V2EX论坛当天出现无法访问的情况,引发猜测可能与CDN投毒事件曝光有关。

Staticfile是由七牛云原创的开源项目,提供免费CDN加速服务;BootCDN是Bootstrap中文网支持并维护的开源项目,提供前端开源库的CDN服务;Polyfill.io可根据浏览器User-Agent自动生成最小化的polyfill;51[.]La是国内知名的网站统计服务平台。Funnull即为博彩网站提供国内优化CDN服务的方能CDN。

本次事件导致V2EX 被攻击而宕机近 3 小时。据传，发布该文的博主个人博客和V2EX 的源站都收到了相当严重的 DDoS 攻击。

Src: https://t.me/c/1546153250/55215

18:19 · 2024年7月17日 · 周三

一个小站的自留地

关于攻击动机,业内人士提出了与近期实施的省间结算政策相关的推测。这一政策要求运营商对跨省数据传输进行费用结算。

中国移动执行「省间结算」政策，多地 IDC 业务受影响

中国移动近日开始执行「省间结算」政策，对 IDC 等用户实施跨省流量限制。根据流出的通知函，该政策自 2024 年 7 月 1 日起正式执行。通知要求 IDC 用户将内容分发节点带宽的本省流量率调整至 85%。

7 月 17 日起，多个省份的 IDC 商家已出现跨省限速情况。据报道，广东省内各中国移动网络线路 IDC 将执行 3% 的跨省限速比例，超出部分将采取强制丢包等措施。部分用户反映，受影响的 VPN 中转服务速度明显下降。

据悉，此次政策旨在规范 IDC 市场和打击 PCDN。消息称，该政策将有 18 个月的过渡期，期间将逐步提升省间结算价格。部分 IDC 服务商已发布声明，称正与运营商协商解决服务质量下降问题。有分析指出，这一政策可能引发法律争议，部分受影响客户考虑采取法律行动或更换其他运营商服务。

Ref1: https://www.txrjy.com/thread-1339956-1-1.html
Ref2: https://t.me/KuaiCheDao_Info/3210

16:33 · 2024年7月17日 · 周三

一个小站的自留地

通义千问 Qwen2 系列模型开源中国时间 6 月 7 日 0 点，通义千问宣布 Qwen2 系列模型开源，包括 0.5B、1.5B、7B、57B-A14B （使用 Apache 2.0 协议）和 72B （使用 Qianwen License 协议）等多个版本。技术参数方面，Qwen2 系列模型在各个尺寸都使用了 GQA (Generalized Query Attention)，并且除了中英文外，还使用了其他 27 种语言的训练数据。具体上下文处理能力如下： · 72B 和 7B 版本可处理…

阿里云发布新一代音频语言模型Qwen2-Audio

阿里云Qwen团队近日官宣了最新的大规模音频语言模型Qwen2-Audio。该模型在音频理解和交互能力方面取得显著进展，为语音助手、音频内容分析等应用领域开辟了新的可能性。

Qwen2-Audio的主要特点和创新如下：

1. 双模式交互：支持语音聊天和音频分析两种模式。在语音聊天模式下，用户可以直接与模型进行语音对话；在音频分析模式下，用户可以上传音频文件进行转录和分析。模型能够智能识别用户意图，在两种模式间无缝切换，无需用户手动操作。

2. 多样化音频处理能力：
- 语音识别与翻译
- 情感识别：能够识别语音中的愤怒、快乐、悲伤等情绪
- 声音分类
- 音乐分析：可分析音乐的节奏、节拍、类型和流派等特征

3. 复杂场景理解：在包含背景声音、多人对话和语音指令的复杂音频中，模型能准确理解指令并做出恰当响应。

4. 创新的训练方法：
- 预训练阶段使用自然语言提示替代复杂的层次标签，简化流程并扩大数据量
- 采用三阶段训练：预训练、有监督微调和直接偏好优化（DPO）

5. 先进的模型架构：融合了基于Whisper-large-v3的音频编码器和基于Qwen-7B的语言模型，总参数量达8.2B。

在性能评估方面，研究团队在13个数据集上对Qwen2-Audio进行了全面测试，涵盖自动语音识别（ASR）、语音翻译（S2TT）、语音情感识别（SER）和声音分类（VSC）等任务。结果显示，Qwen2-Audio在多项任务上达到了业界领先水平，特别是在AIR-Bench指令跟随能力测试中超越了包括Gemini-1.5-pro在内的其他模型。

值得注意的是，Qwen2-Audio无需针对特定任务进行微调，即可在多种音频理解任务中表现出色。这种通用性使其在实际应用中具有巨大潜力。

阿里云称 Qwen2-Audio 即将开源发布。

（Github 仓库）（技术报告）

11:47 · 2024年7月17日 · 周三

一个小站的自留地

至于 OpenAI, 据路透社报道，OpenAI 正在秘密开发一项代号为「Strawberry」的新 AI 技术，旨在显著提升 AI 模型的推理能力。

OpenAI首席技术官:GPT-5发布或推迟至2025年底

OpenAI首席技术官Mira Murati 六月底在接受采访时表示,备受瞩目的GPT-5模型可能需要约一年半时间才能发布,这意味着其发布时间可能推迟至2025年底或2026年初。这一说法与此前市场预期的2024年夏季发布时间有显著差异。

Murati称,新一代GPT模型将在特定任务上达到「博士级」智能水平。预计GPT-5将在多模态处理和推理能力方面有重大突破。这一延期可能源于技术挑战、质量把控以及安全伦理等多方面考虑。

此番表态或将为AI领域的竞争对手提供更多追赶时间。根据SuperCLUE团队发布的《中文大模型基准测评2024年上半年报告》，国内外模型的差距从2023年5月的30.12%逐步缩小到2024年3月的4.94%。

（indiatoday）

07:59 · 2024年7月17日 · 周三

一个小站的自留地

Anthropic 推出 Claude Projects 功能 Anthropic 刚刚宣布为其 AI 助手 Claude 推出 Projects（项目）功能，旨在提升用户的协作体验和工作效率。该功能现已面向所有 Claude Pro 和 Team 订阅用户开放。 Projects 功能的主要特点如下： 1. 协作空间：为团队成员提供一个共享精选对话和知识的平台。 2. 大容量上下文：每个项目拥有 200K 词元（Token）的上下文窗口。用户可以在其中存储文档、代码和其他数据，以改善 Claude…

Anthropic公司宣布Claude 3.5 Sonnet模型最大输出翻倍

Anthropic公司近日宣布,将旗下Claude 3.5 Sonnet大语言模型的最大输出token数从4096提高到8192。这一更新目前仅面向API用户开放,开发者需要在API调用中添加"anthropic-beta": "max-tokens-3-5-sonnet-2024-07-15"这一header才能启用新功能。

据Anthropic公司开发者关系负责人Alex Albert介绍,这一更新暂时还未在Claude.ai网页版中生效,但公司希望能尽快将其推广到网页版。多位开发者表示,这一更新将对代码生成等需要长文本输出的任务产生重大影响。

另外，Claude 正式上线 Android 客户端，首个版本面向 Android 14 进行开发。

17:03 · 2024年7月16日 · 周二

一个小站的自留地

知名创作者平台「爱发电」疑似因网络攻击而宕机「爱发电」是一个为创作者和粉丝提供打赏通道的平台，长期以来，有非常多个人创作者通过爱发电运营自己的粉丝付费社群。不久前，飞致云旗下的服务器管理面板 1Panel 宣布推出专业版，首批打赏用户可获得 1 折优惠券，可以以 98 元购买原价 980 元的 1Panel 单设备专业版授权。飞致云通过爱发电平台作为收取打赏的渠道，最低门槛为打赏十元，即可获得一张一折券。由于 1Panel 先前的良好口碑，此次活动在建站社群内广泛传播，带动了收款方爱发电的访问量。…

创作者平台「爱发电」域名被锁定,疑似违规乱纪

2024年7月15日,知名内容创作者与粉丝互动平台「爱发电」(afdian.net)突然无法访问,引发用户广泛关注。

经查,爱发电的ICP备案(琼ICP备18001024号-1)已被注销,域名被注册商设置为暂停解析(clientHold)和禁止转移(clientTransferProhibited)。部分用户因DNS缓存仍可访问网站,但大多数用户已无法正常打开。

7月16日凌晨,爱发电官方在微博评论区回应称传闻为「假的」,但未提供进一步解释。同日,官方发布公告承认域名备案确实被注销,称「没有收到任何通知或公示」,并表示正在重新申请备案和准备临时站点。公告强调提现功能正常,用户资金安全。

值得注意的是,爱发电已启用早在2021年注册的备用域名ifdian.net继续运营。这一举动被一些观察者解读为平台「早有准备」。

据网友向新网客服询问，爱发电当前确实处于[clientHold]状态，具体原因为违规乱纪。

据新网客服，「根据海南省公安厅来函要求，网站 afdian.net存在违规行为。经我局调查，该域名在北京新网数码信息技术有限公司注册。根据《互联网信息服务管理办法》和《互联网站管理工作细则》的有关规定，现请北京市通信管理局配合对相关网站进行停止解析禁止转移。」

作为众多个人创作者的重要收入来源,爱发电的稳定运营关乎国内创作生态。本频长期使用爱发电作为打赏渠道，每月提现流程均十分顺利，因此本频猜测爱发电本次事件并非自身资金问题导致。

爱发电投资人之一 @何饭团发文称，「（爱发电）提现没有任何问题，现在的域名在正常提现中。之后的方案，也都能让大家正常提现，请不用担心；域名备案注销的具体原因确实不明，没有事先的通知或公示，注销后也没有任何人联系过我们。网上有一些推测、截图，还请大家不信谣不传谣」。

——————

类似事件此前也曾发生在另一家知名创作者平台面包多身上。2022年10月22日,面包多主域名mianbaoduo.com突然无法访问。官方随后发布声明称,其DNS被暂停解析,原因是网站存在有害内容。

面包多当时表示,他们接到有关部门电话,被告知网站存在有害内容需要删除。虽然面包多照做并提交了整改报告,但最终被告知主域名和子域名均无法解封。为保证服务继续运营,面包多启用了备用域名mbd.pub。

作为一个连接创作者与粉丝的付费平台,爱发电允许多样化的内容形式,包括文字、图片、音频和视频等。这种开放性虽然有利于创作者发挥,但也增加了内容管控的难度。可能有部分创作者在平台上发布了被认定为「有害」的内容,如擦边球内容、敏感话题讨论或未经授权的版权作品等。此前面包多被封禁时，曾经称自己面对的违法内容「鉴别难度是很高的，它不会被任何机器审核接口识别」，因此耗费了平台大量精力进行人工审核，「要求和敏感度需要进行极大的提高」。

面包多创始人事后发文称，「今后的面包多，会从一个敞开双臂欢迎所有创作者的「热」平台，变成一个更加谨慎，以安全和稳定为第一要务的「冷」平台，我们必须做这样的转变」。

15:59 · 2024年7月13日 · 周六

一个小站的自留地

Llama 3-405B 模型或即将将面向用户开放据知名 WhatsApp 功能追踪网站 WABetaInfo 报道,在 WhatsApp Android 测试版 2.24.14.7 中发现了一个新的设置选项,允许用户为内置的 Meta AI 聊天机器人选择不同的模型。用户可以在 Llama 3-70B 和 Llama 3-405B 两种模型之间进行选择。特别值得注意的是,界面中将 405B 模型描述为「更适合复杂提示」,但每周使用次数有限。这表明 Meta 可能正在通过 WhatsApp 平台对其最新、最强大的…

Meta 将于 7 月 23 日发布 Llama 3-405B 模型

据 The Information 报道，Meta 计划于 2024 年 7 月 23 日发布其最大规模的 Llama 3 模型。这一版本拥有 4050 亿个参数，不仅能处理文本，还具备理解和生成图像的多模态能力。

（The Information）

此前（7 月 1 日）本频曾提到 Meta 正在 WhatsApp 上进行测试 Llama 3-405B 模型，并可能于近期向公众开放。

社区普遍认为，根据 Meta 此前提供的模型基准测试，该模型如果确实拥有多模态能力，且拥有如此庞大的参数量，性能将有望位于 GPT-4-Turbo 和 GPT-4o 之间，成为「改变开源模型游戏规则」的存在。

——————

与此同时，有小道消息称，Google 计划在今年内公布Gemini 1.5 Ultra 模型，以应对Claude 3.5 Sonnet 的挑战。Gemini 更新日志页面代码显示，7 月 15 和 18 日将分别有一次更新。

至于 OpenAI, 据路透社报道，OpenAI 正在秘密开发一项代号为「Strawberry」的新 AI 技术，旨在显著提升 AI 模型的推理能力。

该项目被认为是去年引发关注的 Q* 项目的延续。「Strawberry」的目标是让 AI 不仅能生成答案，还能提前计划并自主可靠地浏览互联网进行「深度研究」。这一能力目前尚未被任何 AI 模型实现。

消息人士透露，「Strawberry」采用了一种特殊的「后训练」方法，在大规模预训练后对模型进行进一步优化。这种方法类似于斯坦福大学 2022 年开发的「自我教导推理者」(STaR) 技术。

OpenAI 希望通过「Strawberry」实现长时间任务处理，并计划测试其在软件和机器学习工程领域的应用能力。

对于「Strawberry」的相关问询，OpenAI 发言人表示:「我们希望 AI 模型能像人类一样理解世界。持续研究新的 AI 能力是行业常态，我们相信这些系统的推理能力会随时间改善。」

目前「Strawberry」的具体工作原理仍处于保密状态，其公开发布时间也未确定。但业内普遍认为，这一项目可能代表了 AI 推理能力的重要突破。

15:25 · 2024年7月13日 · 周六

一个小站的自留地

中国 IPv6 活跃用户数占比达 73% IPv6 是全球公认的下一代互联网发展方向，近年来取得了显著增长。截至 2024 年 5 月，全球 IPv6 支持率约为 39%。在此背景下，中国 IPv6 规模部署也取得了显著进展。截至 2024 年 4 月，中国 IPv6 地址拥有量为 67459 块/32，位居全球第二，占全球 IPv6 地址的 15.05%。截至 2024 年 4 月，中国 IPv6 活跃用户数达 7.878 亿，占网民总数的 73.01%，相比 2019 年的 24.35% 大幅提升。此外，中国移动网…

中国「网络去NAT」专项工作启动

7月7日，第三届中国IPv6创新发展大会在北京召开。为进一步推动IPv6发展，工业和信息化部办公厅、中央网信办秘书局近日联合印发通知，组织开展「网络去NAT」专项工作，通知提出，到2025年7月底前，试点区域基础电信企业NAT44设备总容量将停止增长，主要移动互联网应用（APP）固网侧IPv6流量占比不低于70%。

通知还制定了分阶段的发展目标：

近期目标（2024年底前）：
- 基础电信企业自有环境固定宽带用户IPv6连通率不低于80%。
- 新增互联网专线默认开通IPv6功能。
- 加快实施家庭网关IPv6地址前缀二次分发功能升级。

中期目标（2025年7月底前）：
- 实现试点区域基础电信企业NAT44设备总容量停止增长。
- 主要移动互联网应用（APP）固网侧IPv6流量占比不低于70%。

为实现这些目标，通知还要求：
- 基础电信企业制定详细的「网络去NAT」工作方案和时间表。
- 互联网企业深化应用服务IPv6升级改造，优化流量迁移策略。
- 内容分发网络（CDN）和云服务企业全面支持并默认启用IPv6。
- 各地方政府部门推动终端设备制造企业加快存量家庭无线路由器IPv6功能升级。

中央网信办副主任王崧在大会上指出，要坚持系统观念，体系化推进IPv6规模部署和应用；坚持创新驱动，加快建设IPv6技术产业生态；坚持示范引领，打造IPv6高质量发展样板；坚持安全发展，牢牢守住IPv6网络安全底线。

中国工程院院士邬贺铨指出，IPv6尚未真正打动互联网内容提供商（ICP），家庭用户对IPv6价值也缺乏认识。他强调，IPv6+的开发在路由建立和QoS服务方面已有良好进展，但IPv6的价值还未充分体现，推进IPv6+发展以赋能新质互联网势在必行。

（综合自中国教育网络、C114通信网、中国政府网）

18:19 · 2024年7月10日 · 周三

一个小站的自留地

消息称有山西联通IP地址段发起大规模下载刷量本频信源从腾讯云 Edgeone 用户群获悉,来自山西联通的221.204.0.0/15和221.205.0.0/15 IP地址段疑似正发起大规模无差别 CDN 刷量，攻击目标为多家国内 CDN厂商托管的众多网站。据报道,此次攻击主要针对使用国内 CDN服务的网站,包括腾讯云CDN、EdgeOne、多吉云、又拍云等多家CDN厂商的用户。攻击者疑似通过IP反查域名的方式进行无差别攻击,导致部分用户流量异常暴增。其中使用这类 CDN 的个人用户可能因此遭受难以承担的损失。…

近日,更多CDN用户报告遭遇来自山西联通IP的异常流量请求。除个人用户外，有企业用户报告被刷流量高达 300T。

经本频汇总,攻击主要来自以下 IP段:

221.204.0.0/15和221.205.0.0/15(整体范围)
221.205.168.0/23(主要活跃段)
211.90.146.0/24
60.221.231.0/24
122.195.22.0/24

下方补充列表由单一信源提供，可能有误伤：
112.229.8.0/24
39.71.180.0/24
119.188.69.0/24, 119.188.197.0/24, 119.188.60.0/24, 119.188.63.0/24
27.221.70.0/24
120.132.82.0/24
36.155.119.0/24, 36.155.88.0/24
112.48.189.0/24
140.249.121.0/24
119.118.60.0/24, 119.118.88.0/24, 119.118.197.0/24, 119.118.69.0/24, 119.118.63.0/24, 119.118.65.0/24
112.159.22.0/24

攻击呈现出明显规律,即通常在每晚20:00至23:00进行,部分用户报告19:45左右开始。主要针对体积较大的静态文件,如视频、安装包、大型图片等。单日攻击流量从数十GB到数百GB不等,部分站长报告单个IP(如221.205.169.183)持续定向攻击特定资源。值得注意的是,攻击者似乎不以瘫痪网站为目的,而是稳定持续地消耗流量。

请求特征:
- Referer头设置为请求文件的URL本身
- User-Agent随机或为空
- 即使文件删除或返回404,请求仍持续

V2EX上有站长发现，攻击前153.101.64.39(江苏联通)IP使用"Java/1.8.0_91" User-Agent爬取网站资源。

目前有效的应对措施包括但不限于封禁相关IP段；设置流量阈值和访问频率限制；通过边缘脚本进行请求限速；将静态资源迁移至海外CDN或采用P2P分发等。

CDN服务商多吉云近日发布了关于此事件的详细说明。根据其说明，异常流量早在2024年3月就已开始,影响范围包括阿里、腾讯、七牛等多家CDN服务商的用户。
攻击IP不仅来自山西联通,还包括江苏联通、安徽联通等地。

关于攻击动机,业内人士提出了与近期实施的省间结算政策相关的推测。这一政策要求运营商对跨省数据传输进行费用结算。有观点认为,这些异常流量可能是某些地方运营商为了平衡省间带宽差异或内部账单而进行的操作。另一种可能是PCDN(点对点内容分发网络)从业者为规避运营商对高上传流量的管控,通过刷取下载流量来平衡上传与下载比例。

16:28 · 2024年7月10日 · 周三

一个小站的自留地

根据 @非法加冯引述知情人士透露，本次故障是由于机房专线光纤被人为剪断所致。阿里云不得不进行临时性的网络切流。由于是单可用区故障，部分云数据库服务得以通过主备切换将流量转移到其他可用区。另一位疑似内部人士分享了更多细节：事发当天早上 9 点多，两处光缆被剪断，每处涉及两根主干光缆。被剪断的包括三根 96 芯光缆和一根 48 芯光缆，共影响四根光缆。经过紧急抢修，工作人员临时恢复了通往苏州方向的 96 芯业务。该内部人士补充，由于当天早晨相关部门刚刚实施「封网」措施，且被剪短光缆恰好是重要互联…

本频多个信源注意到，7 月 9 日中午开始，阿里云北京区域有服务出现不稳定现象。具体表现为云数据库（RDS）无法连接和控制台实例无法加载。

阿里云方面回应查询时称，北京时间 2024 年 07 月 09 日 13:33 ，阿里云监控发现北京地域多可用区网络互访出现丢包现象，阿里云工程师初步确认与网络设备异常有关，于 13:37 网络丢包现象开始恢复，13:45 网络丢包现象完全恢复。同日 13:33 ，阿里云监控发现杭州、上海、北京、深圳等地域云数据库控制台访问及 API 调用出现异常（不影响业务运行），经过处理异常已于当日 13:50 开始恢复。

本频暂时未见大客户受影响导致服务中断。

18:37 · 2024年7月9日 · 周二

一个小站的自留地

商汤「日日新5.0」中文基准测评出炉，总分80.03刷新最好成绩，文科能力领跑在SuperCLUE综合基准上，SenseChat V5表现不俗，以总分80.03分的优异成绩刷新国内最好成绩（通义千问2.5取得总分74.93分，GPT-4o得分为81.73），并且在中文综合成绩上超过GPT-4-Turbo-0125有0.9分。在本次测评中，理科任务上SenseChat V5取得国内最好成绩，较GPT-4-Turbo-0125低4.35分，还有一定提升空间；文科任务上SenseChat V5表现十分…

SuperCLUE团队发布「中文大模型基准测评2024上半年报告」

SuperCLUE团队刚刚发布了《中文大模型基准测评2024年上半年报告》，对33个国内外主流大语言模型在中文场景下的表现进行了全面评测。该报告涵盖了通用能力、多模态能力以及多个行业垂直领域的测评结果。主要亮点如下：

- 国内外大模型差距显著缩小。OpenAI的GPT-4o以81分领跑SuperCLUE基准测试，但国内顶尖模型如Qwen2-72B-Instruct、国外的Claude-3.5-Sonnet-200k等已将差距缩小至5%以内，均获得77分。报告显示，国内外模型的差距从2023年5月的30.12%逐步缩小到2024年3月的4.94%。

- 国内开源模型实力大增。阿里云开源的Qwen2-72B-Instruct模型登顶SuperCLUE榜单，超越多个国内外闭源模型。在开源模型中，Qwen2-72B、Yi-1.5-34B和qwen2-7b表现尤为出色。

- 各任务表现各有特色。报告通过雷达图展示了国际最优模型与国内最优模型在11个能力维度上的对比。在文科任务中，国内模型如Qwen2-72B达到76分，与GPT-4o并列第一。在理科任务中，GPT-4o领先优势更为明显。在Hard任务（如精确指令遵循）中，Claude-3.5表现突出。

- 端侧小模型表现惊艳。如qwen2-7b（70亿参数）的表现超过了上一代qwen1.5-32b（320亿参数），qwen2-1.5b（15亿参数）甚至超越了Llama-2-13B-Instruct（130亿参数）。这一趋势极大提升了大模型在端侧设备上的落地可能性。

- 行业垂直领域测评显示国内模型竞争力。报告针对金融、汽车、工业等多个垂直领域进行了专门测评。如在金融领域，Baichuan3、GLM-4和MoonShot-v1-128K均获得A级评价，仅次于GPT-4 Turbo的A+评级。在汽车行业测评中，多个国产模型表现不俗，显示出在特定领域的应用潜力。

- 多模态能力测评结果发布。在AIGVBench文生视频测评中，字节跳动的Dreamina即梦以72.99分位列榜首。在SuperCLUE-Image文生图测评中，百度文心一格和vivo的BlueLM-Art表现优异。（编注：此小项海外模型不参与排名）

- 模型能力矩阵分析。报告通过应用能力与基础能力矩阵，将模型分为四个象限：实用主义者、卓越领导者、潜力探索者和技术领跑者。其中，GPT-4o、Claude-3.5、Qwen2-72B等模型位于"卓越领导者"象限，显示出在基础能力和应用能力上的全面优势。

此外，报告还发布了「琅琊榜」匿名对战平台的最新结果。在该平台上，MiniMax的abab6.5-chat、智谱AI的GLM-4和零一万物的yi-large-preview等模型表现出色。报告还分析了这些模型的性价比，为用户选择提供了参考。（编注：此单项不包含开源模型和海外模型）

（SuperCLUE）

——————

以下是本频的一家之言：

「国内外模型的差距从2023年5月的30.12%逐步缩小到2024年3月的4.94%」这个数据，哪怕可能带有那么一点点水分，但至少趋势是有目共睹的。国内外在大模型方面的差距真的在肉眼可见地缩小。

这份榜单里的国产大模型之光，通义千问的开源模型Qwen2-72B绝对是当之无愧。作为已经发布了一段时间（首秀于 6 月 4 日，开源于 6 月 7 日）的开源模型，能够无限趋近Claude-3.5-Sonnet（发布于 6 月 21 日），真的是一件很值得称赞的事情。反观传统的以「人工智能」标榜自己的互联网大厂百度和科大讯飞，在大模型领域的话语权真的是越来越弱了。如果不是靠媒体通稿轰炸，想必世界上没有几家公司会选用他们两家的大模型。且不说别的，文心一言4.0，一个在官网上需要付费才能用的，自带「联网」功能的大模型，在知识百科领域居然比不过离线的GPT-4o（SuperCLUE 使用 API 进行测试），真不知道是百度的在线搜索太差了，还是这个大模型的基础能力实在拉跨。

多模态模型方面，国内的大厂们，特别是手握大量视频资源的大厂们，做出的成绩令人称奇。但可惜不管是字节还是快手，手握的长视频资源都不够多，我认为要做到所谓「Sora」宣传的效果还需要一段时间的努力。（当然，从种种迹象来看，Sora 目前还不能和行业龙头Runway Gen-3 拉开过多差距）

国外模型方面，GPT-4o 不出所料拿下几乎全部第一，唯一的弱点是「传统安全」，这一点何其唏嘘。奥特曼如果再继续带领 OpenAI 一味奔着搞钱而去，忽视模型的传统安全问题，我相信再有科学家出走也是迟早的事。在这一背景下，GPT-5 的发布我认为就更加急不得了。

前一段时间我们总说大模型的训练缺数据，但现如今看起来，各家似乎都找到了各自的解决方案。一个是互联网公开的数据集本就不少，难点应在与数据的清洗和选择；再一个是国内众多下场做大模型的厂商背靠大厂，自己手里没点语料是不可能的，毕竟那些隐私政策早就为现在的行为铺好了路。

国内大语言模型，咱先不说多模态，当前最需要追赶的细分项目我认为是「精确指令遵循」。都说当下 AI 产品的 Bug，随着基础模型的升级可能就慢慢消失了，这其中非常依赖模型指令遵循能力的提升。能够在长文本输出状态下精确遵循复杂指令，可比单纯的大海捞针难多了，但也有用得多。GPT-4o 用 API 调用时长文本能力是没问题的，问题就在于网页版给的上下文窗口是阉割后的结果，因此实际使用体验完全不如竞品，而使用 API 调用长文本对于个人来说无论是学习还是金钱成本都太高了。

13:33 · 2024年7月9日 · 周二

一个小站的自留地

消息称微信正逐步恢复新开通订阅号的留言功能据本频信源，微信正逐步开放存量公众号的留言功能，且无申请入口，预计会在近期向所有公众号全量开放。获得该功能的公众号运营者可在发布文章时在「文章设置」中找到「留言及回复」选项，手动打开即可为新文章开启留言。根据国家监管部门要求，自2018年2月12日起，新注册的微信公众账号暂无留言功能，只能在后台发送只有运营者可见的消息。长时间以来，公众号运营者必须通过迁移账号至功能关闭前就已开通的公众号的方式，间接获得留言功能。可信度：C

公众号文章支持修改标题

据微信派，公众号文章标题将支持 3 个字以内的修改，包括删除和替换。修改成功后，文首将标记「标题已修改」。

已修改的标题只会在文章里、公众号主页、用户新收到的文章分享链接卡片上看到。已推送的订阅号信息流中的标题并不会发生变化。

00:21 · 2024年7月8日 · 周一

消息称有山西联通IP地址段发起大规模下载刷量

本频信源从腾讯云 Edgeone 用户群获悉,来自山西联通的221.204.0.0/15和221.205.0.0/15 IP地址段疑似正发起大规模无差别 CDN 刷量，攻击目标为多家国内 CDN厂商托管的众多网站。

据报道,此次攻击主要针对使用国内 CDN服务的网站,包括腾讯云CDN、EdgeOne、多吉云、又拍云等多家CDN厂商的用户。攻击者疑似通过IP反查域名的方式进行无差别攻击,导致部分用户流量异常暴增。其中使用这类 CDN 的个人用户可能因此遭受难以承担的损失。

目前已知的攻击 IP包括221.205.168.128、221.205.169.145等。

据蓝点网报道，近期注意到多个使用 CDN 的网站遭到恶意刷量，这些恶意刷量背后的人可能和 PCDN 相关的产业有关，即故意拉取和消耗某些网站托管的 CDN 文件来平衡自己的上传和下载。

PCDN 需要伪造数据不停地发起请求并下载就可以产生大量的下载流量，以此来平衡与上传的流量，避免被运营商判定为 PCDN。

本次恶意刷量的 IP 来源地集中为山西联通，网段包括 60.221.231.*、221.205.*.*、221.90.*.*，经过查询这些网段分布在山西省不同的地市，但运营商均为中国联通。

——————

本频此前表述为「DDoS 攻击」并不准确，在此向读者致歉。

10:59 · 2024年7月7日 · 周日

一个小站的自留地

Stable Diffusion 3 发布 2月23日凌晨，Stability AI发布了Stable Diffusion 3.0，采用了和Sora同样的DiT架构，画面质量、文字渲染、复杂对象理解提升。 src： https://stability.ai/stablediffusion3 可信度：A

Stability AI更新许可条款，放宽商业使用限制

Stability AI近日宣布更新其许可条款，推出新的社区许可证（Community License）。这一变化大幅放宽了其AI模型的使用限制，包括最新发布的SD3 Medium模型在内的多个模型现可免费用于研究、非商业及商业用途。

根据新的许可条款，只有年收入超过100万美元（或等值当地货币）且在商业产品或服务中使用Stability AI模型的企业才需要购买付费的企业许可证。这意味着绝大多数个人用户和小型企业都可以免费使用这些模型，无论是用于非商业还是商业目的。

新的社区许可证包含以下几个要点：

- 非商业用途完全免费，包括研究人员、开源开发者、学生、教师和爱好者等。

- 对于个人和小型企业的商业用途，只要年收入不超过100万美元，使用仍然免费。

- 取消了创建媒体文件数量的限制。

- 只有商业用户需要自行报告使用情况，年收入低于100万美元的用户无需向Stability AI支付费用。

此外，Stability AI还承认了SD3 Medium模型在发布后出现的一些问题，特别是在人体姿势和罕见词汇方面的表现不佳。公司表示正在积极改进模型，预计将在未来几周内发布质量大幅提升的新版本。

Stability AI表示，此次许可更新旨在重申公司对开源原则的承诺，同时平衡商业利益。新的许可条款既支持创作者自由，又保持对研究的开放态度，并致力于与用户保持透明和频繁的沟通。

（Stability AI）

19:19 · 2024年7月5日 · 周五

WAIC 2024 综合资讯汇总

2024 年 7 月 4 日至 7 日,世界人工智能大会(WAIC)暨人工智能全球治理高级别会议在上海世博中心和世博展览馆举行。本届大会以"以共商促共享以善治促善智"为主题,汇聚了全球 AI 领域的顶尖专家和企业。大会展览面积超过 5.2 万平方米,吸引了 500 多家企业参展,展示了 1500 多项创新产品。大会重点围绕核心技术、智能终端、应用赋能三大板块,聚焦大模型、算力、机器人、自动驾驶等领域。

1. 大会亮点

- 《人工智能全球治理上海宣言》在开幕式上正式发布。该宣言旨在推动全球 AI 治理体系的构建,呼吁各国加强交流和对话,共同应对 AI 发展带来的机遇与挑战。

- 上海人工智能实验室主任、清华大学教授周伯文在开幕式上提出"AI45 度平衡律"概念。他呼吁在 AI 发展中寻求性能与安全的平衡,强调目前 AI 安全投入仅占 1%,远远落后于性能投入。周伯文表示,未来需要在安全与性能之间找到平衡点,避免出现"跛脚 AI"。

- 图灵奖得主、中国科学院院士姚期智在大会上指出 AI 风险主要来源于三个方面:网络风险的放大、未预见的社会风险和生存风险。他强调,解决 AI 治理问题需要跨学科合作,呼吁计算机科学家、社会学家、哲学家等共同努力。

2. 企业新品与技术进展

- 阶跃星辰在大会上发布了 Step 系列大模型的升级版。其中,Step-2 是一个万亿参数的语言模型,采用 MoE 混合专家模型架构,性能接近 GPT-4。Step-1.5V 是一个多模态大模型,在图像感知和理解能力上全面提升。Step-1X 则是一个图像生成模型,具备更强的语义对齐和指令跟随能力。

- 商汤科技推出"日日新 5o"大模型,支持实时多模态交互,能力对标 GPT-4。该模型采用混合端云协同架构,可在同一模型中处理多种任务。同时,商汤还推出"大模型 0 元 Go"计划,为企业用户提供免费服务,以加速 AI 应用落地。

- 阿里云展示了通义千问系列的最新进展。通义千问开源模型下载量已突破 2000 万次,新版 Qwen2-72B 模型在多项基准测试中取得优异成绩。阿里云 CTO 周靖人表示,通义千问已实现全尺寸、全模态开源,拉平了开源和闭源模型的差距。此外,阿里巴巴还推出了"通义十二时辰"活动,展示 AI 在日常生活中的应用,包括 AI 创作绘本、AI 搜索等功能。

- 蚂蚁密算发布隐语 Cloud 大模型密算平台。该平台通过软硬件结合的可信隐私计算技术,在大模型托管和推理环节实现数据密态流转,保护模型资产、数据安全和用户隐私。平台支持 GPU 在可信执行环境下进行计算,使得大模型推理在密态形式下的响应时间和使用效率与明文大模型接近。

- 腾讯展示了混元大模型以及"腾讯元宝"和"腾讯元器"等 AI 应用产品,涵盖工作提效、生活娱乐等场景。腾讯副总裁蒋杰表示,混元大模型正在部署从多模态到全模态的技术。

- 百度 CEO 李彦宏在大会上透露,文心大模型的日均调用量已超过 5 亿次。这一数据比两个多月前公布的 2 亿次有了显著增长,反映出大模型应用的快速普及。

- 快手在大会期间宣布,其首部 AIGC 原创奇幻短剧《山海奇镜之劈波斩浪》即将上线。该剧由快手大模型团队提供深度技术支持,全程由 AI 生成,无真人演员参与。这一尝试展示了 AI 在视频内容创作领域的巨大潜力。

3. AI 芯片与算力

- 摩尔线程首次亮相 WAIC,展示了全栈 AI 产品和万卡集群解决方案。其 AI 旗舰产品夸娥(KUAE)智算集群解决方案已升级至万卡规模。摩尔线程创始人兼 CEO 张建中表示,万卡已成为智算中心的最低标配。

- 爱芯元智在大会上发布了"爱芯通元 AI 处理器"。这款处理器旨在为 AI 应用提供更高效的算力支持,但具体性能参数尚未公开。

- 燧原科技与人工智能系统软件商清程极智签署战略合作协议,双方将联合开发面向超万亿参数大模型和超大规模集群的高性能系统软件方案。这一合作旨在满足基础大模型的预训练、行业大模型的微调和大模型推理部署等不同的应用场景和多元的算力需求。

- 无问芯穹发布全球首个千卡规模异构芯片混训平台。该平台支持 30 多个主流模型和 10 余种计算卡,最高算力利用率达 97.6%。这一突破有望大幅提高大模型训练和推理的效率。

- 壁仞科技 AI 软件首席架构师丁云帆在大会论坛上表示,即使国产 AI 芯片单个算力不够强,也能通过综合手段提升集群算力。他认为,解决算力瓶颈问题需要从硬件集群算力、软件有效算力、异构聚合算力三个维度考虑。

4. 应用落地

- 特斯拉二代人形机器人 Optimus 在大会上亮相。相比第一代,新版 Optimus 在行走速度、手指灵活度等方面都有显著提升。特斯拉 CEO 埃隆·马斯克此前表示,计划从 2025 年开始在特斯拉工厂限量使用 Optimus。

- 国内首款搭载鸿蒙系统的全尺寸人形机器人"Kvavo"(夸父)亮相。该机器人由乐聚公司开发,搭载盘古具身智能大模型,具备全方位视觉感知和多地形行走能力。据介绍,Kvavo 已进入量产阶段,预估售价在 60-80 万元人民币。

- 上海市经信委、市公安局、市交通委联合发布首批无人驾驶装备识别标牌。这标志着无人驾驶装备正逐步走向规范化、规模化应用的新阶段。

- 上汽赛可智能获准在上海向公众提供主驾无人的自动驾驶出行服务(Robotaxi)。这是继广州、深圳之后,第三个开放 Robotaxi 商业化运营的一线城市。

- 学而思展示了基于九章大模型的数学搜索答疑工具"九章随时问"。该工具能够通过启发引导方式帮助学生解决数学难题,培养解题思维。目前"九章随时问"小程序可从微信进入使用,APP 端也已陆续开放下载。

- 网易展示了 AI 技术在游戏中的创新应用。例如,《逆水寒》手游中的"大宋头条"玩法利用 AIGC 技术,将玩家和 NPC 的行为转化为报纸头条,增强游戏沉浸感。网易灵动还展示了基于自研工业大模型的智能挖掘机和装载机器人,这些产品已在工程机械领域实现应用。

- 中信银行展示了信用卡中心的"中信碳账户"和"基于全域 AI 技术的智能风控"等项目,展现了 AI 在金融科技领域的应用成果。

5. 行业观点与趋势

- 百度 CEO 李彦宏强调 AI 应用的重要性,他表示:"没有应用,光有基础模型,不管是开源还是闭源都一文不值。"李彦宏认为,大模型对现有业态的改造作用比从 0 到 1 的颠覆作用更早到来。

- 蚂蚁集团董事长兼 CEO 井贤栋提出,专业智能体能够破解通用大模型在严谨产业应用的关键难题。他表示,蚂蚁集团正在携手产业合作伙伴构建专业智能体生态。

- 中国工程院院士高文强调,要严格控制人工智能的底层价值取向,实现技术的标准化。他指出,应对强人工智能,必须加强国际合作。

- 英伟达开发与技术部门亚太区总监李曦鹏表示,公司正在关注推理性能的提升,预计推理成本会很快再次降低。这一趋势将有利于 AI 应用的进一步普及。

- BV 百度风投执行董事温永腾在大会论坛上表示,不是要找超级应用,而是要找有用的应用。这一观点反映了 AI 产业正在从概念走向实用的趋势。

- 阶跃星辰 CEO 姜大昕认为,Scaling Law 在中短期内依然处于陡峭曲线,模型能力和参数量相关。他预测,多模态大模型将走向理解和生成的统一。

- 奇安信集团董事长齐向东预测,未来网络安全行业可能成为少数让机器人离不开人的专业之一。他建议学生考虑选择网络安全作为未来的职业方向。

- 汇付天下董事长兼 CEO 周晔预测,智能体将快速替代软件,实现"超级自动化"。他认为,未来的世界将是由一个个智能体连接而成的。

6. 产业合作

- 中国移动在大会期间启动了五个"100"人工智能生态计划。该计划包括开放百大 AI+场景、集结百大合作伙伴、设立百亿权益扶持、开放百大技术要素、打造百万级智能体等内容,旨在推动 AI 产业生态的发展。

- 中国移动与印尼金光集团成立人工智能联合实验室,推动中国 AI 技术走向世界。这一合作展示了中国 AI 企业积极开拓国际市场的趋势。

- 中科创达展示了车路云一体化解决方案,以及与英特尔合作开发的多模态大模型目标检索系统。这一系统可以通过自然语言和开放词汇描述,快速实现对行人、车辆以及各类交通事件的精准快速检索,为智能交通领域提供了新的解决方案。

（综合 APPSO、各厂商新闻稿及其他媒体报道）

11:18 · 2024年7月4日 · 周四

一个小站的自留地

polyfill.io 供应链攻击影响超 10 万网站,波及多个行业 polyfill.io 是一个广受欢迎的 JavaScript 库,用于提升旧版浏览器的兼容性。近期安全研究人员发现,该服务已被恶意利用来注入恶意代码,影响超过 10 万个网站,包括 JSTOR、Intuit 和世界经济论坛等知名机构。今年 2 月,polyfill.io 的域名和 GitHub 账号被一家名为 Funnull 的公司收购。此后,该服务开始在特定条件下向用户提供被植入恶意代码的脚本。攻击者通过 cdn.polyfill.io…

安全研究人员发现,除 polyfill.io 外,此次攻击还波及了 bootcdn.net、bootcss.com、staticfile.net 和 staticfile.org 等多个 CDN 服务。

针对这一大规模攻击,多方已采取应对措施:

- uBlock 的「Badware risks」过滤器已阻断了这些受影响站点的访问。
- 域名注册商 Namecheap 已关停 polyfill.io 和 polyfill.com 域名。
- Google 开始停止向使用 polyfill.io 的网站投放广告。
- Cloudflare 推出了自动替换服务,将 polyfill.io 链接替换为其安全镜像。该服务对免费计划用户默认启用,付费计划用户可手动开启。

值得注意的是,一位安全研究者在 GitHub 上发现了一个名为 data.polyfill.com 的公开仓库,其中意外泄露了 Cloudflare API 密钥。利用这些仍然有效的 API 密钥,研究人员发现同一个 Cloudflare 账户控制着所有涉事域名,这一发现将多个受影响的 CDN 服务与同一运营商联系起来。

安全专家警告,鉴于攻击者可能预先注册了多个域名,这种供应链攻击可能会演变成一场「打地鼠」式的持久战。他们建议开发者立即移除对这些受影响 CDN 的引用,并转向安全的替代方案。

Ref:
https://t.me/outvivid/4557

Before

After