一个小站的自留地

起于小站，终于生活。
现实之外，一个普通人的思考。

博客地址：ygxz.in
讨论组：https://t.me/ygxz_group

18:27 · 2024年8月2日 · 周五

搜狗输入法在 Windows 上被确认存在严重的越权漏洞

目前搜狗输入法在 Windows 上被确认存在严重的越权漏洞。Windows 环境中，攻击者在能访问到系统登录界面的情况下（位于电脑终端前/电脑开启了远程桌面/使用了ToDesk、向日葵等远程控制软件），无需知晓账号密码即可获取操作系统权限，继而实现增加帐号、修改管理员密码、拷贝文件、植入木马等非法操作。

复现方式

据本频信源，国内已有企事业单位内部通知「必须卸载搜狗输入法」。

搜狗方面回应称，「经搜狗输入法安全团队排查，该问题仅存在于特定版本Windows系统，是由于微软屏幕键盘等相关程序主动以特权接口加载中文输入法导致。我们已将此系统漏洞通知微软相关团队。

在微软修复该漏洞前，为更有效保护用户安全，我们已采取了主动规避措施，在Windows登录界面下搜狗输入法将主动退出加载执行。」

有安全人员解释称，这个是微软登陆界面的0day漏洞，经过测试某度输入法、谷歌拼音也可以复现。

如：
2015年《利用手心输入法绕过win8登录密码保护执行任意命令》https://wooyun.xyz/bug_detail.php?wybug_id=wooyun-2015-0130018
2018年《神漏洞：微软小娜可让任何人修改Windows 10密码》https://www.secrss.com/articles/3348
2020年《利用某度输入法绕过windows登录和提权服务器》https://cn-sec.com/archives/76228.html

12:40 · 2024年8月2日 · 周五

一个小站的自留地

「gemini-test」的名称则直接暗示了它可能是谷歌 Gemini 系列的测试版本。有报道称，该模型实际上包含两个不同的版本，可能是 Gemini 2.0 的 Flash 和 Pro 版本，或者 Pro 和 Ultra 版本。在竞技场中，该模型会随机分配给用户，这使得准确评估单个模型的性能变得困难。

Gemini 1.5 Pro (0801)上线，夺得 LMSYS Chatbot Arena 排行榜榜首

2024 年 8 月 1 日，Google 推出了 Gemini 1.5 Pro 的实验版本 (0801)，并在 Google AI Studio 和 Gemini API 上开放早期测试。该模型在多项基准测试中表现出色，尤其在 LMSYS Chatbot Arena 排行榜上首次超越 OpenAI 的 GPT-4o 和 Anthropic 的 Claude-3.5 Sonnet，以 1300 的 ELO 分数夺得榜首。

Gemini 1.5 Pro (0801) 展现了强大的多语言能力，在中文、日语、德语和俄语等语言任务中均排名第一。此外，该模型还在数学和复杂提示词处理方面表现优异。然而，在编码和困难提示词领域，Claude 3.5 Sonnet、GPT-4o 和 Llama 405B 仍然保持领先地位。

在对战胜率方面，Gemini 1.5 Pro (0801) 对阵 GPT-4o 的胜率为 54%，对阵 Claude-3.5-Sonnet 的胜率为 59%。值得一提的是，该模型还在 LMSYS 的视觉任务排行榜上同样夺得第一。

Gemini 1.5 Pro (0801) 拥有 100 万个词元的上下文窗口，这是目前全球最大的聊天机器人上下文窗口之一。这使得它能够更深入地理解长文本输入，并在多模态任务中展现出色表现。

在实际测试中，Gemini 1.5 Pro (0801) 在图像信息提取、PDF 文档内容提取和代码生成等方面表现出色。例如，它能够准确地从发票图像中提取信息并以 JSON 格式输出，还能从学术论文 PDF 中提取章节目录。在代码生成方面，模型能够创建复杂的 Python 游戏来帮助学习 LLM 知识。

尽管如此，Gemini 1.5 Pro (0801) 在某些简单问题上仍有失误，在处理一些推理问题时仍有改进空间。

（综合机器之心、VentureBeat、Twitter）

16:37 · 2024年7月31日 · 周三

一个小站的自留地

Stable Diffusion 3 部分模型将于 6 月 12 日开源 2023 年 6 月 3 日，Stability AI 联合 CEO Christian Laforte 在台北国际电脑展 COMPUTEX 2024 上宣布，将于 6 月 12 日星期三在 Hugging Face 平台开源旗下 Stable Diffusion 3 的中等规模（20 亿参数）模型。据 Stability AI 致开发者的邮件透露，SD3 Medium 模型在逼真度、字体设计、性能和微调能力等方面有显著提升：…

Midjourney 发布 v6.1 版本,全面提升 AI 图像生成能力

2024 年 7 月 30 日,AI 图像生成工具 Midjourney 正式推出 v6.1 版本。该版本在多个方面实现了显著提升:

- 图像连贯性增强,特别是在手臂、腿、手等人体部位的生成上更加自然
- 图像质量大幅提高,减少了像素伪影,增强了纹理和皮肤细节
- 小细节更加精确,如眼睛、小脸等特征的生成更为准确
- 生成速度提升约 25%
- 新增 --q 2 模式,可生成更多纹理细节

此外,v6.1 版本还更新了放大和个性化模型,进一步提升了生成图像的整体美观度。Midjourney 表示,这是目前他们「最好的模型」。

Midjourney 自 2022 年推出以来,凭借其强大的 AI 绘画能力迅速成为该领域的领先者之一。

（Midjourney）

09:13 · 2024年7月31日 · 周三

一个小站的自留地

Windows出现全球大规模蓝屏事件 2024年7月19日,全球多地Windows用户遭遇大规模蓝屏故障,导致银行、航空、媒体等行业业务中断。事件始于日本时间13:30左右,随后迅速蔓延至澳大利亚、欧洲和美国。故障源于网络安全公司CrowdStrike的软件更新问题。受影响的Windows设备启动时会显示蓝屏,并进入恢复模式或重启循环。澳大利亚国家广播公司、联邦银行、澳新银行、Qantas航空等多家企业系统受到影响。英国Sky News一度被迫中断直播。美国多家航空公司,包括Frontier、Uni…

微软再次出现服务中断

微软服务状态网站上的一则警报称，此次宕机影响了微软Azure、Microsoft 365、云系统Intune和Entra 等。

当地时间7月30日上午，微软公司在社交媒体平台 X 上发布的帖子中表示，该问题影响了“多项 Microsoft 365 服务和功能”。Microsoft 365 包括 Outlook、Word 和 Excel 等常用生产力应用程序。微软公司在帖子中表示：“我们目前正在调查多项 Microsoft 365 服务和功能的访问问题和性能下降。有关详细信息，请参阅管理中心的‘MO842351’。”

微软公司表示，Azure 云应用程序的中断是由分布式拒绝服务 (DDoS) 网络攻击引发的。微软在状态更新中表示，DDoS 攻击始于周二早间，微软自动保护机制的错误加剧了影响，而不是减轻了影响。多个地区的客户受到影响，包括在 Azure 上运行的服务。据知情人士透露，由于 Azure 出现问题，星巴克的移动订购服务被停用了数小时。

09:06 · 2024年7月31日 · 周三

一个小站的自留地

Apple Intelligence 首轮测试启动,暂不支持中国大陆及欧盟设备 Apple 于 7 月 30 日向开发者推送了 iOS 18.1、iPadOS 18.1 和 macOS Sequoia 15.1 的首个测试版，正式启动 Apple Intelligence 功能的首轮测试。这些测试版仅面向支持 Apple Intelligence 的设备推送，包括非中国大陆和欧盟销售的 iPhone 15 Pro 和 iPhone 15 Pro Max, 以及搭载 M1 及更高版本芯片的 iPad 和…

国行 Mac 可使用如下方式激活 Apple Intelligence，并且可以联动其他设备激活通知过滤等少数本地 AI 功能。

https://github.com/CatMe0w/zouxian

GitHub

GitHub - CatMe0w/zouxian: Permanent Apple Intelligence + Xcode Predictive Code Completion for Chinese-market Mac computers

Permanent Apple Intelligence + Xcode Predictive Code Completion for Chinese-market Mac computers - CatMe0w/zouxian

08:45 · 2024年7月31日 · 周三

一个小站的自留地

OpenAI CEO Sam Altman 在社交平台 X 上宣布,OpenAI 将于下周正式向 Plus 用户推出 ChatGPT 高级语音模式的 Alpha 版本。此时距离 OpenAI 宣布推迟该功能发布恰好过去了一个月时间。 src： https://x.com/sama/status/1816560608554418401

OpenAI 宣布向小部分 ChatGPT Plus 用户推出全新高级语音模式的 Alpha 版本，并将于今年秋季逐步面向所有 Plus 用户推出。

Ref: https://x.com/openai/status/1818353580279316863

据本频观察，参与本次测试的用户大多是 OpenAI 社群志愿者、科技博主等。普通用户被灰度到的概率较小。

23:32 · 2024年7月30日 · 周二

一个小站的自留地

近日,更多CDN用户报告遭遇来自山西联通IP的异常流量请求。除个人用户外，有企业用户报告被刷流量高达 300T。经本频汇总,攻击主要来自以下 IP段: 221.204.0.0/15和221.205.0.0/15(整体范围) 221.205.168.0/23(主要活跃段) 211.90.146.0/24 60.221.231.0/24 122.195.22.0/24 下方补充列表由单一信源提供，可能有误伤： 112.229.8.0/24 39.71.180.0/24 119.188.69.0/24,…

据蓝点网，123网盘被DNS劫持，直接跳转到反诈中心。

此前123网盘曾被发现吸血BT网络产生大量下行流量(与此次被反诈无关)。

14:47 · 2024年7月30日 · 周二

一个小站的自留地

Anthropic公司宣布Claude 3.5 Sonnet模型最大输出翻倍 Anthropic公司近日宣布,将旗下Claude 3.5 Sonnet大语言模型的最大输出token数从4096提高到8192。这一更新目前仅面向API用户开放,开发者需要在API调用中添加"anthropic-beta": "max-tokens-3-5-sonnet-2024-07-15"这一header才能启用新功能。据Anthropic公司开发者关系负责人Alex Albert介绍,这一更新暂时还未在Claude.ai网页版中生效…

OpenAI 推出 gpt-4o-64k-output-alpha 模型，显著提升模型单次输出长度。暂时仅限 Alpha 参与者。

此前 Claude 和 DeepSeek 都相继在 API 上测试 8K 输出，而 GPT-4o-mini 则在 API 提供 16K 长度的输出。

09:56 · 2024年7月30日 · 周二

一个小站的自留地

WWDC 24 前瞻：全面拥抱 AI 距离 WWDC 24 开幕还有三天时间，各种关于苹果即将发布的 AI 特性爆料已经铺天盖地。以下是本频根据多方信源整理出的 WWDC 24 全方位爆料信息。 - Project Greymatter / Apple Intelligence 多个信源指出，苹果将推出一个名为「Project Greymatter」的 AI 工具集（彭博社声称「该系统将被称为 Apple Intelligence」），集成到 Safari、照片、备忘录、邮件等核心应用中。这个 AI…

Apple Intelligence 首轮测试启动,暂不支持中国大陆及欧盟设备

Apple 于 7 月 30 日向开发者推送了 iOS 18.1、iPadOS 18.1 和 macOS Sequoia 15.1 的首个测试版，正式启动 Apple Intelligence 功能的首轮测试。

这些测试版仅面向支持 Apple Intelligence 的设备推送，包括非中国大陆和欧盟销售的 iPhone 15 Pro 和 iPhone 15 Pro Max, 以及搭载 M1 及更高版本芯片的 iPad 和 Mac 设备。目前开放的功能包括：全新 Siri 界面、通话录音、智能改写、邮件摘要和智能回复等。值得注意的是，ChatGPT 集成等部分功能尚未开放。

通话录音功能可在通话界面左上角点击录音按钮启用，系统会用 AI 语音提示「正在录音」。录音完成后将保存在「备忘录」应用中，并可生成摘要。

此次更新还新增了「减少打扰」专注模式，利用 Apple Intelligence 过滤不重要的通知。然而，由于中国大陆设备暂不支持 Apple Intelligence, 该功能也无法使用。

除通话录音外，Apple Intelligence 目前对中国大陆和欧盟销售的设备不可用，这是一种硬件级锁定，无论设备位于何处都无法启用。但香港、澳门和英国用户不受此限制。

开发者需要在设备的「设置」应用中加入 Apple Intelligence 候补名单，可能还需要将系统地区设置为美国。Apple 表示，正式版 Apple Intelligence 功能预计将于今年秋季推出，但初期仍将处于测试阶段。值得注意的是，Apple Intelligence 不会包含在今年 9 月发布的 iOS 18 正式版中，而是计划在之后的 iOS 18.1 更新中推出。

同时,Apple 发布了一份详细的技术报告 ,首次披露了 Apple Intelligence 背后的基础模型架构和训练过程。

根据技术报告,Apple Intelligence 由两个主要模型组成:一个约 30 亿参数的设备端模型(AFM-on-device, Apple Foundation Models on device)和一个更大的服务器端模型(AFM-server)。这些模型采用了创新的架构设计,包括共享输入/输出嵌入矩阵、预归一化、查询/键归一化等技术,以提高模型效率和稳定性。

Apple 强调了其在负责任 AI 开发方面的努力。公司制定了全面的安全分类法,涵盖 12 个主要类别和 51 个子类别,用于评估潜在风险。在训练数据方面,Apple 严格筛选,不使用用户私人数据,并采取措施排除潜在有害内容。

为了提高模型性能和效率,Apple 采用了 LoRA (Low-Rank Adaptation) 适配器技术和创新的量化方法。这些技术使得 AFM-on-device 模型能够在保持高性能的同时,将参数压缩到平均每权重不到 4 位。

在人类评估中,AFM 模型在多项任务上表现出色。例如,AFM-on-device 在指令遵循能力上优于 Phi-3-mini、Gemma-7B 等模型,而 AFM-server 在功能调用基准测试中超越了 Gemini-1.5-Pro 和 GPT-4。

（MacRumors、9to5Mac、CNBeta、蓝点网）

11:04 · 2024年7月28日 · 周日

一个小站的自留地

近日,更多CDN用户报告遭遇来自山西联通IP的异常流量请求。除个人用户外，有企业用户报告被刷流量高达 300T。经本频汇总,攻击主要来自以下 IP段: 221.204.0.0/15和221.205.0.0/15(整体范围) 221.205.168.0/23(主要活跃段) 211.90.146.0/24 60.221.231.0/24 122.195.22.0/24 下方补充列表由单一信源提供，可能有误伤： 112.229.8.0/24 39.71.180.0/24 119.188.69.0/24,…

#运营通知

本站博客图片 CDN 正被大规模下载刷量，目前产生CDN流量超过500G，对本站运营支出造成重大负担。

目前博客的图床域名已经完成更换，也希望有当事人看到了能手下留情。个人博客纯用爱发电，赔不起这个钱。

目前已知特征包括：

攻击 IP 来自60.221.195.* 网段（山西联通），IP 固定，Referer 为文件链接本身。
攻击从晚上开始，持续到约 23:06:44。
该 IP 攻击时 QPS 约为 20。

关于本事件的更多消息，参见博客文章。

运营通知

19:12 · 2024年7月27日 · 周六

一个小站的自留地

Anthropic公司宣布Claude 3.5 Sonnet模型最大输出翻倍 Anthropic公司近日宣布,将旗下Claude 3.5 Sonnet大语言模型的最大输出token数从4096提高到8192。这一更新目前仅面向API用户开放,开发者需要在API调用中添加"anthropic-beta": "max-tokens-3-5-sonnet-2024-07-15"这一header才能启用新功能。据Anthropic公司开发者关系负责人Alex Albert介绍,这一更新暂时还未在Claude.ai网页版中生效…

Claude 的附件限制由「5/对话」改为「5/消息」。

现在，你可以在 Claude 的单次对话中上传超过五个附件。但受限于模型能力，用户仍然会受到单次对话 200K 上下文的限制。

16:19 · 2024年7月26日 · 周五

一个小站的自留地

供应链投毒事件新进展:调查曝光背后关联企业网络,爆料者遭威胁一名博主发文揭露Staticfile、BootCDN和Polyfill等多家知名CDN服务背后可能由同一批关联企业操控。该研究者通过梳理域名备案信息和企业关系,发现这些CDN域名的备案公司可以通过股东或实际控制人关联起来,其中包括运营51[.]La站点统计平台的郑州紫田网络科技有限公司,以及一家名为Funnull的公司。 7月17日,该研究者在技术社区V2EX上发帖称,自从发布相关调查结果后,收到了据称来自相关公司的威胁邮件,要求删除文章。…

GoEdge CDN 疑遭供应链攻击，部分版本含恶意代码

有网友发现广受欢迎的开源 CDN 系统 GoEdge 可能遭遇供应链攻击。研究显示，从 v1.3.9 到 v1.4.1 版本的 GoEdge 中包含可疑 JavaScript 代码。本次被投毒的资源是https://cdn.jsdelivr[.]vip/jquery.min-3.7.0.js，使用了与polyfill[.]io 事件相同的方能 CDN（也即 51.la 相关事件），因此该事件或与近期备受关注的 polyfill[.]io 供应链攻击案例存在关联。

据悉，GoEdge 原开发者于今年 4 月基本消失，5 月 20 日在 QQ 群发布最后一条消息。5 月 24 日，可疑代码首次出现在发布包中。7 月，该问题被公开披露。

对可疑代码进行分析后发现，该代码会检测用户环境、访问时间，并进行关键词匹配。符合条件时，代码会将用户重定向至域名为 wweeza[.]com 的博彩网站。

早前，GoEdge 的域名所有权已经发生变更。 goedge.cn 域名被转出，备案信息从刘**变更为莫**，并重定向至 goedge.cloud。销售渠道也从淘宝转为 Telegram。

对此，现 GoEdge 官方在 Telegram 群组中先是否认问题存在，随后又重新编译并发布了无恶意代码的 v1.4.1 版本。

16:02 · 2024年7月26日 · 周五

一个小站的自留地

Anthropic公司宣布Claude 3.5 Sonnet模型最大输出翻倍 Anthropic公司近日宣布,将旗下Claude 3.5 Sonnet大语言模型的最大输出token数从4096提高到8192。这一更新目前仅面向API用户开放,开发者需要在API调用中添加"anthropic-beta": "max-tokens-3-5-sonnet-2024-07-15"这一header才能启用新功能。据Anthropic公司开发者关系负责人Alex Albert介绍,这一更新暂时还未在Claude.ai网页版中生效…

DeepSeek API 新增多项功能提升模型能力

7月26日,DeepSeek宣布其API进行重大更新,新增多项功能以增强模型能力:

1. 更新 /chat/completions 接口:
- 新增 JSON Output 功能,可强制模型输出 JSON 格式字符串,方便后续处理
- 增加 Function Calling 功能,支持调用外部工具,增强模型与现实世界交互能力
- 新增对话前缀续写功能(Beta),允许用户指定 assistant 消息前缀进行补全
- 将最长输出提升至 8K tokens(Beta)

2. 新增 /completions 接口:
- 增加 FIM 补全功能(Beta),支持用户提供自定义前缀/后缀进行内容补全

所有新功能均可用于 deepseek-chat 和 deepseek-coder 模型。Beta 功能需将 base_url 设为 https://api.deepseek.com/beta 开启。

DeepSeek 表示,这些更新旨在释放模型更多潜力,提升自动化能力和与现实世界的交互。Beta 功能开放给所有用户使用,相关模型版本稳定后将发布到开源社区。

用户可访问 DeepSeek API 官方文档(https://platform.deepseek.com/api-docs/zh-cn/)获取详细使用说明。

(深度求索 DeepSeek)

12:06 · 2024年7月26日 · 周五

一个小站的自留地

快手「可灵」：可能是「中国版Sora」在快手13周年庆典上，快手毫无预兆地发布了AI视频大模型「可灵」。「可灵」支持生成最长2分钟、30fps的1080P视频，从头脑风暴到可发布作品的一键转化功能，让全球用户大为震撼。其生成效果不仅超越了Sora，还引发了硅谷创投圈的热议。Stability AI前CEO Emad Mostaque称赞中国AI技术有其独特优势，YC CEO也在X平台转发了可灵生成的视频示例。「可灵」成为国内首个文生视频产品级应用，不论是在生成视频的连续性、真实度和清晰度方面，…

智谱 AI 发布新一代视频生成模型 CogVideoX,所有用户可免费体验

7月26日,智谱AI宣布推出新一代视频生成模型CogVideoX,并在其AI助手「智谱清言」的各平台上线名为「清影」(Ying)的视频生成功能。所有用户均可免费体验AI文本生成视频和图像生成视频的服务。

CogVideoX在内容连贯性、可控性和模态融合方面有显著创新:

- 采用自研的三维变分自编码器(3D VAE)结构,将视频压缩至原始大小的2%,显著提升内容连贯性。

- 开发端到端视频理解模型,增强对文本的理解和指令遵循能力。

- 创新性地设计将文本、时间、空间三维融合的transformer架构,优化模态间交互。

「清影」可在30秒内生成6秒视频,具备高效的指令遵循能力、良好的内容连贯性和灵活的画面调度能力。

在生态合作方面,B站参与了清影的技术研发过程,华策影视也参与了模型共建。清影的训练依托北京亦庄高性能算力集群,未来将应用于亦庄的高精尖产业集群。

用户可通过智谱清言的PC端、移动应用端、小程序端或访问https://chatglm.cn/video 使用该服务。企业和开发者也可通过智谱大模型开放平台bigmodel.cn的API调用该功能。

智谱AI CEO张鹏表示,公司已验证Scaling Law在视频生成领域的有效性,未来将继续扩大数据和模型规模,并探索更具突破性的新型模型架构。

(GLM大模型）

src：
https://mp.weixin.qq.com/s/Xua54oISZGB6lPCI3pWoTQ

10:07 · 2024年7月26日 · 周五

一个小站的自留地

OpenAI 推迟 ChatGPT 高级语音模式发布 OpenAI 官方在 Discord 群组通知了 ChatGPT 高级语音模式的最新进展。他们表示，「需要再多一个月的时间来达到发布标准」。该公司在今年春季更新中曾演示这一功能，原计划于 6 月底向部分 ChatGPT Plus 用户推出 alpha 版本。 OpenAI表示，延迟的主要原因包括提升模型检测和拒绝某些内容的能力、改进用户体验，以及为大规模用户使用做好基础设施准备，以保证实时响应。 OpenAI 计划采用灰度发布，即先向一小部分…

OpenAI CEO Sam Altman 在社交平台 X 上宣布,OpenAI 将于下周正式向 Plus 用户推出 ChatGPT 高级语音模式的 Alpha 版本。

此时距离 OpenAI 宣布推迟该功能发布恰好过去了一个月时间。

src：
https://x.com/sama/status/1816560608554418401

09:40 · 2024年7月26日 · 周五

一个小站的自留地

与此同时，OpenAI 首席执行官山姆·阿特曼驳斥了路透社的一篇报道，报道称 OpenAI 将于下周一推出一款搜索产品。

OpenAI 发布 SearchGPT 原型,正式进军 AI 搜索领域

7 月 26 日凌晨,OpenAI 宣布推出名为 SearchGPT 的 AI 搜索引擎原型,正式宣告进军 AI 搜索领域,与 Google、Bing 以及 Perplexity 等竞争对手展开竞争。SearchGPT 旨在结合 OpenAI 的 AI 模型能力和网络信息,为用户提供快速、及时的答案,并附上清晰且相关的来源。

目前,SearchGPT 仅向 1 万名测试用户开放,以获取反馈意见。尽管这是一个临时原型,OpenAI 计划将其中最优功能直接整合到未来的 ChatGPT 中。感兴趣的用户可通过 https://chatgpt.com/search 申请内测。

SearchGPT 采用类似 ChatGPT 的对话式界面,由 GPT-4 系列模型驱动。它能够实时访问互联网信息,在回答中提供清晰的内嵌署名归属和链接,用户还可以在侧栏中快速访问更多带有源链接的结果。此外,SearchGPT 还支持多轮对话,每次查询都会积累共享的上下文。

OpenAI 表示,公司致力于建设一个繁荣的出版商和创作者生态系统。它已与多家新闻媒体达成合作,包括《大西洋月刊》、美联社和《华尔街日报》的母公司新闻集团等。这些合作旨在确保 AI 驱动的搜索建立在高质量、可靠的信息之上,同时保护内容来源。

（OpenAI、The Verge、WIRED、CNBC、The Guardian）

——————

Google 免费开放 Gemini 1.5 Flash AI 模型

Google 于 7 月 26 日宣布,将向所有用户免费开放其最新的 Gemini 1.5 Flash 大语言模型(LLM)。这一轻量级 AI 模型旨在与 OpenAI 的 GPT-4o mini 竞争,为用户提供更快、更智能的 AI 体验。

Gemini 1.5 Flash 模型现已在超过 230 个国家和地区的 40 多种语言中提供,可通过 Gemini 移动应用和 gemini.google.com 网页界面使用。Google 表示,用户将在响应质量和速度方面看到「全面的改进」,特别是在推理和图像理解方面。

新模型的一个显著特点是将上下文窗口扩大到了 32K tokens,是之前版本的四倍。（编注：与 ChatGPT 网页版的 GPT-4o 系列模型一致）这意味着它可以处理更长的输入,进行更复杂的对话。Google 还计划在近期添加从 Google Drive 或设备直接上传文件的功能,以充分利用这一扩展的上下文窗口。

除了模型升级,Google 还宣布了其他更新。它在某些国家/地区为英语提示词添加了相关内容链接,以帮助用户进一步探索话题。Google 还在欧洲经济区(EEA)、英国和瑞士逐步推出 Google Messages 中的 Gemini 功能,并扩展了支持的语言。

此外,Google 计划在未来几周内向全球 13 岁以上的青少年开放 Gemini 访问权限,同时实施额外的安全措施和政策。

（Google 官方博客、ZDNet、TechCrunch、The Verge、Engadget）

——————

OpenAI 被认为发展放缓，仅在竞争对手发出新产品时通过放出功能原型争夺关注。

而随着 Gemini 数次更新推迟，且新模型迟迟未出，网友们对谷歌也渐渐失去了耐心。

Gemini 的下一次更新将在八月中旬。

07:38 · 2024年7月25日 · 周四

Mistral AI 发布 Mistral Large 2，123B 大小，128k 上下文，支持包括法语、德语、西班牙语、意大利语、葡萄牙语、阿拉伯语、印地语、俄语、中文、日语和韩语在内的数十种语言。

性能方面，官方宣称表现远超之前的 Mistral Large，与 GPT-4o、Claude 3 Opus 和 Llama 3.1 405B 相媲美。

开源地址: https://huggingface.co/mistralai/Mistral-Large-Instruct-2407

20:02 · 2024年7月24日 · 周三

一个小站的自留地

据信是 Llama 3-405B 的模型以及基准测试成绩已经被泄露。网友整理的模型下载地址： https://x.com/kimmonismus/status/1815314833236984274 从泄露的基准测试成绩来看，Llama 3-405B 模型在大多数方面优于 GPT-4o，这一结果或侧面表面 GPT-4o 模型蒸馏后的模型参数小于这一量级。据新智元报道，除了最大的405B，Meta这次还升级了5月初发布的8B和70B模型，并将上下文长度全部提升到了128K。至此，模型版本也正式从Llama…

Llama3.1 中文能力基准测试：超过GPT-4 Turbo，弱于GPT-4o

Meta于7月23日发布Meta Llama 3.1 405B，并认为这是世界上最大、功能最强大的开源基础模型。顶级开源模型Llama 3.1 405B的上下文长度扩展到了 128K、支持八种语言，在常识、可操纵性、数学、工具使用和多语言翻译等方面可与 GPT-4、GPT-4o、Claude 3.5 Sonnet 等领先的闭源模型相媲美。

SuperCLUE选取了中文推理相关的核心任务进行了深入测评：

- 在完成SuperCLUE推理任务时，Llama 3.1 405B的整体得分为88.44，超过GPT-4 Turbo，仅次于GPT-4o，暂据排行榜第二。

- Llama 3.1 405B在SC-Math6数学基准上得分91.19分，判定为推理等级5，与GPT-4o相比仅有0.58分的差距，领先其他模型。

- Llama 3.1 405B在SC-Code3代码基准上得分69.68分，接近70分，较GPT-4 Turbo略高（0.11分），与GPT-4o有一定差距（2分）。

（SuperCLUE）

10:46 · 2024年7月23日 · 周二

一个小站的自留地

Meta 将于 7 月 23 日发布 Llama 3-405B 模型据 The Information 报道，Meta 计划于 2024 年 7 月 23 日发布其最大规模的 Llama 3 模型。这一版本拥有 4050 亿个参数，不仅能处理文本，还具备理解和生成图像的多模态能力。（The Information）此前（7 月 1 日）本频曾提到 Meta 正在 WhatsApp 上进行测试 Llama 3-405B 模型，并可能于近期向公众开放。社区普遍认为，根据 Meta 此前提供的模…

据信是 Llama 3-405B 的模型以及基准测试成绩已经被泄露。

网友整理的模型下载地址：
https://x.com/kimmonismus/status/1815314833236984274

从泄露的基准测试成绩来看，Llama 3-405B 模型在大多数方面优于 GPT-4o，这一结果或侧面表面 GPT-4o 模型蒸馏后的模型参数小于这一量级。

据新智元报道，除了最大的405B，Meta这次还升级了5月初发布的8B和70B模型，并将上下文长度全部提升到了128K。
至此，模型版本也正式从Llama 3迭代到了Llama 3.1。

09:56 · 2024年7月21日 · 周日

一个小站的自留地

Windows出现全球大规模蓝屏事件 2024年7月19日,全球多地Windows用户遭遇大规模蓝屏故障,导致银行、航空、媒体等行业业务中断。事件始于日本时间13:30左右,随后迅速蔓延至澳大利亚、欧洲和美国。故障源于网络安全公司CrowdStrike的软件更新问题。受影响的Windows设备启动时会显示蓝屏,并进入恢复模式或重启循环。澳大利亚国家广播公司、联邦银行、澳新银行、Qantas航空等多家企业系统受到影响。英国Sky News一度被迫中断直播。美国多家航空公司,包括Frontier、Uni…

CrowdStrike 故障技术剖析:配置更新中的逻辑错误导致 Windows 蓝屏

2024 年 7 月 19 日,CrowdStrike 发布的一次配置更新引发了全球性故障,导致大量 Windows 设备出现蓝屏。

故障源于 CrowdStrike Falcon 安全软件中的一个名为「通道文件」(Channel File)的配置组件。这些文件位于 Windows 系统的 C:\Windows\System32\drivers\CrowdStrike\ 目录下,文件名以「C-00000291-」开头,以「.sys」结尾。在 7 月 19 日 04:09 UTC 发布的更新中,编号为 291 的通道文件包含了一个逻辑错误,导致运行 CrowdStrike Falcon 软件的 Windows 系统崩溃并出现蓝屏。

CrowdStrike 表示,这次更新原本旨在针对新观察到的恶意命名管道(named pipes)提供保护,这些管道常被用于网络攻击中的命令与控制(C2)框架。然而,配置更新触发了逻辑错误,导致操作系统崩溃。公司强调,这个问题并非由网络攻击引起,而是一个软件缺陷。

受影响的系统主要是运行 CrowdStrike Falcon 7.11 及以上版本的 Windows 设备,且在 7 月 19 日 04:09 UTC 至 05:27 UTC 期间在线并下载了更新配置。CrowdStrike 在发现问题后迅速发布了修复,并在其支持门户和博客上提供了最新的修复建议和信息。

Microsoft 在其博客中补充说明,这个故障影响了约 850 万台 Windows 设备,占全球 Windows 设备总数的不到 1%。尽管比例较小,但由于 CrowdStrike 的客户多为运营关键服务的企业,故障造成了广泛的经济和社会影响。

为了加速修复进程,CrowdStrike 承诺进行彻底的根本原因分析,以确定逻辑错误的发生原因,并改进其流程以防止类似问题再次发生。公司首席执行官 George Kurtz 也在博客中向受影响的客户致歉,并强调将继续改进流程,以增强系统的稳定性和安全性。

（CrowdStrike 官方博客、Microsoft 博客、SC Magazine）

Before

After