搜狗输入法在 Windows 上被确认存在严重的越权漏洞
目前搜狗输入法在 Windows 上被确认存在严重的越权漏洞。Windows 环境中,攻击者在能访问到系统登录界面的情况下(位于电脑终端前/电脑开启了远程桌面/使用了ToDesk、向日葵等远程控制软件),无需知晓账号密码即可获取操作系统权限,继而实现增加帐号、修改管理员密码、拷贝文件、植入木马等非法操作。
复现方式
据本频信源,国内已有企事业单位内部通知「必须卸载搜狗输入法」。
搜狗方面回应称,「经搜狗输入法安全团队排查,该问题仅存在于特定版本Windows系统,是由于微软屏幕键盘等相关程序主动以特权接口加载中文输入法导致。我们已将此系统漏洞通知微软相关团队。
在微软修复该漏洞前,为更有效保护用户安全,我们已采取了主动规避措施,在Windows登录界面下搜狗输入法将主动退出加载执行。」
有安全人员解释称,这个是微软登陆界面的0day漏洞,经过测试某度输入法、谷歌拼音也可以复现。
如:
2015年《利用手心输入法绕过win8登录密码保护执行任意命令》https://wooyun.xyz/bug_detail.php?wybug_id=wooyun-2015-0130018
2018年《神漏洞:微软小娜可让任何人修改Windows 10密码》https://www.secrss.com/articles/3348
2020年《利用某度输入法绕过windows登录和提权服务器》https://cn-sec.com/archives/76228.html
目前搜狗输入法在 Windows 上被确认存在严重的越权漏洞。Windows 环境中,攻击者在能访问到系统登录界面的情况下(位于电脑终端前/电脑开启了远程桌面/使用了ToDesk、向日葵等远程控制软件),无需知晓账号密码即可获取操作系统权限,继而实现增加帐号、修改管理员密码、拷贝文件、植入木马等非法操作。
复现方式
据本频信源,国内已有企事业单位内部通知「必须卸载搜狗输入法」。
搜狗方面回应称,「经搜狗输入法安全团队排查,该问题仅存在于特定版本Windows系统,是由于微软屏幕键盘等相关程序主动以特权接口加载中文输入法导致。我们已将此系统漏洞通知微软相关团队。
在微软修复该漏洞前,为更有效保护用户安全,我们已采取了主动规避措施,在Windows登录界面下搜狗输入法将主动退出加载执行。」
有安全人员解释称,这个是微软登陆界面的0day漏洞,经过测试某度输入法、谷歌拼音也可以复现。
如:
2015年《利用手心输入法绕过win8登录密码保护执行任意命令》https://wooyun.xyz/bug_detail.php?wybug_id=wooyun-2015-0130018
2018年《神漏洞:微软小娜可让任何人修改Windows 10密码》https://www.secrss.com/articles/3348
2020年《利用某度输入法绕过windows登录和提权服务器》https://cn-sec.com/archives/76228.html
2024 年 8 月 1 日,Google 推出了 Gemini 1.5 Pro 的实验版本 (0801),并在 Google AI Studio 和 Gemini API 上开放早期测试。该模型在多项基准测试中表现出色,尤其在 LMSYS Chatbot Arena 排行榜上首次超越 OpenAI 的 GPT-4o 和 Anthropic 的 Claude-3.5 Sonnet,以 1300 的 ELO 分数夺得榜首。
Gemini 1.5 Pro (0801) 展现了强大的多语言能力,在中文、日语、德语和俄语等语言任务中均排名第一。此外,该模型还在数学和复杂提示词处理方面表现优异。然而,在编码和困难提示词领域,Claude 3.5 Sonnet、GPT-4o 和 Llama 405B 仍然保持领先地位。
在对战胜率方面,Gemini 1.5 Pro (0801) 对阵 GPT-4o 的胜率为 54%,对阵 Claude-3.5-Sonnet 的胜率为 59%。值得一提的是,该模型还在 LMSYS 的视觉任务排行榜上同样夺得第一。
Gemini 1.5 Pro (0801) 拥有 100 万个词元的上下文窗口,这是目前全球最大的聊天机器人上下文窗口之一。这使得它能够更深入地理解长文本输入,并在多模态任务中展现出色表现。
在实际测试中,Gemini 1.5 Pro (0801) 在图像信息提取、PDF 文档内容提取和代码生成等方面表现出色。例如,它能够准确地从发票图像中提取信息并以 JSON 格式输出,还能从学术论文 PDF 中提取章节目录。在代码生成方面,模型能够创建复杂的 Python 游戏来帮助学习 LLM 知识。
尽管如此,Gemini 1.5 Pro (0801) 在某些简单问题上仍有失误,在处理一些推理问题时仍有改进空间。
(综合 机器之心、VentureBeat、Twitter)
2024 年 7 月 30 日,AI 图像生成工具 Midjourney 正式推出 v6.1 版本。该版本在多个方面实现了显著提升:
- 图像连贯性增强,特别是在手臂、腿、手等人体部位的生成上更加自然
- 图像质量大幅提高,减少了像素伪影,增强了纹理和皮肤细节
- 小细节更加精确,如眼睛、小脸等特征的生成更为准确
- 生成速度提升约 25%
- 新增 --q 2 模式,可生成更多纹理细节
此外,v6.1 版本还更新了放大和个性化模型,进一步提升了生成图像的整体美观度。Midjourney 表示,这是目前他们「最好的模型」。
Midjourney 自 2022 年推出以来,凭借其强大的 AI 绘画能力迅速成为该领域的领先者之一。
(Midjourney)
微软服务状态网站上的一则警报称,此次宕机影响了微软Azure、Microsoft 365、云系统Intune和Entra 等。
当地时间7月30日上午,微软公司在社交媒体平台 X 上发布的帖子中表示,该问题影响了“多项 Microsoft 365 服务和功能”。Microsoft 365 包括 Outlook、Word 和 Excel 等常用生产力应用程序。微软公司在帖子中表示:“我们目前正在调查多项 Microsoft 365 服务和功能的访问问题和性能下降。有关详细信息,请参阅管理中心的‘MO842351’。”
微软公司表示,Azure 云应用程序的中断是由分布式拒绝服务 (DDoS) 网络攻击引发的。微软在状态更新中表示,DDoS 攻击始于周二早间,微软自动保护机制的错误加剧了影响,而不是减轻了影响。多个地区的客户受到影响,包括在 Azure 上运行的服务。据知情人士透露,由于 Azure 出现问题,星巴克的移动订购服务被停用了数小时。
国行 Mac 可使用如下方式激活 Apple Intelligence,并且可以联动其他设备激活通知过滤等少数本地 AI 功能。
Ref: https://x.com/openai/status/1818353580279316863
据本频观察,参与本次测试的用户大多是 OpenAI 社群志愿者、科技博主等。普通用户被灰度到的概率较小。
此前 Claude 和 DeepSeek 都相继在 API 上测试 8K 输出,而 GPT-4o-mini 则在 API 提供 16K 长度的输出。
Apple 于 7 月 30 日向开发者推送了 iOS 18.1、iPadOS 18.1 和 macOS Sequoia 15.1 的首个测试版,正式启动 Apple Intelligence 功能的首轮测试。
这些测试版仅面向支持 Apple Intelligence 的设备推送,包括非中国大陆和欧盟销售的 iPhone 15 Pro 和 iPhone 15 Pro Max, 以及搭载 M1 及更高版本芯片的 iPad 和 Mac 设备。目前开放的功能包括:全新 Siri 界面、通话录音、智能改写、邮件摘要和智能回复等。值得注意的是,ChatGPT 集成等部分功能尚未开放。
通话录音功能可在通话界面左上角点击录音按钮启用,系统会用 AI 语音提示「正在录音」。录音完成后将保存在「备忘录」应用中,并可生成摘要。
此次更新还新增了「减少打扰」专注模式,利用 Apple Intelligence 过滤不重要的通知。然而,由于中国大陆设备暂不支持 Apple Intelligence, 该功能也无法使用。
除通话录音外,Apple Intelligence 目前对中国大陆和欧盟销售的设备不可用,这是一种硬件级锁定,无论设备位于何处都无法启用。但香港、澳门和英国用户不受此限制。
开发者需要在设备的「设置」应用中加入 Apple Intelligence 候补名单,可能还需要将系统地区设置为美国。Apple 表示,正式版 Apple Intelligence 功能预计将于今年秋季推出,但初期仍将处于测试阶段。值得注意的是,Apple Intelligence 不会包含在今年 9 月发布的 iOS 18 正式版中,而是计划在之后的 iOS 18.1 更新中推出。
同时,Apple 发布了一份详细的 技术报告 ,首次披露了 Apple Intelligence 背后的基础模型架构和训练过程。
根据技术报告,Apple Intelligence 由两个主要模型组成:一个约 30 亿参数的设备端模型(AFM-on-device, Apple Foundation Models on device)和一个更大的服务器端模型(AFM-server)。这些模型采用了创新的架构设计,包括共享输入/输出嵌入矩阵、预归一化、查询/键归一化等技术,以提高模型效率和稳定性。
Apple 强调了其在负责任 AI 开发方面的努力。公司制定了全面的安全分类法,涵盖 12 个主要类别和 51 个子类别,用于评估潜在风险。在训练数据方面,Apple 严格筛选,不使用用户私人数据,并采取措施排除潜在有害内容。
为了提高模型性能和效率,Apple 采用了 LoRA (Low-Rank Adaptation) 适配器技术和创新的量化方法。这些技术使得 AFM-on-device 模型能够在保持高性能的同时,将参数压缩到平均每权重不到 4 位。
在人类评估中,AFM 模型在多项任务上表现出色。例如,AFM-on-device 在指令遵循能力上优于 Phi-3-mini、Gemma-7B 等模型,而 AFM-server 在功能调用基准测试中超越了 Gemini-1.5-Pro 和 GPT-4。
(MacRumors、9to5Mac、CNBeta、蓝点网)
有网友发现广受欢迎的开源 CDN 系统 GoEdge 可能遭遇供应链攻击。研究显示,从 v1.3.9 到 v1.4.1 版本的 GoEdge 中包含可疑 JavaScript 代码。本次被投毒的资源是https://cdn.jsdelivr[.]vip/jquery.min-3.7.0.js, 使用了与polyfill[.]io 事件相同的方能 CDN(也即 51.la 相关事件),因此该事件或与近期备受关注的 polyfill[.]io 供应链攻击案例存在关联。
据悉,GoEdge 原开发者于今年 4 月基本消失,5 月 20 日在 QQ 群发布最后一条消息。5 月 24 日,可疑代码首次出现在发布包中。7 月,该问题被公开披露。
对可疑代码进行分析后发现,该代码会检测用户环境、访问时间,并进行关键词匹配。符合条件时,代码会将用户重定向至域名为 wweeza[.]com 的博彩网站。
早前,GoEdge 的域名所有权已经发生变更。 goedge.cn 域名被转出,备案信息从刘**变更为莫**,并重定向至 goedge.cloud。销售渠道也从淘宝转为 Telegram。
对此,现 GoEdge 官方在 Telegram 群组中先是否认问题存在,随后又重新编译并发布了无恶意代码的 v1.4.1 版本。
7月26日,DeepSeek宣布其API进行重大更新,新增多项功能以增强模型能力:
1. 更新 /chat/completions 接口:
- 新增 JSON Output 功能,可强制模型输出 JSON 格式字符串,方便后续处理
- 增加 Function Calling 功能,支持调用外部工具,增强模型与现实世界交互能力
- 新增对话前缀续写功能(Beta),允许用户指定 assistant 消息前缀进行补全
- 将最长输出提升至 8K tokens(Beta)
2. 新增 /completions 接口:
- 增加 FIM 补全功能(Beta),支持用户提供自定义前缀/后缀进行内容补全
所有新功能均可用于 deepseek-chat 和 deepseek-coder 模型。Beta 功能需将 base_url 设为 https://api.deepseek.com/beta 开启。
DeepSeek 表示,这些更新旨在释放模型更多潜力,提升自动化能力和与现实世界的交互。Beta 功能开放给所有用户使用,相关模型版本稳定后将发布到开源社区。
用户可访问 DeepSeek API 官方文档(https://platform.deepseek.com/api-docs/zh-cn/)获取详细使用说明。
(深度求索 DeepSeek)
7月26日,智谱AI宣布推出新一代视频生成模型CogVideoX,并在其AI助手「智谱清言」的各平台上线名为「清影」(Ying)的视频生成功能。所有用户均可免费体验AI文本生成视频和图像生成视频的服务。
CogVideoX在内容连贯性、可控性和模态融合方面有显著创新:
- 采用自研的三维变分自编码器(3D VAE)结构,将视频压缩至原始大小的2%,显著提升内容连贯性。
- 开发端到端视频理解模型,增强对文本的理解和指令遵循能力。
- 创新性地设计将文本、时间、空间三维融合的transformer架构,优化模态间交互。
「清影」可在30秒内生成6秒视频,具备高效的指令遵循能力、良好的内容连贯性和灵活的画面调度能力。
在生态合作方面,B站参与了清影的技术研发过程,华策影视也参与了模型共建。清影的训练依托北京亦庄高性能算力集群,未来将应用于亦庄的高精尖产业集群。
用户可通过智谱清言的PC端、移动应用端、小程序端或访问https://chatglm.cn/video 使用该服务。企业和开发者也可通过智谱大模型开放平台bigmodel.cn的API调用该功能。
智谱AI CEO张鹏表示,公司已验证Scaling Law在视频生成领域的有效性,未来将继续扩大数据和模型规模,并探索更具突破性的新型模型架构。
(GLM大模型)
src:
https://mp.weixin.qq.com/s/Xua54oISZGB6lPCI3pWoTQ
OpenAI CEO Sam Altman 在社交平台 X 上宣布,OpenAI 将于下周正式向 Plus 用户推出 ChatGPT 高级语音模式的 Alpha 版本。
7 月 26 日凌晨,OpenAI 宣布推出名为 SearchGPT 的 AI 搜索引擎原型,正式宣告进军 AI 搜索领域,与 Google、Bing 以及 Perplexity 等竞争对手展开竞争。SearchGPT 旨在结合 OpenAI 的 AI 模型能力和网络信息,为用户提供快速、及时的答案,并附上清晰且相关的来源。
目前,SearchGPT 仅向 1 万名测试用户开放,以获取反馈意见。尽管这是一个临时原型,OpenAI 计划将其中最优功能直接整合到未来的 ChatGPT 中。感兴趣的用户可通过 https://chatgpt.com/search 申请内测。
SearchGPT 采用类似 ChatGPT 的对话式界面,由 GPT-4 系列模型驱动。它能够实时访问互联网信息,在回答中提供清晰的内嵌署名归属和链接,用户还可以在侧栏中快速访问更多带有源链接的结果。此外,SearchGPT 还支持多轮对话,每次查询都会积累共享的上下文。
OpenAI 表示,公司致力于建设一个繁荣的出版商和创作者生态系统。它已与多家新闻媒体达成合作,包括《大西洋月刊》、美联社和《华尔街日报》的母公司新闻集团等。这些合作旨在确保 AI 驱动的搜索建立在高质量、可靠的信息之上,同时保护内容来源。
(OpenAI、The Verge、WIRED、CNBC、The Guardian)
——————
Google 免费开放 Gemini 1.5 Flash AI 模型
Google 于 7 月 26 日宣布,将向所有用户免费开放其最新的 Gemini 1.5 Flash 大语言模型(LLM)。这一轻量级 AI 模型旨在与 OpenAI 的 GPT-4o mini 竞争,为用户提供更快、更智能的 AI 体验。
Gemini 1.5 Flash 模型现已在超过 230 个国家和地区的 40 多种语言中提供,可通过 Gemini 移动应用和 gemini.google.com 网页界面使用。Google 表示,用户将在响应质量和速度方面看到「全面的改进」,特别是在推理和图像理解方面。
新模型的一个显著特点是将上下文窗口扩大到了 32K tokens,是之前版本的四倍。(编注:与 ChatGPT 网页版的 GPT-4o 系列模型一致)这意味着它可以处理更长的输入,进行更复杂的对话。Google 还计划在近期添加从 Google Drive 或设备直接上传文件的功能,以充分利用这一扩展的上下文窗口。
除了模型升级,Google 还宣布了其他更新。它在某些国家/地区为英语提示词添加了相关内容链接,以帮助用户进一步探索话题。Google 还在欧洲经济区(EEA)、英国和瑞士逐步推出 Google Messages 中的 Gemini 功能,并扩展了支持的语言。
此外,Google 计划在未来几周内向全球 13 岁以上的青少年开放 Gemini 访问权限,同时实施额外的安全措施和政策。
(Google 官方博客、ZDNet、TechCrunch、The Verge、Engadget)
——————
OpenAI 被认为发展放缓,仅在竞争对手发出新产品时通过放出功能原型争夺关注。
而随着 Gemini 数次更新推迟,且新模型迟迟未出,网友们对谷歌也渐渐失去了耐心。
Gemini 的下一次更新将在八月中旬。
Mistral AI 发布 Mistral Large 2,123B 大小,128k 上下文,支持包括法语、德语、西班牙语、意大利语、葡萄牙语、阿拉伯语、印地语、俄语、中文、日语和韩语在内的数十种语言。
性能方面,官方宣称表现远超之前的 Mistral Large,与 GPT-4o、Claude 3 Opus 和 Llama 3.1 405B 相媲美。
开源地址: https://huggingface.co/mistralai/Mistral-Large-Instruct-2407
性能方面,官方宣称表现远超之前的 Mistral Large,与 GPT-4o、Claude 3 Opus 和 Llama 3.1 405B 相媲美。
开源地址: https://huggingface.co/mistralai/Mistral-Large-Instruct-2407
Meta于7月23日发布Meta Llama 3.1 405B,并认为这是世界上最大、功能最强大的开源基础模型。顶级开源模型Llama 3.1 405B的上下文长度扩展到了 128K、支持八种语言,在常识、可操纵性、数学、工具使用和多语言翻译等方面可与 GPT-4、GPT-4o、Claude 3.5 Sonnet 等领先的闭源模型相媲美。
SuperCLUE选取了中文推理相关的核心任务进行了深入测评:
- 在完成SuperCLUE推理任务时,Llama 3.1 405B的整体得分为88.44,超过GPT-4 Turbo,仅次于GPT-4o,暂据排行榜第二。
- Llama 3.1 405B在SC-Math6数学基准上得分91.19分,判定为推理等级5,与GPT-4o相比仅有0.58分的差距,领先其他模型。
- Llama 3.1 405B在SC-Code3代码基准上得分69.68分,接近70分,较GPT-4 Turbo略高(0.11分),与GPT-4o有一定差距(2分)。
(SuperCLUE)
网友整理的模型下载地址:
https://x.com/kimmonismus/status/1815314833236984274
从泄露的基准测试成绩来看,Llama 3-405B 模型在大多数方面优于 GPT-4o,这一结果或侧面表面 GPT-4o 模型蒸馏后的模型参数小于这一量级。
据新智元报道,除了最大的405B,Meta这次还升级了5月初发布的8B和70B模型,并将上下文长度全部提升到了128K。
至此,模型版本也正式从Llama 3迭代到了Llama 3.1。
2024 年 7 月 19 日,CrowdStrike 发布的一次配置更新引发了全球性故障,导致大量 Windows 设备出现蓝屏。
故障源于 CrowdStrike Falcon 安全软件中的一个名为「通道文件」(Channel File)的配置组件。这些文件位于 Windows 系统的
C:\Windows\System32\drivers\CrowdStrike\
目录下,文件名以「C-00000291-」开头,以「.sys」结尾。在 7 月 19 日 04:09 UTC 发布的更新中,编号为 291 的通道文件包含了一个逻辑错误,导致运行 CrowdStrike Falcon 软件的 Windows 系统崩溃并出现蓝屏。CrowdStrike 表示,这次更新原本旨在针对新观察到的恶意命名管道(named pipes)提供保护,这些管道常被用于网络攻击中的命令与控制(C2)框架。然而,配置更新触发了逻辑错误,导致操作系统崩溃。公司强调,这个问题并非由网络攻击引起,而是一个软件缺陷。
受影响的系统主要是运行 CrowdStrike Falcon 7.11 及以上版本的 Windows 设备,且在 7 月 19 日 04:09 UTC 至 05:27 UTC 期间在线并下载了更新配置。CrowdStrike 在发现问题后迅速发布了修复,并在其支持门户和博客上提供了最新的修复建议和信息。
Microsoft 在其博客中补充说明,这个故障影响了约 850 万台 Windows 设备,占全球 Windows 设备总数的不到 1%。尽管比例较小,但由于 CrowdStrike 的客户多为运营关键服务的企业,故障造成了广泛的经济和社会影响。
为了加速修复进程,CrowdStrike 承诺进行彻底的根本原因分析,以确定逻辑错误的发生原因,并改进其流程以防止类似问题再次发生。公司首席执行官 George Kurtz 也在博客中向受影响的客户致歉,并强调将继续改进流程,以增强系统的稳定性和安全性。
(CrowdStrike 官方博客、Microsoft 博客、SC Magazine)