起于小站,终于生活。
现实之外,一个普通人的思考。

博客地址:ygxz.in
讨论组:https://t.me/+a5Clq4jLuJc4YWQ9
中国 IPv6 活跃用户数占比达 73%

IPv6 是全球公认的下一代互联网发展方向,近年来取得了显著增长。截至 2024 年 5 月,全球 IPv6 支持率约为 39%。在此背景下,中国 IPv6 规模部署也取得了显著进展。截至 2024 年 4 月,中国 IPv6 地址拥有量为 67459 块/32,位居全球第二,占全球 IPv6 地址的 15.05%。

截至 2024 年 4 月,中国 IPv6 活跃用户数达 7.878 亿,占网民总数的 73.01%,相比 2019 年的 24.35% 大幅提升。此外,中国移动网 IPv6 流量占比已从 2019 年的 0.02% 攀升至 2024 年的 63.28%。数据显示,中国排名前 100 位的互联网网站 IPv6 支持率为 77.17%,而排名前 100 位的移动互联网应用(App)IPv6 支持率高达 99%。

APNIC 首席科学家 Geoff Huston 表示,虽然 IPv4 地址分配较为谨慎,但 IPv6 的宣告率较低,未来大规模传感器网络和物联网部署可能会增加对 IPv6 地址的需求。

(中国教育网络)
Bilibili开源轻量版大模型Index-1.9B

BiliBili近日开源了其大模型Index轻量版Index-1.9B系列,相关代码和模型文件已在 GitHubHuggingface 上发布,可供商用。

本次开源的Index-1.9B系列包含四个版本:

• Index-1.9B base:基础版,具备19亿非词嵌入参数量,经过2.8T中英文语料的预训练,具有广泛的语言理解能力,适用于通用的AI任务处理。

• Index-1.9B pure:该版本严格过滤了所有指令相关的数据,旨在验证指令对模型表现的影响,使其在需要纯粹语言处理的应用中表现更佳。

• Index-1.9B chat:基于Index-1.9B base,通过SFT和DPO对齐后的对话模型,预训练引入了大量定向清洗的对话类语料,能够显著提升聊天的趣味性,适用于开发聊天机器人和客服系统。

• Index-1.9B character:在SFT和DPO基础上引入了RAG技术,实现了Few-Shot角色扮演定制。该版本针对角色代理进行了优化,在虚拟角色扮演和互动娱乐中表现更为出色。

据开发团队介绍,在多个评测基准上,Index-1.9B系列模型均处于同级别模型的领先地位。

(彩虹之眼)
一个小站的自留地
快手「可灵」:可能是「中国版Sora」 在快手13周年庆典上,快手毫无预兆地发布了AI视频大模型「可灵」。 「可灵」支持生成最长2分钟、30fps的1080P视频,从头脑风暴到可发布作品的一键转化功能,让全球用户大为震撼。其生成效果不仅超越了Sora,还引发了硅谷创投圈的热议。Stability AI前CEO Emad Mostaque称赞中国AI技术有其独特优势,YC CEO也在X平台转发了可灵生成的视频示例。 「可灵」成为国内首个文生视频产品级应用,不论是在生成视频的连续性、真实度和清晰度方面,…
电影级视频生成模型 Dream Machine:号称「比 Sora 更真实流畅」

Luma 推出了名为 Dream Machine 的AI视频生成模型,号称比 OpenAI 的 Sora 更真实、更流畅。Dream Machine 可以通过文本、图片快速生成高质量视频,生成速度极快,每120秒可以生成120帧画面,动作逼真、连贯,角色一致性强,能够模拟物理世界。

Dream Machine 的核心优势在于其对物理世界中人类、动物和物体互动方式的深刻理解,使得其生成的视频内容角色表现一致且物理效果精确,进一步增强了视频的真实感。Luma 的团队通过高度可扩展且效率极高的 Transformer 模型直接在视频数据上进行训练,使 Dream Machine 能够生成物理上精确、连贯且富有故事性的画面。

目前,Dream Machine 已经向所有用户免费开放公测,体验地址为: https://lumalabs.ai/dream-machine 。Luma 公司的核心团队包括多位在计算机视觉、图形学和深度学习领域有着深厚技术积累的科学家。

(APPSO, 赛博禅心)
快手「可灵」:可能是「中国版Sora」

在快手13周年庆典上,快手毫无预兆地发布了AI视频大模型「可灵」。

「可灵」支持生成最长2分钟、30fps的1080P视频,从头脑风暴到可发布作品的一键转化功能,让全球用户大为震撼。其生成效果不仅超越了Sora,还引发了硅谷创投圈的热议。Stability AI前CEO Emad Mostaque称赞中国AI技术有其独特优势,YC CEO也在X平台转发了可灵生成的视频示例。

「可灵」成为国内首个文生视频产品级应用,不论是在生成视频的连续性、真实度和清晰度方面,还是在创作者社区的反响上,都表现出色。其背后的Diffusion Transformer(DiT)架构和团队自研的3D VAE网络,使得「可灵」能够生成高质量的电影级视频,为多个行业带来了变革潜力。

在实测中,「可灵」的极度真实物理规律表现令人惊叹,尽管在一些复杂交互场景上仍有提升空间,但其在真实风格场景下的表现非常优异。随着未来版本的更新,「可灵」有望在图生视频功能上表现更加出色。对于专业AI视频创作者而言,「可灵」的发布无疑激发了新的创作热情和可能性。

Diffusion模型的工作原理类似于「加噪声再还原」的游戏。首先,模型会将一张清晰的图片逐渐加上噪声,直到完全模糊。接着,模型学习如何一步步去除噪声,将图片还原成最初的清晰状态。快手「可灵」和「Sora」背后的DiT模型通过引入Transformer架构,提高了图像生成的质量。Transformer的「注意力机制」让模型能够抓住数据中的关键信息,从而更精准地去除噪声,生成高质量图像。

目前,「可灵」的测试申请人数已超过5万。

(机器之心、数字生命卡兹克、赛博禅心)
苹果 WWDC 24速评:该有的,来了

北京时间6月 11 日凌晨,苹果在线上直播了本次 WWDC 24 的主题演讲,和往常一样,聚焦各个系统的软件更新,也如市场和消费者期待的那般,苹果终于将「生成式AI」带到了自己的软件生态中。然而,大洋彼岸的这群天才们,却想到了独属于苹果的「Apple Intelligence」一词。

我全程观看了发布会直播,由 visionOS 开始的系统常规更新实话说惊喜不算大,甚至我认为 iOS 的许多更新可以用不痛不痒来形容。(事实上开场苹果股价跌近 1%)直到 iPadOS 的计算器和Math Notes 的加入,以及Smart Script的介绍,才让我找回了WWDC 的感觉:苹果其实很擅长做软件,也许曾经是、未来是,现在还不一定是。

苹果将本次Apple Intelligence的一揽子 AI 功能更新,称为 Siri 的一大步,这也进一步表明苹果早已不满足于将 Siri 做成单独的语音助手,而是成为一个系统级的、随叫随到的、全能的个人助理。

而作为个人助理,最重要的应该是可靠性。这也是苹果并没有直接将 GPT-4o 的多模态端到端能力直接搬进 Siri 的原因——GPT 太不可控了。

苹果最终的方案,也即 WWDC 中第一次提及 OpenAI 和 ChatGPT,其实以及是非常靠后的事情,将 ChatGPT 放在文字生成和 Siri 增强功能中,通过用户二次确认的调用,加上明确表示内容来自 ChatGPT,既完成了对这一当今最强大模型的整合,又可以完全撇清生成结果的责任。高,真是高。

本次演讲中更新的功能,我认为可以分为三类:

- 别人有,用户想要,最终苹果抄过来的功能,比如 iOS 的通话录音、macOS 的 iPhone Mirror等等;
- 苹果认为用户需要的功能,比如 watchOS 和 tvOS 的一揽子不知道更新了什么的更新,以及 iOS 的新控制中心等等;
- 苹果为了将来的商业战略部署而画的大饼,比如Apple Intelligence和 macOS 的Game Porting Toolkit 2、Passwords 应用等等。

借用荔枝老师的 评价

「WWDC 24 看完了,结论就是,Apple still does it better。在现有功能的完成度上,如果 Apple 去做,它确实完成度会更高。各种 AI 的应用是要端云结合、要个人化场景化的,这个我很赞同。Vision Pro 的沉浸式内容建设任重道远。

苹果现在要同时抓两手了,一个是面向下一代设备形态的基础建设和转变,一个是对于 LLM(大语言模型)和本世代设备形态保持不变的情况下,对设备的使用方式进行革新的演进。两手都要抓。」


——————


WWDC 2024 各系统更新要点一览

Apple Intelligence(iOS、iPadOS、macOS)
- 全局写作工具:支持改写、校对和总结文本,可用于所有输入框。
- 图像生成:通过 Image Playground 生成动画、插图和素描风格图像。
- 照片编辑:支持自然语言搜索、视频片段搜索和背景清理。
- 隐私保护:采用设备端处理和私有云计算,确保数据安全。
- Siri 升级:更智能的交互,支持屏幕感知和多任务处理。
- Genmoji:生成自定义 Emoji 表情符号。
- ChatGPT 集成:iOS 18、iPadOS 18 和 macOS Sequoia 中将集成 ChatGPT 功能,采用 GPT-4o 无需注册即可访问。

visionOS 2
- 空间照片:将 2D 照片转换为 3D 空间照片。
- 新手势操作:更便捷的手势控制选项。
- 多分辨率支持:新增 Wide 和 Ultrawide 屏幕选项。
- 旅行模式:新增对火车的支持。
- 开发者支持:引入体积 API 和 TabletopKit。
- Apple Vision Pro:6 月 28 日开始在中国、日本和新加坡发售。

iOS 18
- 主屏幕定制:任意摆放应用图标,调整颜色和大小。
- 信息:支持文字效果、稍后发送和卫星信息。
- 照片:全新设计,支持按主题分类和轮播视图。
- 邮件:自动分类和概要视图。
- 应用锁:支持锁定和隐藏应用。
- 游戏模式:降低时延,稳定帧率。
- 控制中心:重新设计,增加分组页和全新控制选项。

iPadOS 18
- 计算器:新增 Math Notes 功能,支持手写数学表达式。
- Smart Script:实时调整手写文本,支持自动纠错和重新排版。
- 标签页栏:全新标签页设计,支持自定义顺序。
- 同播共享:支持远程控制设备。
- 多用户支持:允许多个用户共享一台设备,支持快速切换。

macOS Sequoia
- iPhone 镜像:在 Mac 上完全操作 iPhone。
- Safari Highlights:自动检测和突出显示网页相关内容。
- Passwords 应用:集中管理密码,支持跨设备同步。
- 窗口管理:全新窗口管理功能,支持平铺和分屏。
- 游戏支持:增加 Game Porting Toolkit 2,支持更多游戏移植到 macOS 平台。

watchOS 11
- Vitals:快速查看关键健康信息。
- 运动负荷:衡量锻炼强度和持续时间。
- 智能叠放:新增 Shazam 等小部件。
- 照片表盘:支持机器学习分析和动态模式。
- 活动圆环:支持自定义和暂停。
- 怀孕支持:记录孕期身心变化。
- 翻译应用:支持实时语音翻译。

Audio & Home
- AirPods:新增点头和摇头交互,支持个性化空间音频。
- tvOS 18:InSight 功能,支持 21:9 比例和全新屏幕保护程序。

(综合各媒体报道)
中国大陆主要 Docker 镜像因监管压力关闭

近日,中国大陆范围内多个 Docker Hub 镜像站突然停止服务,引发了广泛关注。三所大学运营的镜像站均表示是「上级主管通知」,导致关闭。此后,阿里云、百度云和 DaoCloud 的 Docker Hub 镜像站也纷纷停止了服务。

OpenWrt 路由器固件知名开发者 Lean 在 QQ 群中表示:「后续包括 Github CDN 镜像、NPM、Python PIP、OpenWrt OPKG 等未受内容审查的镜像服务器一律下架。」

6 月 6 日,上海交通大学的 Docker Hub 镜像加速器因监管要求被下架。SJTUG(上海交通大学 Linux 用户组)发布公告称已下架 Docker Hub 镜像,并建议用户尽快更换 Docker Hub 镜像站。

有分析认为,此次关闭可能与监管压力的加大有关。近年来,中国政府对互联网和数据安全的监管力度不断增强,类似的关闭事件时有发生。官方 Docker 镜像站 hub.docker.com 早在 2023 年 5 月 18 日便被 DNS 污染和 SNI 封锁,导致用户访问受阻。

(综合 前端之神、LoopDNS Plan、VPS 信号旗、荔枝木)

——————

2023 年 12 月 16 日至 17 日,开放原子开发者大会在无锡召开,由开放原子开源基金会主导,华为、浪潮等多家企业和社区共同建设的 AtomHub 可信镜像中心正式开放公测。该平台旨在为开源组织和开发者提供中立、开放共建的可信开源容器镜像中心,解决 Docker Hub 等镜像仓库在国内使用时的不稳定性和限流问题。

AtomHub 提供了官方镜像、认证社区镜像和认证厂商镜像三种类型,采用高性能存储引擎和多云 CDN 同步等技术,确保镜像的高安全性和高性能。

(IT之家)
一个小站的自留地
据 Apple, WWDC24 将在北京时间 6 月 11 日凌晨召开。 iOS 18预计将于2024年6月在WWDC上宣布,并计划9月向公众发布 这次更新被描述为iPhone迄今为止最大的一次,将引入重大的AI功能和设计变革,以及新的自定义选项。据报道,所有与iOS 17兼容的设备都将支持iOS 18。 此外,Apple正在开发包括更智能的Siri和Messages应用中的AI集成等新功能。 iOS 18还将支持RCS,为iPhone和Android用户之间的消息传递带来iMessage风格的功…
WWDC 24 前瞻:全面拥抱 AI

距离 WWDC 24 开幕还有三天时间,各种关于苹果即将发布的 AI 特性爆料已经铺天盖地。以下是本频根据多方信源整理出的 WWDC 24 全方位爆料信息。

- Project Greymatter / Apple Intelligence

多个信源指出,苹果将推出一个名为 「Project Greymatter」的 AI 工具集(彭博社声称「该系统将被称为 Apple Intelligence」),集成到 Safari、照片、备忘录、邮件等核心应用中。这个 AI 工具套件将具备「判断系统」,根据任务所需算力的高低,决定在设备本地还是云端处理。Greymatter 项目被认为是苹果普及 AI 技术的关键,预计将大幅提升 iOS 18 和 macOS 15 的用户体验。不过,也有消息指出,苹果可能不会立即在测试版系统中提供这些功能。而端侧大模型的运行则可能至少需要 A17 Pro 或 M1 芯片。

- Siri 大升级

Siri 将迎来重大升级,利用苹果自家(或合作伙伴)的大语言模型,提供更自然的交互体验。这些升级功能包括控制应用程序的能力、处理多步骤任务的能力,以及在 Apple Watch 上进行更多移动任务。苹果计划在未来几个月内逐步推出这些功能。

- 语音备忘录转录

语音备忘录将新增由 AI 大模型驱动的实时转录和摘要生成功能。


- 与 OpenAI 合作

据彭博社报道,苹果已与 OpenAI 达成合作协议,OpenAI 将为 iOS 18 提供 AI 聊天功能。尽管这一合作尚未得到官方确认,但如果属实,将标志着苹果在 AI 领域的重大进展。与此同时,苹果也在积极与 Google 洽谈,希望将 Gemini 模型作为备用方案。而在国内,此前一度有消息指出苹果将与百度的文心一言合作提供服务。

- 表情符号生成

苹果可能会推出基于 AI 的 emoji 生成功能,根据用户发送的短信内容自动创建相关表情,为 iMessage 带来更多个性化和趣味性。

- 图片和视频 AI 编辑

照片应用将引入 AI 修图功能,例如一键去除照片中的对象、优化表情等。类似功能已经在 Google 和其他厂商的产品中有所体现,苹果的实现效果值得期待。


- iOS 主屏幕自定义

iOS 18 可能将允许用户自由放置应用图标,提供更多个性化选项。此外,用户还可以统一设置应用图标颜色。这一更新将使 iOS 的主屏幕更具灵活性和个性化。

- AI 驱动的搜索改进

Spotlight 搜索和 Safari 浏览器的搜索功能可能将通过 AI 技术得到改进,提供更快、更准确的搜索体验。这些改进预计将提升用户的日常使用效率。


(The Information、TechCrunch、Founder Park、彭博社、9to5Mac、Mark Gurman、两颗皮蛋)
一个小站的自留地
通义千问 Qwen2 系列模型开源

中国时间 6 月 7 日 0 点,通义千问宣布 Qwen2 系列模型开源,包括 0.5B、1.5B、7B、57B-A14B (使用 Apache 2.0 协议)和 72B (使用 Qianwen License 协议)等多个版本。

技术参数方面,Qwen2 系列模型在各个尺寸都使用了 GQA (Generalized Query Attention),并且除了中英文外,还使用了其他 27 种语言的训练数据。具体上下文处理能力如下:

· 72B 和 7B 版本可处理 128K 上下文
· 57B-A14B 版本可处理 64K 上下文
· 0.5B 和 1.5B 版本可处理 32K 上下文

Github / Hugging Face 地址

(赛博禅心)
#停机维护 #计划

接上游服务商通知,一个小站的亚洲区域后端服务器将于 6 月 8 日 23:00 - 6月9日 07:00 进行设备维护,期间可能造成间歇停机。

一个小站的博客将在此期间跳转至静态备份页面,评论功能将暂时关闭。
一个小站的API商店在此期间将间歇性不可用。
一个小站的公益服务、网盘分发等服务将维持正常运行。
一个小站的自留地
英伟达 COMPUTEX 2024 主题演讲速评 NVIDIA 在此次演讲中备受关注,不仅业界对其寄予厚望,各路分析师也纷纷发表看法,希望这家 AI 芯片巨头能够推动一场真正的「新工业革命」。 在此次 COMPUTEX 2024 演讲中,NVIDIA 释放了三大重要信号: 1. 生成式 AI 将引领新工业革命。 2. NVIDIA 正在构建完整的生成式 AI 生态,强化全栈实力。 3. NVIDIA 布局机器人、自动驾驶等新兴领域,抢占未来增长点。 英伟达发布了下一代 GPU 架构 Black…
英伟达市值突破 3 万亿美元,超越苹果成为全球第二大市值公司

北京时间 6 月 5 日,英伟达(Nvidia)股价大涨 5.16%,市值首次突破 3 万亿美元,超越苹果公司,成为全球第二大市值公司。英伟达股价收于 1224.40 美元,总市值达到 3.01 万亿美元,而苹果市值为 3.00 万亿美元。

英伟达市值的增长得益于人工智能领域的快速发展,尤其是其图形处理芯片(GPU)在 AI 任务中的重要作用。自 2024 年以来,英伟达股价已经上涨了 147%,在过去 9 个交易日内,有 4 个交易日的市值上涨超过 1000 亿美元。

英伟达还宣布将进行 1 拆 10 的股票分割计划,预计将吸引更多的个人投资者,股票分割后的新股将于 6 月 10 日开始交易。公司 CEO 黄仁勋表示,未来英伟达将继续推动技术创新,并计划每年发布新产品,以保持在 AI 芯片市场的领先地位。

尽管苹果公司在近期股价也有所上涨,并重回 3 万亿美元市值,但与英伟达相比,其在 AI 领域的表现相对滞后。一些分析认为,英伟达未来有望超越微软,成为全球市值最高的公司。

(综合媒体报道)
ChatGPT 出现大规模长时间的全球宕机

OpenAI 的 ChatGPT 目前正在经历全球范围的部分宕机,多个平台的用户报告了问题,包括网页版、移动应用和桌面应用。截至发稿,本次故障已经持续约 4 小时。

据 DownDetector 报告,问题始于北京时间 6 月 4 日下午约 14:30。受影响的用户遇到了「500 内部服务器错误」的提示。在宕机报告平台DownDetector 上,世界各地均有故障报告。

根据 OpenAI 的状态页面,ChatGPT 正在经历重大宕机,OpenAI 于 6 月 4 日 15:21 在状态页面指出已经知晓出问题并正在进行修复。目前 OpenAI 尚未在社交媒体上发布任何关于此次宕机的声明。

据报道,此次宕机是自 GPT-4o 上线以来的第一次大规模宕机。

本次宕机仅影响 ChatGPT 网页版和客户端服务,不影响 API 使用。

(Downdetector, 9to5Google, Tom's Guide, TechCrunch, TechRadar)

——————

美东时间 6 月 4 日,OpenAI 旗下 ChatGPT、AnthropicAI 旗下 Claude 和 Perplexity 同时宕机,引发用户广泛质疑和讨论。OpenAI 表示宕机原因在于“内部服务器错误”;而 Claude 的网站则显示服务器组件渲染错误,建议用户「再试一次」;Perplexity 的网站显示超出容量的信息,提示用户稍后再试。

ChatGPT 先后经历两次宕机,OpenAI 于北京时间 6 月 5 日凌晨 1 点宣布问题解决,但未透露具体原因。其他两家 AI 平台也报告服务器超载问题,但在约一小时后得到解决。

目前,几家公司均未公布宕机的具体原因。据猜测,ChatGPT 的中断可能导致其他平台流量激增从而引发连锁反应。

(InfoQ、财联社)
斯坦福研究团队 Llama3-V 模型涉嫌抄袭

近日,斯坦福大学研究团队发布的 Llama3-V 模型因涉嫌抄袭清华大学和面壁智能合作开发的多模态模型 MiniCPM-Llama3-V 2.5 而引发广泛关注。Llama3-V 模型在发布后迅速走红,但被网友指出其模型结构、代码与分词器几乎完全照搬自 MiniCPM-Llama3-V 2.5,仅做了变量名称和格式上的修改。

事件起因于 Magic Yang 等用户在 GitHub 项目和 HuggingFace 项目页面中提出质疑,指出 Llama3-V 项目大量抄袭 MiniCPM-Llama3-V 2.5 的代码和配置文件。面对质疑,Llama3-V 的作者删除了相关讨论帖和项目库,并隐藏了 HuggingFace 项目页面。

Magic Yang 进一步指出,Llama3-V 模型使用了 MiniCPM-Llama3-V 2.5 分词器,其架构与 MiniCPM-Llama3-V 2.5 相同,连 MiniCPM-Llama3-V 2.5 新定义的特殊符号都被抄袭。对此,Llama3-V 的作者解释称,他们借鉴了 LLaVA-UHD 的架构,并使用了 MiniCPM-V-2 的分词器,但该解释被指出有明显时间错位和逻辑漏洞。

在外界质疑声中,Llama3-V 的 GitHub 和 HuggingFace 项目均显示为「404」或私密状态,斯坦福大学方面尚未对此事做出正式回应。

(彩虹之眼)
纽约证券交易所技术故障导致多只股票停牌

2024 年 6 月 3 日,纽约证券交易所(NYSE)发生技术故障,导致包括伯克希尔哈撒韦(Berkshire Hathaway)在内的多只股票停牌。

NYSE 在当地时间上午 10:11 发布更新声明称,正在调查与涨跌幅限制(LULD)带相关的技术问题。据悉,伯克希尔哈撒韦的 A 类股票价格错误地显示为 185.10 美元,跌幅达 99.97%。

此外,数只美股疑似出现行情异常,蒙特利尔银行、巴里克黄金等股票跌幅在 98% 以上,且行情静止不动。NYSE 称,正在调查出现的技术性问题,多只股票因巨幅波动停牌。

纽约证券交易所称,此次故障的原因尚不明确。在 NYSE 报告问题后,主要交易所联合提供实时股票报价的综合报价协会(Consolidated Tape Association)报告称,早些时候发生的故障导致其切换到灾备数据中心。

当地时间 3 日上午 10:56,NYSE 恢复了部分暂停交易的股票的交易,蒙特利尔银行、巴里克黄金恢复交易,截至发稿时分别为跌 0.66% 和涨 0.32%。

这是最近一周内第二次因技术故障导致美国市场交易暂停。上周四,因技术故障,标普 500 指数数据未能显示,但个股未受影响。相关问题正在调查中。

CNNNBC NewsCNBC
Stable Diffusion 3 部分模型将于 6 月 12 日开源

2023 年 6 月 3 日,Stability AI 联合 CEO Christian Laforte 在台北国际电脑展 COMPUTEX 2024 上宣布,将于 6 月 12 日星期三在 Hugging Face 平台开源旗下 Stable Diffusion 3 的中等规模(20 亿参数)模型。

据 Stability AI 致开发者的邮件透露,SD3 Medium 模型在逼真度、字体设计、性能和微调能力等方面有显著提升:

- 逼真度:解决了手部和面部的常见瑕疵,无需复杂工作流即可生成高质量图像。
- 字体设计:在字体设计上超越了更大规模的先进模型。
- 性能:体积和效率经过优化,适用于消费级系统和企业级工作负载。
- 微调:能从小数据集中吸收细微差别,非常适合定制和创意应用。

SD3 Medium 的权重和代码仅供非商业用途。Stability AI 表示,如需讨论商业许可,可填写官网的企业版申请表单。

有消息称 Stability AI 内部仍在开发更大规模的 80 亿参数 SD3 模型,但能否面向公众开源尚不确定。Reddit 网友呼吁官方明确发布计划,称多个大模型项目都打算基于最大规模的 SD3 进行训练。

赛博禅心
英伟达 COMPUTEX 2024 主题演讲速评

NVIDIA 在此次演讲中备受关注,不仅业界对其寄予厚望,各路分析师也纷纷发表看法,希望这家 AI 芯片巨头能够推动一场真正的「新工业革命」。

在此次 COMPUTEX 2024 演讲中,NVIDIA 释放了三大重要信号:

1. 生成式 AI 将引领新工业革命。

2. NVIDIA 正在构建完整的生成式 AI 生态,强化全栈实力。


3. NVIDIA 布局机器人、自动驾驶等新兴领域,抢占未来增长点。


英伟达发布了下一代 GPU 架构 Blackwell,在各方面实现了重大突破:结合传统芯片制造工艺和架构创新,Transformer Engine 性能提升一倍,并通过 NVLink 构建 72 GPU 的超级 AI 阵列,刷新算力和能效记录。与其对比,最适合作为参照的或许是 x86 时代的 Intel。然而,作为 GPU 计算的先驱和 AI 领域的领导者,面对 AI 芯片百花齐放的新格局,NVIDIA 展现出的创新活力明显更胜一筹。

Blackwell 的发布对 AI 芯片行业的冲击,必然会引起华为、谷歌和 Amazon 等后起之秀的密切关注。然而,NVIDIA 在 CUDA 生态系统上的积累构成了难以逾越的护城河,Blackwell 的推出只会进一步巩固这一优势。此外,NVIDIA 在机器人和自动驾驶等前沿领域的频繁布局,也为未来增长提前蓄力。

黄仁勋在演讲中呼吁各行业拥抱生成式 AI 引领的新工业革命,虽然可能还为时尚早,但可以预见的是,NVIDIA 正在加速将 AI 从实验室和超算中心带入各行各业,未来十年内其在 AI 芯片领域的主导地位难以撼动。期待 Blackwell 能带来更多令人惊喜的 AI 应用场景。

——————

英伟达 COMPUTEX 2024 主题演讲要点总结

一、新时代开启:生成式AI引领的新工业革命

1. 英伟达创始人兼CEO黄仁勋认为,生成式AI将重塑计算机产业,引发一场新的工业革命,每个行业都将从中受益。

2. 生成式AI将取代通用计算成为主流,计算机将从工具变为技能生成器,进入「NIMS」(NVIDIA Inference Microservices)时代。

3. 英伟达将自己定位为「AI工厂」,输出新型商品——「tokens」(如文字、图像、视频、3D等),如同特斯拉发明了交流发电机,英伟达发明了「AI发电机」。

4. 英伟达 Earth 2 项目展示了生成式AI在气象预报等领域的应用前景。

二、英伟达生态完善:软硬件全栈加速生成式AI

1. 英伟达发布下一代 GPU 架构 Blackwell,性能大幅提升:
- Blackwell 采用全新 Transformer Engine 2.0,支持动态精度调整。
- 英伟达推出基于 Blackwell 的超级芯片 GB200 和 AI 超算 DGX,算力可达 72 GPU。
- Blackwell Ultra 将于明年面世。

2. 英伟达推出 Spectrum-X 800 超高速交换机,满足百万 GPU 级 AI 工厂需求,未来还将推出性能更高的 X800 Ultra 和 X1600。

3. NIMS 让企业部署 AI 从数日缩短到数分钟,英伟达已开放 40 多个 NIMS 微服务供免费使用。

4. 英伟达与主要 OEM 厂商合作,推动 Blackwell 平台的落地,英伟达模块化 MGX 平台支持多样化 AI 系统开发。

三、英伟达布局未来:机器人和自动驾驶成新增长点

1. 英伟达认为物理世界 AI 是未来重点,推出 Isaac 机器人平台:
- 推出面向机器人感知和操控的软件包 Perceptor 和 Manipulator。
- 机器人模拟环境 Isaac Sim 4.0 发布,加速机器人训练。
- 英伟达与各大企业合作,共同打造工业 4.0 时代的机器人。

2. 与奔驰、捷豹路虎等车企合作,加速自动驾驶落地。Drive Orin 芯片将于明年量产。

3. 英伟达还将与微软等合作,加速 PC 端的 AI 普及,目前已有数百款 AI PC 和 AI 应用。

(综合 赛博禅心 及其他媒体报道)
Kagi 于两周年之际宣布盈利并计划未来发展

近日,Kagi搜索引擎宣布已实现盈利,并概述了其未来的重大计划。自2022年6月1日推出以来,Kagi通过其独特的用户付费模式,成功吸引了大量用户,现有的付费会员人数已超过14个国家的人口总和。Kagi坚持无广告、无追踪的隐私保护政策,确保用户的数据始终掌握在用户手中。

Kagi的盈利标志着其可持续增长的成功,使公司能够进一步投资于业务,提升搜索质量和用户体验。未来三年,Kagi计划通过持续的增长,达到一百万付费用户​。

此外,Kagi宣布公司已转型为特拉华州公共利益公司(PBC),这意味着公司在追求股东价值最大化的同时,还将考虑对社会和社区的积极影响​。这一步骤进一步强化了Kagi致力于创建一个更人性化、可持续的网络的承诺。

Kagi还计划扩大其搜索索引,推出移动应用,并推出Kagi Assistant,这是一项集成了全球最佳大型语言模型(LLMs)的服务。Kagi的Orion浏览器也将继续发展,计划在2025年初退出测试版​。

src:
https://kagi.com/changelog#4166
Steam 社区网站因域名解析异常全球中断

北京时间 6 月 2 日下午 13 点 27 分,Steam 社区网站(steamcommunity.com)出现域名解析异常,导致全球用户无法访问。

WHOIS 查询显示,steamcommunity.com 目前处于 clientHold 和 clientTransferProhibited 状态,这意味着注册商暂停了解析和注册商禁止转移。

拨测结果显示,大部分地区的用户无法访问该网站,均显示查询失败(ENOTFOUND)。不过,部分地区由于 DNS 缓存,仍有可能正常访问网站。本频通过手动将 DNS 指向网站原 IP(如23.54.13.92)发现,网站服务器正常运行,且并未挂出任何声明。

据了解,该域名近期进行了两次名称服务器变更请求,并且还存在一次失败的域名转移请求,这些操作可能是导致此次解析异常的原因。注册商 Network Solutions 表示,域名转移请求因安全原因未成功,目前域名仍在原账号持有者(推测为 Valve 公司)名下,但处于暂停状态,需由账号持有者解决。

目前没有证据表明此次事件对用户数据构成安全威胁,此次中断主要是由于域名管理方面的问题。Steam 社区的用户和开发者正在关注这一事件,并等待 Valve 公司或注册商发布进一步的声明。

据 Reddit 论坛用户反馈,目前网站已恢复正常访问。

src:
https://www.reddit.com/r/Steam/comments/1d6845b/comment/l6qtmt8/
🥽 Apple Vision Pro 将在短期内在中国大陆上市

根据可靠的内部消息,中国零售店的部分员工即将前往 Apple 新加坡 进行为期 4 天 的 Vision Pro 的使用相关培训。

Vision Pro 最快可能会在未来 1 - 2 个月内在中国大陆上市。
Back to Top