起于小站,终于生活。
现实之外,一个普通人的思考。

博客地址:ygxz.in
讨论组:https://t.me/+a5Clq4jLuJc4YWQ9
GitHub Universe 2024:AI 驱动开发体验迈向新纪元

GitHub 于近日举办的 2024 年 Universe 大会上发布了一系列重磅更新,进一步强化其作为全球最大开发者社区的地位。据 GitHub 官方博客报道,自 10 年前首次举办以来,GitHub Universe 一直致力于优化开发者体验。今年的活动标志着该平台在 AI 驱动开发方面的重要里程碑。


AI 原生体验全面升级

GitHub 为其 AI 编程助手 Copilot 引入了多种新的 AI 模型,包括 Anthropic 的 Claude 3.5 Sonnet、Google 的 Gemini 1.5 Pro 以及 OpenAI 的 o1-preview 和 o1-mini。这些模型将首先在 Copilot Chat 中推出,并在未来几周内陆续上线。无论是个人开发者还是企业团队,都可以根据具体需求选择最适合的 AI 模型。

新推出的 Copilot Workspace 整合了 Copilot Code Review、Copilot Autofix 以及第三方 Copilot Extensions 功能,旨在加速代码审查和修复流程。开发者可以更快速地完善、验证和实施 Copilot 自动生成的代码建议,显著提升合并请求的准备速度。

GitHub Spark:让创意变为现实

GitHub 发布了全新产品 GitHub Spark,这是一款以自然语言驱动的工具,专注于个人和趣味性的软件开发。Spark 旨在帮助更多人实现成为开发者的梦想,用户可以通过它快速开发小型应用程序,将创意转化为现实。

提升开发效率与安全性

GitHub 还宣布了一系列更新,旨在提高软件开发的速度和安全性。这些更新包括代码补全改进、隐式代理选择以及对 C++ 和 .NET 的更好支持,以提升各类集成开发环境(IDE)中的工作效率。

在安全方面,GitHub 推出了 Copilot Autofix 功能,可以快速修复代码中的漏洞,确保从 IDE 到生产环境的代码更为安全。

企业级体验增强

为满足企业对治理和合规性的需求,GitHub 引入了新功能,为管理员提供了更多用户管理、仓库策略和安全工作流的控制权。同时,GitHub Actions 和 API 活动中新增了基于 Arm64 的运行器和性能跟踪功能,以提升计算资源和工作流效率。
一个小站的自留地
Arc 浏览器的 Windows 版本开放预约。 我自己正在慢慢把Mac平台的Arc作为主力浏览器,一段时间用下来还是比较舒服的,特别是Space的划分设计对效率确实有提高。 将来有机会的话可能会写文章介绍下。
Arc 浏览器宣布停止开发,转向全新产品

Arc 浏览器近日宣布将停止开发新功能,转而专注于一款全新浏览器产品的开发。这一决定主要源于 Arc 浏览器的复杂性导致用户上手难度过高,从而限制了其成为主流产品的可能性。

据 The Verge 报道,The Browser Company 的首席执行官 Josh Miller 表示,尽管 Arc 的用户十分喜爱其侧边栏、空间和配置文件等自定义功能,但这些功能也成为了其吸引更多用户的障碍。Miller 指出,用户更希望浏览器能够「更快、更流畅和更安全」,而不是不断添加新特性。

根据 Android Authority 的报道,The Browser Company 计划将资源投入到一个全新浏览器的开发上。这款新浏览器预计将在明年年初推出,采用水平选项卡设计,并深度集成 AI 工具,以帮助用户简化工作流程。Miller 强调,新产品将更易于普通用户接受,同时逐步揭示其高级功能。公司希望通过这种方式,缩小普通用户和高级工具之间的差距。

值得注意的是,尽管 Arc 浏览器将不再积极开发新功能,但现有用户仍可继续使用,并获得稳定性更新和错误修复。据蓝点网报道,Arc 浏览器不会被彻底抛弃,而是转向维护更新模式。
一个小站的自留地
OpenAI 近期开始提高风控等级。网页版用户有较大规模封号现象。 坊间传闻,OpenAI 在测试名为 gpt-4.5o 的模型,并贴出网络请求截图。本频无法确认该截图的真实性。 本频信源指,OpenAI 近期很可能有一次面向大规模用户的模型更新,但不确定属于 API 还是 ChatGPT 服务。也无法判断是否为下一代模型,还是现有模型的修补增强。 赛博禅心此前预告,ChatGPT 正在测试实时读取网页的新功能。 目前 OpenAI 除 o1 外的最强模型chatgpt-4o-latest,仍未进入…
OpenAI 年底将推出新模型 Orion,微软全力配合

据 The Verge 报道,OpenAI 计划于今年 12 月推出其最新的前沿模型 Orion。与近期发布的 GPT-4o 和 Q* 不同,Orion 不会通过 ChatGPT 广泛发布,而是首先向与 OpenAI 密切合作的公司提供访问权限,以便它们构建自己的产品和功能。

消息人士透露,作为 OpenAI 的主要合作伙伴,微软内部工程师正准备在 11 月于 Azure 上托管 Orion。虽然 Orion 在 OpenAI 内部被视为 GPT-4 的继任者,但尚未决定是否将其外部命名为 GPT-5。对此,OpenAI 和微软均拒绝发表评论。

一位 OpenAI 高管曾调侃 Orion 可能比 GPT-4 强大多达 100 倍。OpenAI 的目标是将大语言模型(LLMs)结合,逐步创造出更强大的模型,最终可能达到人工通用智能(AGI)。据悉,OpenAI 正在使用代号为「草莓」的 Q* 模型生成合成数据来训练 Orion。

今年 9 月,OpenAI 的研究人员曾举办庆祝活动,纪念新模型训练的完成。这一时间点也与 OpenAI 首席执行官 Sam Altman 在 X 上的一条神秘帖文相吻合,他提到「期待冬季星座很快升起」,这被解读为指向「猎户座」(Orion)。

OpenAI 最近完成了一轮 66 亿美元的融资,这促使公司转型为营利实体。此外,公司还经历了显著的员工流动,包括首席技术官 Mira Murati 和首席研究官 Bob McGrew 的离职。

熟悉微软 AI 计划的消息人士透露,公司工程师正在准备托管 OpenAI 的 Orion 模型。然而,大多数参与项目的工程师尚未被告知具体细节,以保持机密性。微软对此同样拒绝发表评论。

据了解,OpenAI 已请求访问更多托管 Nvidia H100 GPU 的微软服务器。H100 芯片在 AI 推理和训练方面表现优异,是新一代模型的理想选择。然而,两家公司之间的关系因高昂的计算能力需求而出现紧张。OpenAI 抱怨微软未能提供足够的计算能力以实现其 AGI 目标,并尝试重新谈判此前达成的独家云合作协议。尽管如此,微软仍然是 OpenAI 的主要云合作伙伴,并继续支持其产品和研究工作负载。

(The Verge 1, 2
一个小站的自留地
百度发布ERNIE 4.0 Turbo模型,文心一言用户达3亿 百度于6月28日在WAVE SUMMIT深度学习开发者大会上发布了文心大模型4.0 Turbo、飞桨框架3.0等最新技术。百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰宣布,文心一言累计用户规模已达3亿,日调用次数也达到了5亿。 据百度智能云的API文档,ERNIE-4.0-Turbo-8K支持8K tokens的上下文长度,支持自动对接百度搜索插件,保障问答信息时效性。相较于ERNIE 4.0,在性能表现上有"明显提升"。(ERNIE…
科大讯飞发布星火 4.0 Turbo 全新升级

10 月 24 日,在科大讯飞全球 1024 开发者节上,讯飞星火 4.0 Turbo 全新升级,七大能力全面超过 GPT-4 Turbo,数学能力、代码能力超过 GPT-4o,星火 4.0 Turbo 效率相对提升 50%。

在数学能力上,讯飞星火已完成超长思维链、树搜索和自我反思评价等算法验证,预计今年底可实现类 o1 的高难度数学能力显著提升。在国内外中英文 14 项主流测试集中,星火 4.0 Turbo 实现 9 项第一。
一个小站的自留地
BlackForestLabs 推出 FLUX1.1 [pro] 模型及 BFL API 据 BlackForestLabs 官方宣布,其最新一代人工智能模型 FLUX1.1 [pro] 正式发布,同时推出了 beta 版 BFL API。 FLUX1.1 [pro] 模型在性能方面有显著提升。与前代相比,其生成速度提高了 6 倍,同时在图像质量、提示遵循性和输出多样性等方面均有改进。在保持原有输出质量的基础上,新模型的生成速度提高了 2 倍。根据测试,FLUX1.1 [pro] 的运行速度是当前 FLUX1.0…
Stability AI 推出 SD3.5 模型系列

Stability AI 近日发布了全新的 SD3.5 模型系列,标志着该公司在经历一段低迷期后重返 AI 图像生成领域的竞争前沿。此次发布的 SD3.5 系列包括三个开源且可商用的模型:Large、Large Turbo 和即将于 10 月 29 日推出的 Medium。

SD3.5 系列的三个模型各具特色:

- SD 3.5 Large:拥有 80 亿参数,是该系列中最强大的基础模型,适合 1M 像素的专业应用。
- SD 3.5 Large Turbo:Large 版本的精简型,仅需 4 步即可生成高质量图像,速度更快。
- SD 3.5 Medium:采用 MMDiT-X 架构,拥有 25 亿参数,支持普通硬件,能够输出 0.25 至 2M 像素的图像。

这些模型不仅强调高适配性和硬件友好性,还支持多元化的人物形象生成和多种视觉风格。Large 版本在提示词理解力方面表现突出,更重要的是,SD3.5 支持对模型进行微调,为社区开发者提供了更大的创新空间。

在社区支持方面,ComfyUI 已经更新支持 SD3.5,用户只需更新到最新版本即可使用。此外,Liblib 也迅速上线了三个 SD3.5 的 Lora 模型供下载,分别是 Linear Red Light、Futuristic Bronze Colored 和 Chinese Line Art。
一个小站的自留地
@apples_jimmy 爆料称,Anthropic 预计将在当地时间 10 月 22 日发布新产品。 据 APPSO, 近日在 X 平台陆续有不少消息称,Anthropic 即将发布超大杯模型 Claude 3.5 Opus。
Anthropic宣布推出升级版 Claude 3.5 Sonnet 和全新的 Claude 3.5 Haiku 模型

Anthropic 宣布推出升级版 Claude 3.5 Sonnet 和全新的 Claude 3.5 Haiku 模型,同时引入了实验性的「计算机使用」功能。据 Anthropic 官方介绍,Claude 3.5 Sonnet 在多个领域均有显著提升,尤其是在代码编写方面表现突出。而 Claude 3.5 Haiku 则在多项智能基准测试中超越了此前的旗舰模型 Claude 3 Opus,但成本和速度更接近上一代 Haiku。

据 VentureBeat 报道,Anthropic 新推出的「计算机使用」功能目前处于公开测试阶段。开发者可以通过 API 指导 Claude 像人类一样操作计算机,包括查看屏幕、移动光标、点击按钮和输入文本。尽管这项功能仍在实验阶段,可能偶有错误,但开发者的反馈将有助于其快速迭代改进。

在行业基准测试中,Claude 3.5 Sonnet 表现优异。在 SWE-bench Verified 测试中,其编码能力从 33.4% 提升至 49.0%,超越了所有公开可用模型。在 TAU-bench 中,其在零售和航空领域的表现也有显著提高。据 GitLab 测试,Claude 3.5 Sonnet 在 DevSecOps 任务中提升了推理能力,且未增加延迟,使其成为多步骤软件开发过程中的理想选择。

Claude 3.5 Haiku 则以高性能和经济性见长,特别适合面向用户的产品及专业子代理任务。其低延迟和改进的指令跟随能力使其能够生成个性化体验,如购买历史和库存记录等。

升级版Claude 3.5 Sonnet现已向所有用户开放。从今天起,开发者可以在Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI上使用测试版进行构建。新的Claude 3.5 Haiku将在本月晚些时候发布。

Anthropic
一个小站的自留地
上海电信宽带大面积断网 2024 年 8 月 26 日 17:30 左右,上海电信部分宽带业务发生异常。对此,上海电信表示正在全力抢修排障,并对用户所带来的不便深表歉意。 据 IT 之家报道,当天有大量网友在社交平台反馈上海电信宽带网络出现问题。18:00 左右,不少用户反映宽带信号消失,甚至无法拨打电信 10000 号进行报修。一些网友称,他们最初怀疑是自家网络出现问题,甚至联系了维修师傅,后来才得知是全市范围内的网络故障。 相关话题登上微博热搜第二。在「中国电信上海客服」微博下,不少用户已留言反馈。…
中国移动系统故障导致用户无法登录,预计需 3-4 小时修复

据第一财经报道,2024 年 10 月 21 日下午 4 点左右,中国移动系统突发故障,导致用户无法正常登录官网和微信。中国移动 10086 客服确认系统确实出现故障,目前技术人员正在紧急抢修。

客服表示,此次故障预计需要 3 至 4 小时进行修复,可能在晚上 7 点后恢复正常。如果未能如期解决,可能会影响到次日,但公司将尽力避免此情况发生。建议用户在晚上七八点再尝试登录。
一个小站的自留地
本频从多个信源观察到,OpenAI 的风控政策正在近期进一步升级。 对于部分长期使用网关登录的账号(如部分合租面板、逆向号池),OpenAI 强制更改了密码,要求开启两步验证。 对于部分长期使用非家宽节点登录的账户,OpenAI 会在不通知用户的情况下更改模型为较低智能的 gpt-4o-mini,表现为无法调用任何工具,如使用记忆、联网、生图等。用户上传文件或图片后,OpenAI 会自动将该对话交由 gpt-4o 处理。并正常消耗配额。全程完全为黑箱操作,用户侧无提示。付费用户也可能受到影响。 对于部分有风险的…
OpenAI 近期开始提高风控等级。网页版用户有较大规模封号现象。

坊间传闻,OpenAI 在测试名为 gpt-4.5o 的模型,并贴出网络请求截图。本频无法确认该截图的真实性。

本频信源指,OpenAI 近期很可能有一次面向大规模用户的模型更新,但不确定属于 API 还是 ChatGPT 服务。也无法判断是否为下一代模型,还是现有模型的修补增强。

赛博禅心此前预告,ChatGPT 正在测试实时读取网页的新功能。

目前 OpenAI 除 o1 外的最强模型chatgpt-4o-latest,仍未进入 gpt-4o 系列模型列表作为新版本发布。
一个小站的自留地
DeepSeek-V2.5 领跑国内大模型:刷新多项国产记录 DeepSeek-AI 团队于 9 月初发布并开源了全新模型 DeepSeek-V2.5,近日在 LMSYS 组织的全球大模型竞技场(ChatBotArena)中表现出色,刷新了国产模型的多项历史纪录。 在最新公布的 ChatBotArena 排名中,DeepSeek-V2.5 位列国内大模型第一,成功超越 Yi-Large-Preview、Qwen-Plus-0828 和 GLM-4-0520 等国内最强闭源模型,并在 8 个单项能力上均领跑国内模型。这一成绩标志着…
零一万物公司正式发布新旗舰模型 Yi-Lightning

零一万物公司正式发布了其新旗舰模型 Yi-Lightning(闪电),这款模型在大模型竞技场(Chatbot Arena)上表现优异,总榜单并列第 6,数学分榜并列第 3,代码等其他分榜也名列前茅。其总成绩几乎与马斯克最新的 xAI 大模型 Grok-2-08-13 持平,超过了 GPT-4-0613 等顶级模型。此外,智谱 AI 的 GLM-4-Plus 也进入了总榜,排名第 9。

在大模型竞技场的各类分榜中,Yi-Lightning 表现突出:

- 中文能力:与 o1-mini 一同名列前位
- 数学能力:与 Gemini-1.5-Pro-002 并列第 3
- 代码能力:排名并列第 4
- Hard Prompts 和 Longer Query 分榜:均排名第 4

Yi-Lightning 采用 MoE 混合专家模型架构,优化了混合注意力机制(Hybrid Attention)和跨层注意力(Cross-Layer Attention, CLA),有效降低推理成本并提升性能。通过动态 Top-P 路由机制,Yi-Lightning 可根据任务难度选择最合适的专家网络组合,从而在不同场景中表现出色。

零一万物创始人李开复博士在发布会上表示,公司绝不放弃预训练,并通过多阶段训练方法提升模型能力。Yi-Lightning 的训练与底层架构高度适配,使得推理时更加经济实惠。Yi-Lightning 的定价为每百万词元 0.99 元人民币,与 OpenAI 的 GPT-3.5-turbo 相比价格更具竞争力。李开复博士强调,即便如此定价也不亏损。

同时,零一万物还推出了 AI2.0 数字人方案,提升了互动效果。李开复博士表示,国产大模型与硅谷最顶尖模型的差距缩短至五个月,而「模基共建」是零一万物的独特路径。

(量子位,图:Chatbot Arena)
广东省教育厅短信平台被不法分子入侵

10月12日消息,今日有多名网友在社交平台反映,自己收到了来自广东省教育厅的非法链接短信。短信内容为「【广东省教育厅】深掖必备成電影戳 .com 拒收请回复R」。

广东省教育厅对此发布声明:“近日,发现有不法分子入侵我厅短信平台,以“广东省教育厅”名义向师生和家长发送包含非法链接的短信。我厅已第一时间向公安机关报案,并配合开展调查。请广大师生和家长提高警惕,切勿点击短信中的非法链接,避免个人信息泄露或遭受财产损失。”
互联网档案馆遭受严重网络攻击和数据泄露

近日,互联网档案馆(Internet Archive)遭遇了一系列严重的网络攻击,包括分布式拒绝服务(DDoS)攻击和数据泄露事件。据《Forbes》 报道 ,一个自称亲巴勒斯坦的黑客组织 SN_BLACKMETA 宣称对此次攻击负责,导致 3100 万用户的信息被泄露。

根据《Forbes》报道,黑客通过利用 JavaScript 库漏洞攻陷了互联网档案馆的网站,并展示弹出消息警告用户数据泄露。Troy Hunt,Have I Been Pwned 的创始人,确认这些数据包括电子邮件地址、用户名以及经过 bcrypt 算法加密的密码。

据安全公司 Radware 指出,尽管 SN_BLACKMETA 自称为亲巴勒斯坦组织,但该组织的真实动机可能与全球政治不满有关,而非单纯的地缘政治因素。

据 Bleeping Computer 报道,此次数据泄露涉及互联网档案馆的认证数据库,其中包含详细用户信息。1Password 的产品副总裁 Jason Meller 表示 :「数据库被外泄表明后端基础设施可被访问,且攻击者对网站内容有一定控制。」

尽管 bcrypt 算法相对安全,但专家建议用户更改密码以防万一,尤其是在其他网站使用相同密码的用户。这一建议突显了定期更新密码和避免在多个平台使用相同密码的重要性。

互联网档案馆创始人 Brewster Kahle 在 X 平台(原 Twitter)上 表示 ,目前已暂时抵御住 DDoS 攻击,并正在清理系统和加强安全措施。然而,SN_BLACKMETA 在 X 上继续 宣称 计划发起更多攻击,理由是互联网档案馆「属于美国」,而美国政府被指责支持以色列。

这一说法被认为是误导性的,因为互联网档案馆是一个非营利组织,并提供大量关于巴勒斯坦的资源。

(综合媒体报道)
一个小站的自留地
FLUX 模型:AI 图像生成新标杆 Black Forest Labs 公司(原Stable Diffusion团队成员创立)近日发布了革命性的 FLUX 系列图像生成模型。FLUX 采用创新的混合架构,结合 Transformer 和扩散技术,拥有 120 亿参数,在图像质量、提示词响应和输出多样性方面均达到了新高度。 模型版本: - FLUX.1 [pro]:顶级商业版本,提供最高质量的图像生成能力。 - FLUX.1 [dev]:开放权重的非商业版本,适合研究和开发使用。 -…
BlackForestLabs 推出 FLUX1.1 [pro] 模型及 BFL API

据 BlackForestLabs 官方宣布,其最新一代人工智能模型 FLUX1.1 [pro] 正式发布,同时推出了 beta 版 BFL API。

FLUX1.1 [pro] 模型在性能方面有显著提升。与前代相比,其生成速度提高了 6 倍,同时在图像质量、提示遵循性和输出多样性等方面均有改进。在保持原有输出质量的基础上,新模型的生成速度提高了 2 倍。根据测试,FLUX1.1 [pro] 的运行速度是当前 FLUX1.0 [pro] 的 3 倍。这种卓越的速度和效率大大降低了延迟,实现了图像质量与推理速度的最佳平衡,有助于提高工作流程效率。

代号为「blueberry」的 FLUX1.1 [pro] 已在知名文本到图像模型评测平台 Artificial Analysis 上进行了基准测试。结果显示,该模型超越了所有其他模型,获得了排行榜最高的 Elo 分数。

BlackForestLabs 表示,FLUX1.1 [pro] 即将支持超高分辨率生成功能,允许用户创建高达 2K 分辨率的图像,且不会影响提示准确性。该功能将通过 API 提供。此外,新模型还将在 together.ai、Replicate、fal.ai 和 Freepik 等热门平台上线。

随 FLUX1.1 [pro] 一同发布的还有 beta 版 BFL API。这一 API 为开发者和企业提供了 FLUX 的高级功能,使其能够无缝集成先进的图像生成技术。BFL API 的主要优势包括:

- 高级自定义:通过灵活选项调整输出,包括模型选择、图像分辨率和内容审核。
- 可扩展性:从小型项目到企业级应用都能轻松扩展。

FLUX.1 模型定价如下:
FLUX.1 [dev]:每张图片 2.5 美分
FLUX.1 [pro]:每张图片 5 美分
FLUX1.1 [pro]:每张图片 4 美分

该模型也已在 POE 平台上线。

BlackForestLab
一个小站的自留地
据华为终端消息,9月10日14:30,华为将举行见非凡品牌盛典及鸿蒙智行新品发布会。
微信鸿蒙原生版开启内测邀请

腾讯宣布微信鸿蒙原生版正式开始邀请内测。此次内测对象为已升级至原生鸿蒙操作系统HarmonyOS NEXT的用户,用户在收到邀请后可抢先体验新版本。

据了解,腾讯这款「尝鲜版」的微信,已包含基础社交通讯,音视频通话、朋友圈、微信支付的二维码收/付款等功能。

(鹅厂黑板报)
#Update #ChatGPT

OpenAI 刚刚发布了 ChatGPT Canvas 功能:

- 专为代码和写作场景设计
- Canvas 在独立窗口打开
- 为写作场景提供的快捷方式:建议、修改长度、修改写作水平等
- 为代码场景提供的快捷方式:代码审查、添加日志、修复 bug、代码语言转换等

从今天开始,向 Plus 和 Team 用户灰度推出,选择 GPT-4o with canvas 模型即可体验。
一个小站的自留地
据@数字生命卡兹克,Runway Gen-3 Alpha近日面向部分超级合作者开放。 @数字生命卡兹克 认为,Gen-3 Alpha在模型质量上确实超越了Luma和可灵等竞品,特别是在审美方面。虽然与真实世界相比仍有差距,但已经是当前AI视频生成领域的佼佼者。 在写实风格测试中,人物特写和风景表现最为稳定,但涉及人物与物体交互时仍存在一些问题。动画风格整体表现较弱,显示出数据集的不足。科幻风格则是Gen-3 Alpha的强项,表现出色。玄幻风格虽不及科幻,但在西方题材上仍有不错发挥。抽象风格的表现令人…
Pika 1.5 发布,AI 视频生成特效突破物理法则

Pika Labs(也称为 Pika)近日宣布推出其最新的 AI 视频生成模型 Pika 1.5。据 VentureBeat 报道,这一版本以突破物理法则的 AI 特效而闻名。新版本的 Pikaffects 可以将图像和预录视频中的对象转变为极其可塑的版本。

Pika 最初于 2023 年 11 月通过 1.0 版本的文本生成视频 AI 平台进入市场,并在短时间内筹集了 3500 万美元的 A 轮融资。尽管在过去的一年里,许多竞争对手发布了更新的模型,如 Runway 的 Gen-3 Alpha Turbo 和 Luma AI 的 Dream Machine 1.5,但 Pika 一直保持沉默,直到最近推出了全新的 Pika 1.5。

新版本的 Pika 1.5 引入了令人惊叹的特效「Pikaffects」,包括爆炸、融化、压碎、膨胀等效果。这些特效可以通过一个新按钮实现,甚至可以将静态图像中的对象变成栩栩如生的动态视频。

据 VentureBeat 报道,Pika 1.5 还改进了图像生成视频(i2v)和文本生成视频(t2v)的工作流程,使用户能够创建高质量的五秒视频片段,并包含跑步、滑板甚至飞行等逼真的动作。平台还增加了新的运动控制功能,使用户能够轻松捕捉专业级别的动态镜头,如「子弹时间」、眩晕效果等。

除了新特效,付费用户仍然可以选择使用旧版本 Pika 1.0 及其提供的 Lip Sync 和 AI 音效功能。值得注意的是,尽管订阅价格保持不变,但每生成一个五秒的视频片段将需要 15 个积分。

(综合媒体报道)
OpenAI DevDay 2024 发布多项功能更新

OpenAI 于 2024 年 10 月 1 日在旧金山举行了第二届 DevDay 开发者大会。与去年相比,今年的大会规模虽然相对低调,但仍推出了多项重要创新,包括实时 API、视觉微调、模型蒸馏和提示缓存

实时 API:实现语音到语音体验

据 Simon Willison 的现场报道,OpenAI 发布了实时 API 的公测版,允许付费开发者在应用中构建低延迟的多模态体验。该 API 支持自然的语音到语音对话,类似于 ChatGPT 的高级语音模式,并提供六种预设语音。

实时 API 简化了创建语音助手和其他会话 AI 工具的过程,消除了将多个模型组合用于转录、推理和文本到语音转换的需要。例如,语言学习应用 Speak 已经使用实时 API 来驱动其角色扮演功能,鼓励用户练习用新语言进行对话。

实时 API 的定价为每百万输入 tokens 5 美元和每百万输出 tokens 20 美元,音频输入为每百万 tokens 100 美元,音频输出为每百万 tokens 200 美元。

视觉微调:定制 GPT-4o 的图像理解能力

OpenAI 现在允许开发者通过图像和文本微调 GPT-4o,提升其视觉理解能力。这一功能为改进视觉搜索、自动驾驶汽车中的物体检测以及医学图像分析等应用提供了新的可能性。

据 Maginative 报道,东南亚的一家食品配送和共享出行公司 Grab 利用这一技术,将车道计数的准确性提高了 20%,限速标志的定位准确性提升了 13%。

提示缓存:降低成本和延迟

OpenAI 引入了提示缓存功能,旨在降低开发者成本和延迟。根据 VentureBeat 的报道,该功能会自动对模型最近处理过的输入 tokens 应用 50% 的折扣,对于频繁重复使用上下文的应用来说,这可能会带来成本的大幅降低。

提示缓存将自动应用于最新版本的 GPT-4o、GPT-4o mini、o1-preview 和 o1-mini,以及这些模型的微调版本。

模型蒸馏:简化 AI 模型开发

OpenAI 推出了新的模型蒸馏工具,使得开发者可以利用大型模型(如 GPT-4o 和 o1-preview)的输出来提升小型模型(如 GPT-4o mini)的性能。据 TechCrunch 报道,这一集成工作流程包括存储完成和评估功能,允许开发者在 OpenAI 平台内捕获输入输出对、微调模型并评估性能。

这种方法使得小型公司能够利用与高级模型相似的能力,而无需承担相同的计算成本。模型蒸馏将有助于缩小 AI 行业中尖端、资源密集型系统与更易访问但能力较弱的系统之间的差距。

(综合媒体报道,图:maginative
美团平台疑似发生用户信用卡信息泄露事件

据多个来源的讨论,美团平台疑似发生用户信用卡信息泄露事件,涉及非银联卡组织的信用卡用户。此次事件中,受影响的用户为在美团绑定 VISA、Mastercard、AMEX 以及银联国际等国际卡的用户,泄露信息包括卡号、有效期及 CVV 等敏感信息。

多位美团用户反馈其绑定的外卡(包括银联国际)出现被盗刷现象。据用户报告,包括汇丰银行(HSBC)香港 Mastercard 在内的多张信用卡被盗刷,盗刷金额从小额认证到数千港币不等。值得注意的是,这些被盗刷的信用卡均只在美团和其他少数几个平台进行过绑定,因此疑似与此次美团数据泄露事件有直接关联。

目前已知的认证网关包括 STEIN INC(Weston, US)、Airtech Inc、GenZ Inc 等。已绑定这些外卡的用户遭遇了不同程度的盗刷。

根据多方反馈,目前国内使用快捷支付的用户暂未发现被盗刷的情况。使用手机支付、银行快速绑卡或银联通道(包括境外银联)的用户暂时不受此次事件影响。

截至发稿,美团方面没有发表任何声明;本频暂时无法对此消息进行独立验证。

——————

疑似美团内部人士透露,「(美团)不以任何方式记录和存储用户外卡CVV等敏感信息,不具备网络传言所称泄露用户CVV等敏感信息的条件」。
上交所股票竞价交易出现异常,指数更新缓慢

据反馈,9 月 27 日上午十点左右,上交所交易系统开始出现宕机,疑似交易过多,指数更新缓慢。

中午 11 时,上交所发布公告称,今日开盘后本所股票竞价交易出现成交确认缓慢的异常。

公告发出约 15 分钟后,上交所交易陆续恢复正常。

市场人士分析指出,这可能是订单拥挤引发 “塞单”,在历史上,其它交易所也发生类似的交易异常。具体表现是订单回报出现延迟,交易者长时间不清楚已报委托的状态。交易者不断撤单并重新申报,导致券商到交易所的流量迅速激增并积压。

南方+
Back to Top