零一万物公司正式发布了其新旗舰模型 Yi-Lightning(闪电),这款模型在大模型竞技场(Chatbot Arena)上表现优异,总榜单并列第 6,数学分榜并列第 3,代码等其他分榜也名列前茅。其总成绩几乎与马斯克最新的 xAI 大模型 Grok-2-08-13 持平,超过了 GPT-4-0613 等顶级模型。此外,智谱 AI 的 GLM-4-Plus 也进入了总榜,排名第 9。
在大模型竞技场的各类分榜中,Yi-Lightning 表现突出:
- 中文能力:与 o1-mini 一同名列前位
- 数学能力:与 Gemini-1.5-Pro-002 并列第 3
- 代码能力:排名并列第 4
- Hard Prompts 和 Longer Query 分榜:均排名第 4
Yi-Lightning 采用 MoE 混合专家模型架构,优化了混合注意力机制(Hybrid Attention)和跨层注意力(Cross-Layer Attention, CLA),有效降低推理成本并提升性能。通过动态 Top-P 路由机制,Yi-Lightning 可根据任务难度选择最合适的专家网络组合,从而在不同场景中表现出色。
零一万物创始人李开复博士在发布会上表示,公司绝不放弃预训练,并通过多阶段训练方法提升模型能力。Yi-Lightning 的训练与底层架构高度适配,使得推理时更加经济实惠。Yi-Lightning 的定价为每百万词元 0.99 元人民币,与 OpenAI 的 GPT-3.5-turbo 相比价格更具竞争力。李开复博士强调,即便如此定价也不亏损。
同时,零一万物还推出了 AI2.0 数字人方案,提升了互动效果。李开复博士表示,国产大模型与硅谷最顶尖模型的差距缩短至五个月,而「模基共建」是零一万物的独特路径。
(量子位,图:Chatbot Arena)
广东省教育厅短信平台被不法分子入侵
10月12日消息,今日有多名网友在社交平台反映,自己收到了来自广东省教育厅的非法链接短信。短信内容为「【广东省教育厅】深掖必备成電影戳 .com 拒收请回复R」。
广东省教育厅对此发布声明:“近日,发现有不法分子入侵我厅短信平台,以“广东省教育厅”名义向师生和家长发送包含非法链接的短信。我厅已第一时间向公安机关报案,并配合开展调查。请广大师生和家长提高警惕,切勿点击短信中的非法链接,避免个人信息泄露或遭受财产损失。”
10月12日消息,今日有多名网友在社交平台反映,自己收到了来自广东省教育厅的非法链接短信。短信内容为「【广东省教育厅】深掖必备成電影戳 .com 拒收请回复R」。
广东省教育厅对此发布声明:“近日,发现有不法分子入侵我厅短信平台,以“广东省教育厅”名义向师生和家长发送包含非法链接的短信。我厅已第一时间向公安机关报案,并配合开展调查。请广大师生和家长提高警惕,切勿点击短信中的非法链接,避免个人信息泄露或遭受财产损失。”
近日,互联网档案馆(Internet Archive)遭遇了一系列严重的网络攻击,包括分布式拒绝服务(DDoS)攻击和数据泄露事件。据《Forbes》 报道 ,一个自称亲巴勒斯坦的黑客组织 SN_BLACKMETA 宣称对此次攻击负责,导致 3100 万用户的信息被泄露。
根据《Forbes》报道,黑客通过利用 JavaScript 库漏洞攻陷了互联网档案馆的网站,并展示弹出消息警告用户数据泄露。Troy Hunt,Have I Been Pwned 的创始人,确认这些数据包括电子邮件地址、用户名以及经过 bcrypt 算法加密的密码。
据安全公司 Radware 指出,尽管 SN_BLACKMETA 自称为亲巴勒斯坦组织,但该组织的真实动机可能与全球政治不满有关,而非单纯的地缘政治因素。
据 Bleeping Computer 报道,此次数据泄露涉及互联网档案馆的认证数据库,其中包含详细用户信息。1Password 的产品副总裁 Jason Meller 表示 :「数据库被外泄表明后端基础设施可被访问,且攻击者对网站内容有一定控制。」
尽管 bcrypt 算法相对安全,但专家建议用户更改密码以防万一,尤其是在其他网站使用相同密码的用户。这一建议突显了定期更新密码和避免在多个平台使用相同密码的重要性。
互联网档案馆创始人 Brewster Kahle 在 X 平台(原 Twitter)上 表示 ,目前已暂时抵御住 DDoS 攻击,并正在清理系统和加强安全措施。然而,SN_BLACKMETA 在 X 上继续 宣称 计划发起更多攻击,理由是互联网档案馆「属于美国」,而美国政府被指责支持以色列。
这一说法被认为是误导性的,因为互联网档案馆是一个非营利组织,并提供大量关于巴勒斯坦的资源。
(综合媒体报道)
据 BlackForestLabs 官方宣布,其最新一代人工智能模型 FLUX1.1 [pro] 正式发布,同时推出了 beta 版 BFL API。
FLUX1.1 [pro] 模型在性能方面有显著提升。与前代相比,其生成速度提高了 6 倍,同时在图像质量、提示遵循性和输出多样性等方面均有改进。在保持原有输出质量的基础上,新模型的生成速度提高了 2 倍。根据测试,FLUX1.1 [pro] 的运行速度是当前 FLUX1.0 [pro] 的 3 倍。这种卓越的速度和效率大大降低了延迟,实现了图像质量与推理速度的最佳平衡,有助于提高工作流程效率。
代号为「blueberry」的 FLUX1.1 [pro] 已在知名文本到图像模型评测平台 Artificial Analysis 上进行了基准测试。结果显示,该模型超越了所有其他模型,获得了排行榜最高的 Elo 分数。
BlackForestLabs 表示,FLUX1.1 [pro] 即将支持超高分辨率生成功能,允许用户创建高达 2K 分辨率的图像,且不会影响提示准确性。该功能将通过 API 提供。此外,新模型还将在 together.ai、Replicate、fal.ai 和 Freepik 等热门平台上线。
随 FLUX1.1 [pro] 一同发布的还有 beta 版 BFL API。这一 API 为开发者和企业提供了 FLUX 的高级功能,使其能够无缝集成先进的图像生成技术。BFL API 的主要优势包括:
- 高级自定义:通过灵活选项调整输出,包括模型选择、图像分辨率和内容审核。
- 可扩展性:从小型项目到企业级应用都能轻松扩展。
FLUX.1 模型定价如下:
FLUX.1 [dev]:每张图片 2.5 美分
FLUX.1 [pro]:每张图片 5 美分
FLUX1.1 [pro]:每张图片 4 美分
该模型也已在 POE 平台上线。
(BlackForestLab)
腾讯宣布微信鸿蒙原生版正式开始邀请内测。此次内测对象为已升级至原生鸿蒙操作系统HarmonyOS NEXT的用户,用户在收到邀请后可抢先体验新版本。
据了解,腾讯这款「尝鲜版」的微信,已包含基础社交通讯,音视频通话、朋友圈、微信支付的二维码收/付款等功能。
(鹅厂黑板报)
据华尔街见闻从供应链独家获悉,iPhone SE 4将搭载苹果自研5G Modem。
另据10月4日公开消息,苹果公司预计将于2025年春季推出第四代iPhone SE,这款机型将首次采用OLED屏幕,售价可能为459美元-499美元,约合人民币3221元-3502 元。
(华尔街见闻)
Pika Labs(也称为 Pika)近日宣布推出其最新的 AI 视频生成模型 Pika 1.5。据 VentureBeat 报道,这一版本以突破物理法则的 AI 特效而闻名。新版本的 Pikaffects 可以将图像和预录视频中的对象转变为极其可塑的版本。
Pika 最初于 2023 年 11 月通过 1.0 版本的文本生成视频 AI 平台进入市场,并在短时间内筹集了 3500 万美元的 A 轮融资。尽管在过去的一年里,许多竞争对手发布了更新的模型,如 Runway 的 Gen-3 Alpha Turbo 和 Luma AI 的 Dream Machine 1.5,但 Pika 一直保持沉默,直到最近推出了全新的 Pika 1.5。
新版本的 Pika 1.5 引入了令人惊叹的特效「Pikaffects」,包括爆炸、融化、压碎、膨胀等效果。这些特效可以通过一个新按钮实现,甚至可以将静态图像中的对象变成栩栩如生的动态视频。
据 VentureBeat 报道,Pika 1.5 还改进了图像生成视频(i2v)和文本生成视频(t2v)的工作流程,使用户能够创建高质量的五秒视频片段,并包含跑步、滑板甚至飞行等逼真的动作。平台还增加了新的运动控制功能,使用户能够轻松捕捉专业级别的动态镜头,如「子弹时间」、眩晕效果等。
除了新特效,付费用户仍然可以选择使用旧版本 Pika 1.0 及其提供的 Lip Sync 和 AI 音效功能。值得注意的是,尽管订阅价格保持不变,但每生成一个五秒的视频片段将需要 15 个积分。
(综合媒体报道)
OpenAI 于 2024 年 10 月 1 日在旧金山举行了第二届 DevDay 开发者大会。与去年相比,今年的大会规模虽然相对低调,但仍推出了多项重要创新,包括实时 API、视觉微调、模型蒸馏和提示缓存。
实时 API:实现语音到语音体验
据 Simon Willison 的现场报道,OpenAI 发布了实时 API 的公测版,允许付费开发者在应用中构建低延迟的多模态体验。该 API 支持自然的语音到语音对话,类似于 ChatGPT 的高级语音模式,并提供六种预设语音。
实时 API 简化了创建语音助手和其他会话 AI 工具的过程,消除了将多个模型组合用于转录、推理和文本到语音转换的需要。例如,语言学习应用 Speak 已经使用实时 API 来驱动其角色扮演功能,鼓励用户练习用新语言进行对话。
实时 API 的定价为每百万输入 tokens 5 美元和每百万输出 tokens 20 美元,音频输入为每百万 tokens 100 美元,音频输出为每百万 tokens 200 美元。
视觉微调:定制 GPT-4o 的图像理解能力
OpenAI 现在允许开发者通过图像和文本微调 GPT-4o,提升其视觉理解能力。这一功能为改进视觉搜索、自动驾驶汽车中的物体检测以及医学图像分析等应用提供了新的可能性。
据 Maginative 报道,东南亚的一家食品配送和共享出行公司 Grab 利用这一技术,将车道计数的准确性提高了 20%,限速标志的定位准确性提升了 13%。
提示缓存:降低成本和延迟
OpenAI 引入了提示缓存功能,旨在降低开发者成本和延迟。根据 VentureBeat 的报道,该功能会自动对模型最近处理过的输入 tokens 应用 50% 的折扣,对于频繁重复使用上下文的应用来说,这可能会带来成本的大幅降低。
提示缓存将自动应用于最新版本的 GPT-4o、GPT-4o mini、o1-preview 和 o1-mini,以及这些模型的微调版本。
模型蒸馏:简化 AI 模型开发
OpenAI 推出了新的模型蒸馏工具,使得开发者可以利用大型模型(如 GPT-4o 和 o1-preview)的输出来提升小型模型(如 GPT-4o mini)的性能。据 TechCrunch 报道,这一集成工作流程包括存储完成和评估功能,允许开发者在 OpenAI 平台内捕获输入输出对、微调模型并评估性能。
这种方法使得小型公司能够利用与高级模型相似的能力,而无需承担相同的计算成本。模型蒸馏将有助于缩小 AI 行业中尖端、资源密集型系统与更易访问但能力较弱的系统之间的差距。
(综合媒体报道,图:maginative)
美团平台疑似发生用户信用卡信息泄露事件
据多个来源的讨论,美团平台疑似发生用户信用卡信息泄露事件,涉及非银联卡组织的信用卡用户。此次事件中,受影响的用户为在美团绑定 VISA、Mastercard、AMEX 以及银联国际等国际卡的用户,泄露信息包括卡号、有效期及 CVV 等敏感信息。
多位美团用户反馈其绑定的外卡(包括银联国际)出现被盗刷现象。据用户报告,包括汇丰银行(HSBC)香港 Mastercard 在内的多张信用卡被盗刷,盗刷金额从小额认证到数千港币不等。值得注意的是,这些被盗刷的信用卡均只在美团和其他少数几个平台进行过绑定,因此疑似与此次美团数据泄露事件有直接关联。
目前已知的认证网关包括 STEIN INC(Weston, US)、Airtech Inc、GenZ Inc 等。已绑定这些外卡的用户遭遇了不同程度的盗刷。
根据多方反馈,目前国内使用快捷支付的用户暂未发现被盗刷的情况。使用手机支付、银行快速绑卡或银联通道(包括境外银联)的用户暂时不受此次事件影响。
截至发稿,美团方面没有发表任何声明;本频暂时无法对此消息进行独立验证。
——————
疑似美团内部人士透露,「(美团)不以任何方式记录和存储用户外卡CVV等敏感信息,不具备网络传言所称泄露用户CVV等敏感信息的条件」。
据多个来源的讨论,美团平台疑似发生用户信用卡信息泄露事件,涉及非银联卡组织的信用卡用户。此次事件中,受影响的用户为在美团绑定 VISA、Mastercard、AMEX 以及银联国际等国际卡的用户,泄露信息包括卡号、有效期及 CVV 等敏感信息。
多位美团用户反馈其绑定的外卡(包括银联国际)出现被盗刷现象。据用户报告,包括汇丰银行(HSBC)香港 Mastercard 在内的多张信用卡被盗刷,盗刷金额从小额认证到数千港币不等。值得注意的是,这些被盗刷的信用卡均只在美团和其他少数几个平台进行过绑定,因此疑似与此次美团数据泄露事件有直接关联。
目前已知的认证网关包括 STEIN INC(Weston, US)、Airtech Inc、GenZ Inc 等。已绑定这些外卡的用户遭遇了不同程度的盗刷。
根据多方反馈,目前国内使用快捷支付的用户暂未发现被盗刷的情况。使用手机支付、银行快速绑卡或银联通道(包括境外银联)的用户暂时不受此次事件影响。
截至发稿,美团方面没有发表任何声明;本频暂时无法对此消息进行独立验证。
——————
疑似美团内部人士透露,「(美团)不以任何方式记录和存储用户外卡CVV等敏感信息,不具备网络传言所称泄露用户CVV等敏感信息的条件」。
据反馈,9 月 27 日上午十点左右,上交所交易系统开始出现宕机,疑似交易过多,指数更新缓慢。
中午 11 时,上交所发布公告称,今日开盘后本所股票竞价交易出现成交确认缓慢的异常。
公告发出约 15 分钟后,上交所交易陆续恢复正常。
市场人士分析指出,这可能是订单拥挤引发 “塞单”,在历史上,其它交易所也发生类似的交易异常。具体表现是订单回报出现延迟,交易者长时间不清楚已报委托的状态。交易者不断撤单并重新申报,导致券商到交易所的流量迅速激增并积压。
(南方+)
对于部分长期使用网关登录的账号(如部分合租面板、逆向号池),OpenAI 强制更改了密码,要求开启两步验证。
对于部分长期使用非家宽节点登录的账户,OpenAI 会在不通知用户的情况下更改模型为较低智能的 gpt-4o-mini,表现为无法调用任何工具,如使用记忆、联网、生图等。用户上传文件或图片后,OpenAI 会自动将该对话交由 gpt-4o 处理。并正常消耗配额。全程完全为黑箱操作,用户侧无提示。付费用户也可能受到影响。
对于部分有风险的 IP,OpenAI 禁用了免登录使用 ChatGPT 对话。
北京时间2024 年 9 月 26 日凌晨,Meta 发布 Llama 3.2。
本次发布,包含 4 种尺寸的模型,包括 1B、3B、11B 和 90B,以及一些硬件:一款新的雷朋 AI 眼镜 和 Meta Quest 3S:
1B/3B:旨在提供边缘算力,也就是可以在如移动设备上运行,目前已支持Arm、高通(Qualcomm)和联发科(MediaTek)
11B/90B:具备多模态能力,并可直接替代 Llama 3.1 8B 和 70B。
Llama Stack: 开发套件,帮助快速构建、部署 AI 应用。雷朋眼镜:支持车位助记、实时翻译、多模态问答等功能。
Meta Quest 3S:最新的 VR 玩具,299.99 美金
(赛博禅心)
2024 年 9 月 25 日,谷歌发布了两款升级后的生产就绪版本的 Gemini 1.5 模型:Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002。这些新模型在原有 Gemini 1.5 模型基础上进行了显著改进,并将 API 价格下调了 50%。
新款 Gemini 1.5 Pro-002 和 Flash-002 模型在多个方面表现出色:
- MMLU-Pro 基准测试提高 7%
- 数学能力大幅提升,MATH 和 HiddenMath 测试成绩提高 20%
- 视觉和代码任务性能提升 2-7%
谷歌宣布输入词元 (Token) 价格降低 64%;输出词元价格降低 52%。在128K词元以内的任务中,增量缓存词元价格降低64%,自2024年10月1日起生效。
此外,谷歌还提高了速率限制。付费级别中,1.5 Flash 达到2000 RPM,1.5 Pro 达到1000 RPM。
据 OpenAI 官方宣布,ChatGPT 应用的「高级语音模式」(Advanced Voice Mode, AVM)正在逐步向更多付费用户开放。
OpenAI 表示,AVM 将在一周内逐步向所有 Plus 和 Team 用户推送。同时,还增加了以下功能:
- 「自定义指令」功能
- 记忆功能
- 五种新语音
- 改进的口音支持
- 支持超过 50 种语言
同时,自 AVM 的有限 alpha 测试发布以来,OpenAI 进行了多项改进:
- 对口音的理解能力更强
- 对话更加顺畅和迅速
- 扩展了部分定制功能到 AVM
ChatGPT 现在共有九种语音供用户选择:Arbor、Maple、Sol、Spruce、Vale、Breeze、Juniper、Cove 和 Ember。
「自定义指令」功能允许用户个性化 ChatGPT 的响应方式;「记忆功能」则使 ChatGPT 能够记住之前的对话以供后续参考。
2024 年 9 月 24 日,字节跳动在火山引擎的「AI 创新巡展」活动上正式发布了两款 AI 视频生成大模型——豆包视频生成-PixelDance 和豆包视频生成-Seaweed。
豆包视频生成大模型的最大亮点在于其对复杂指令的精准理解以及自然连贯的多主体互动能力。与传统的视频生成模型相比,这两款模型能够在不同镜头下保持人物样貌、服装细节以及头饰的一致性,接近实拍效果。尤其是在多主体、多动作交互场景中,表现尤为出色。
PixelDance 擅长复杂动作与高动态场景
•复杂动作与高动态表现:能够呈现丰富的人物动作、面部表情以及相机视角控制,适合视觉冲击力强烈的场景,如动画制作、影视特效和创意广告等。
•潜在扩散架构:采用潜在扩散架构进行训练,结合图像指令(针对视频片段的首尾帧)和文本指令,使其能够更好地理解和学习视频中的动态信息。
Seaweed 注重细腻细节与逼真度
•逼真度与细腻细节:在生成具备丰富细节层次的视频方面表现出色,特别适合需要高质量视觉呈现的场景。
•多种风格与分辨率支持:支持横屏、竖屏及多分辨率输出,并根据用户输入的高清图像进行适配和保真,默认输出为 720p 分辨率、24fps,可延长至 20-30 秒。
本频信源提供的渠道售价显示,今年度最受欢迎的颜色是 Pro 系列的白色钛金属,其余所有配色目前渠道价均无明显差异。
Pro 系列当前现货溢价 600元左右,标准版则溢价 400 元左右。
电商渠道方面,京东大部分地区已经可以实现当日达,拼多多则为 Pro 系列提供了 400 元的补贴,标准版补贴价格达到 600-1000 元不等。但发货日期显示为未来两周。
港行方面,目前香港本地回收价差异较大,高配溢价最多,Pro 系列白色反而溢价较少。本频信源在20 日同天报告了两个截然不同的回收行情,对于各个低配版,香港当地回收价跌破原价近 600 元,而最抢手的 iPhone 16 Pro Max 沙漠钛配色,当地回收价最高溢价近 2000 元。
——————
据《深网》,在内地手机二级市场,目前iPhone 16和iPhone 16 Plus很少有用户询价。iPhone 16 Pro,比较抢手的型号例如钛金属原色512GB版本,钛金属白256GB、512GB、1TB版本、钛金属黑色1TB可能会有用户愿意溢价购买。目前仅iPhone16 Pro Max有800至1200元的溢价。
与去年相比,今年苹果对iPhone16系列实施严格的控货控价措施。
为避免出现iPhone15和iPhone15 Plus破发(跌破官网价)情况出现,苹果今年对新款首销实施分货制,天音控股等苹果国内核心代理商对渠道控货,窜货会被罚款。
TestingCatalog 报道,根据最近的代码泄露,ChatGPT 的高级语音模式将在 9 月 24 日面向更广泛的用户推出,并且可能是直接正式发布。
适用于 macOS 的 ChatGPT 应用程序也有了一些新的变化,语音模式 UI 中,代表 ChatGPT 语音模式的黑色图标已经被替换为随语音播放而动的天空动画。
目前,ChatGPT 高级语音模式仅向一小部份 ChatGPT Plus 用户开放。
(爱范儿)
2024 年 9 月 19 日,阿里巴巴通义实验室正式发布了全新的 Qwen2.5 大模型系列,标志着全球开源大模型领域的又一次重大突破。据量子位报道,Qwen2.5 凭借其强大的性能和创新特性,在多个任务上超越了 Meta 的 Llama3-405B,成为目前开源大模型中的佼佼者。
本次发布的基础模型包括:
• Qwen2.5:0.5B、1.5B、3B、7B、14B、32B 和 72B
• Qwen2.5-Coder:1.5B、7B 和 32B(即将推出)
• Qwen2.5-Math:1.5B、7B 和 72B
Qwen2.5 系列不仅在参数灵活性上有所突破,还在多个任务上展现出卓越表现。据量子位报道,Qwen2.5-32B 的性能已经超过了上一代的 Qwen2-72B,而 Qwen2.5-14B 则胜过了 Qwen2-57B-A14B。
此外,本次发布的多个模型支持最大 128K 的上下文长度,这使得它们在长文本生成和结构化数据处理(如表格理解与生成 JSON 输出)等任务中具备显著优势。
DeepSeek-AI 团队于 9 月初发布并开源了全新模型 DeepSeek-V2.5,近日在 LMSYS 组织的全球大模型竞技场(ChatBotArena)中表现出色,刷新了国产模型的多项历史纪录。
在最新公布的 ChatBotArena 排名中,DeepSeek-V2.5 位列国内大模型第一,成功超越 Yi-Large-Preview、Qwen-Plus-0828 和 GLM-4-0520 等国内最强闭源模型,并在 8 个单项能力上均领跑国内模型。这一成绩标志着 DeepSeek-V2.5 成为目前国内开源模型中的佼佼者。
在 ChatBotArena 的分项排名中,DeepSeek-V2.5 在多个维度上取得了国产模型历史最佳成绩:
- 难问题(Hard Prompt):世界第二(国内历史最佳)
- 代码(Code):世界第二(国内历史最佳)
- 数学(Math):世界第三(国内历史最佳)
(DeepSeek)