起于小站,终于生活。
现实之外,一个普通人的思考。

博客地址:ygxz.in
讨论组:https://t.me/ygxz_group
一个小站的自留地
阿里正式开源1100亿参数Qwen1.5-110B模型 Qwen1.5-110B模型是截止目前为止国内开源模型中参数规模最大的模型。Qwen1.5-110B模型与其它Qwen1.5系列模型架构一致。采用了分组查询注意力机制,因此推理效率很高。该模型最高支持32K上下文,并且支持多语言。 根据官方公布的评测结果,Qwen1.5-110B模型的评测结果略超过Llama-3-70B和Mixtral-8×22B,是除了Llama3-70B-Instruct模型外最强的开源模型。 国内此前开源领域最大的参数模…
5 月9日,阿里云召开峰会,正式发布通义千问2.5,模型性能全面赶超GPT-4-Turbo,成为“地表最强”中文大模型。同时,通义千问1100亿参数开源模型在多个基准测评收获最佳成绩,超越Meta的Llama-3-70B,成为开源领域最强大模型。

(券商中国)

另据 SuperCLUE 的测评结果,通义千问2.5取得总分74.93分,与GPT-4 Turbo仍有一定差距,相差5.21分。其他如编码和数学能力也有差距,但值得一提的是数学能力位居国内大模型第一。
一个小站的自留地
OpenAI 近期动作频频,新搜索产品最快于 5 月 9 日推出,GPT-5 可能于 6 月推出 OpenAI 近期对其官网进行了更新,同时也有网友发现,OpenAI 的域名出现了五十余个新的子域名,其中最受关注的是 search.chatgpt.com 。 据报道, OpenAI 一直在开发一款网络搜索产品,这将加剧与Google的竞争。该搜索服务将部分由 Bing 提供支持。 据外电援引消息人士Jimmy Apples透露, OpenAI 可能很快就会推出一款新的搜索引擎,并表示该公司计划在本月举办一场活动,暂定于…
首先,搜索还是 Bing 提供的,但也能感觉到确实比以前快了。

对于他不知道的信息,比如苹果发布会,真的有去联网。

不过,对于非常实时的信息,依然不能很好处理,如比特币价格。

在联网后,多语言上处理上依然有问题,比如在 YC News 中,并没有按中文来回复。

同时的,考虑到还在灰度。等全量上线后,可能会不同。


(赛博禅心)
OpenAI 近期动作频频,新搜索产品最快于 5 月 9 日推出,GPT-5 可能于 6 月推出

OpenAI 近期对其官网进行了更新,同时也有网友发现,OpenAI 的域名出现了五十余个新的子域名,其中最受关注的是 search.chatgpt.com

据报道, OpenAI 一直在开发一款网络搜索产品,这将加剧与Google的竞争。该搜索服务将部分由 Bing 提供支持。

据外电援引消息人士Jimmy Apples透露, OpenAI 可能很快就会推出一款新的搜索引擎,并表示该公司计划在本月举办一场活动,暂定于 2024 年 5 月 9 日上午 10 点 。知情人士还透露,OpenAI 从 1 月初开始就在招聘活动团队,负责组织内部活动。

另据本频信源,OpenAI 与微软近期确实可能有一次大规模面向公众的产品发布,而且大概率与现有 ChatGPT 产品无关。这很有可能是上文媒体提到的搜索产品。

——————
可信度:B


src:https://www.cnbeta.com.tw/articles/tech/1429477.htm#google_vignette
疑似是 OpenAI 新模型的未知模型出现在大模型竞技场 LMSYS 上

一个名为 gpt2-chatbot 的大模型于不久前出现在大模型竞技场 LMSYS 上,尽管基准测试分数不被公开,但根据网友的实测,其性能超过目前市面上的所有大语言模型。

通过提示词引导和基于 token 分词器的研究发现, gpt2-chatbot 非常有可能来自 OpenAI,且应该是 GPT-4 的一个改进版本。其在逻辑能力、代码能力和数学能力上具有当今其他任何大模型无法比拟的能力。

似乎很有可能,这个神秘模型实际上是GPT-4.5,作为另一个"渐进式"模型更新的实例发布,而GPT-5则是一个可能性较小的选择。

输出的整体质量——特别是其格式、结构和整体理解能力——绝对是一流的。

多位在LLM提示和聊天机器人方面经验丰富的人士(在公开和私下场合)都注意到输出质量出乎意料地好,我完全同意这一点。对我来说,感觉就像是从GPT-3.5到GPT-4的飞跃,但这次是以GPT-4作为起点。

该模型的结构化回复似乎受到了修改后的CoT(思维链)等技术的强烈影响。

目前没有充分的理由相信这个神秘模型使用了某种全新的架构。


网友同样给出了另外一种可能,即 gpt2-chatbot 有可能是 LMSYS 将多个大模型以类似 MoE 的方式整合的结果,但从各种迹象来看,该假设的可能性较小。

此前,OpenAI 为大量用户推送了 ChatGPT 的记忆功能。而由于 GPT-5 的红蓝测试才开始不久,市场普遍预计 OpenAI 在 6 月前都不能拿出足以夺回大模型领域话语权的新模型。

目前, LMSYS 已经删除了该模型,同时更新了使用政策,明确商业公司可能以「匿名发布」的方式将新模型提供给 LMSYS 平台供公众测试, LMSYS 会将反馈结果和一部分样本提供给模型提供方,且模型提供方有随时撤回模型的权利。

——————

有网友通过提示词攻击的方式,在网页版 ChatGPT 的 GPT-4 模型对话时得到了与 gpt2-chatbot 类似的预置 prompt。(即v2 人格)

另据新智元报道,Sam Altman在哈佛大学演讲中,向所有人确认了gpt2-chatbot不是OpenAI下一代的模型。


——————

via:https://rentry.org/GPT2

src:https://mp.weixin.qq.com/s/O3Fl_eUqe8LMkFFCeR74jw
Telegram 的 DC5 离线

用户目前报告连接到 DC5 或与位于 DC5 的用户和对话交互时出现问题。

该数据中心位于新加坡,为亚洲、大洋洲和澳大利亚的用户提供服务。

北京时间 1:30 更新:经过一个半小时的中断后,服务似乎正在重归稳定。

#outages
一个小站的自留地
马斯克旗下大模型公司xAI开源Grok-1 今天凌晨,埃隆·马斯克(Elon Musk)旗下的大模型公司xAI宣布正式开源其3140亿参数的混合专家(Mixture of Experts, MoE)模型「Grok-1」。 Grok-1 的模型细节包括如下: 据机器之心,Grok-1是基于大量文本数据训练的基础模型,该模型的MoE架构在给定token上的激活权重为25%,且从头开始训练,未使用任何特定应用(如对话)进行微调。 根据推特网友Andrew Kean Gao的分析,Grok-1模型的关键特点如下:…
阿里正式开源1100亿参数Qwen1.5-110B模型

Qwen1.5-110B模型是截止目前为止国内开源模型中参数规模最大的模型。Qwen1.5-110B模型与其它Qwen1.5系列模型架构一致。采用了分组查询注意力机制,因此推理效率很高。该模型最高支持32K上下文,并且支持多语言。

根据官方公布的评测结果,Qwen1.5-110B模型的评测结果略超过Llama-3-70B和Mixtral-8×22B,是除了Llama3-70B-Instruct模型外最强的开源模型

国内此前开源领域最大的参数模型是720亿参数规模的Qwen1.5-72B规模和650亿参数的深圳元象科技开源的XVERSE-65B。

(DataLearner)
——————
可信度:A
美国联邦通信委员会(FCC)于2024年4月25日发布命令,指示中国电信、中国联通和中国移动在美国的分公司停止在美国提供固定或移动宽带互联网服务。

作为FCC出于国家安全考虑而采取的更广泛行动的一部分,该指令指出,这些中国电信公司"受到中国政府的剥削、影响和控制"。

FCC的决定要求这些运营商在同日批准的网络中立性命令生效之日起60天内停止服务。

src:
https://www.scmp.com/news/world/united-states-canada/article/3260401/us-federal-communications-commission-bars-chinese-telecoms-carriers-offering-broadband-services

——————
可信度:A
一个小站的自留地
阿里云发布通义千问 2.0 阿里云刚刚在 2023 年云栖大会上正式发布了通义千问 2.0 ,官方表示,「目前通义千问的综合性能已经超过 GPT-3.5,正加速追赶GPT-4」。 该模型目前已在阿里云上可用,无需等候。另外,通义千问 APP 现已经开放体验,新增语音对话功能。 阿里云 CTO 周靖人宣布将在 11 月开源通义千问 720 亿参数模型。周靖人表示,通义千问 72B 将成为参数规模最大的中国开源大模型,继续支持全球开发者开展模型和应用创新。此外,未来阿里云将持续发布更大规模的开源模型。 …
商汤科技23日发布日日新5.0大模型,大部分核心测试集指标已对标或超过GPT-4 Turbo。

据商汤科技,日日新5.0大模型采用了混合专家架构(MoE),训练数据超过10TB tokens,具备200K的推理上下文窗口。

此外,商汤发布会现场还演示了文生图、扩图、多模态、工具调用等能力,也演示了端云结合的较小模型。

4月24日,商汤科技港股股价大涨后,公司公告临时停牌,停牌前涨幅高达31.15%。

官网链接:
chat.sensetime.com

(财联社)
——————
可信度:A
一个小站的自留地
阿里旗下笔记软件语雀官网发生网络故障 据 V2EX 网友,阿里旗下笔记软件「语雀」官网出现无法打开现象,截止发稿故障已经 4 6 小时。 根据网友反馈,语雀官网于下午出现重定向次数过多的报错,随后连接正常,但出现 502 错误。 语雀官方于故障发生约一小时后在微博表示出现网络故障,不会影响用户数据。 —————— 本次故障历时九小时,已经超越了普通网络故障的层面。 据分析故障应在应用层,据说是数据库故障导致。 恢复后,用户数据并无丢失。
知名创作者平台「爱发电」疑似因网络攻击而宕机

「爱发电」是一个为创作者和粉丝提供打赏通道的平台,长期以来,有非常多个人创作者通过爱发电运营自己的粉丝付费社群。

不久前,飞致云旗下的服务器管理面板 1Panel 宣布推出专业版,首批打赏用户可获得 1 折优惠券,可以以 98 元购买原价 980 元的 1Panel 单设备专业版授权。飞致云通过爱发电平台作为收取打赏的渠道,最低门槛为打赏十元,即可获得一张一折券。

由于 1Panel 先前的良好口碑,此次活动在建站社群内广泛传播,带动了收款方爱发电的访问量。

自 4 月 16 日晚,爱发电的官网就出现长时间的间歇性无法访问现象,官方在微博发文称,「很抱歉地通知大家,爱发电目前被攻击了,暂时无法访问」。

鉴于爱发电长期保持稳定运行,且本次 1Panel 上线专业版活动的时间线与爱发电受攻击在动机和时间线上都较为合理,加之建站社群鱼龙混杂,本频推测此为爱发电受到攻击的直接原因。

据 ITDOG 拨测,爱发电的服务器单IP 部署于国内腾讯云。

可信度:B+


——————

这我熟啊,大概看起来就是被 DDoS 打黑洞了,官方应该可以通过向腾讯云购买非常昂贵的防御包来恢复服务,但对于爱发电目前的体量和收入情况来说,这显然是难以负担的。

——————

据一个小站的观测数据,爱发电自 2024-04-17 13:04 起启用了 Cloudflare CDN,目前访问已经稳定恢复。

还得是 CF 大善人
一个小站的自留地
腾讯云控制台与 API 遭遇广泛服务中断 2024年04月08日,腾讯云出现出现严重宕机事故官方通报故障持续74 分钟(15:31 - 16:45),波及全球 17 个区域与数十款服务。 据 cnBeta,从网友反馈的时间来看,此次腾讯云崩溃的时间大约在今天下午15:20左右。 另据@非法加冯,傍晚 17 时仍有服务异常的零星用户报告。 故障导致控制台等几乎所有与鉴权有关的功能不可用。而云服务器等产品则正常运行。 腾讯云官方记录显示,官方于15:31发现故障,并于16:45 恢复,腾讯云方面暂未发布故障复盘。…
腾讯云发布故障复盘,系「云API服务新版本向前兼容性考虑不够和配置数据灰度机制不足」导致。

腾讯云称,此次故障一共持续了近87分钟,期间共有1957个客户报障。

整个处理过程如下:
1. 15:23,监测到故障,立即执行服务的恢复,同时进行原因的排查;
2. 15:47,发现通过回滚版本没能完全恢复服务,进一步定位问题;
3. 15:57,定位出故障根因是配置数据出现错误,紧急设计数据修复方案;
4. 16:02,对全地域进行数据修复工作,API服务逐地域恢复中;
5. 16:05,观测到除上海外的地域API服务均已恢复,进一步定位上海地域的恢复问题;
6. 16:25,定位到上海的技术组件存在API循环依赖问题,决定通过流量调度至其他地域来恢复;
7. 16:45,观测到上海地域恢复了,此时API和依赖API的PaaS服务彻底恢复,但控制台流量剧增,按九倍容量进行了扩容;
8. 16:50,请求量逐渐恢复到正常水平,业务稳定运行,控制台服务全部恢复;
9. 17:45,持续观察一小时,未发现问题,按预案处理过程完毕。

Src:
https://mp.weixin.qq.com/s/2e2ovuwDrmwlu-vW0cKqcA
GPT-4 Turbo 推出正式版

全面开放,可通过“gpt-4-turbo”来使用此模型,最新版本为“gpt-4-turbo-2024-04-09”

基础能力更新,按官方说法:Majorly improved GPT-4 Turbo model

自带读图能力,无需使用 4v 接口

128k 上下文

训练数据截止至 2023 年 12 月

模型信息:https://platform.openai.com/docs/models/gpt-4-turbo-and-gpt-4

(赛博禅心)
一个小站的自留地
阿里云控制台与 API 遭遇广泛服务中断 根据阿里云的官方通报,2023年11月12日17:44开始,阿里云云产品控制台服务出现异常。这次异常影响了多个产品和地域,包括各类云服务、数据库服务、存储服务、安全服务等。具体受影响的地域包括北京、上海、深圳、杭州等国内多个城市,以及香港、美国、英国等海外地区。 事件进展如下: 11月12日18:14,阿里云确认了异常并开始排查。 18:50,阿里云发现故障与某个底层服务组件有关,开始紧急处理。 18:59,杭州、北京等地域控制台及API服务已恢复。 19:…
腾讯云控制台与 API 遭遇广泛服务中断

2024年04月08日,腾讯云出现出现严重宕机事故官方通报故障持续74 分钟(15:31 - 16:45),波及全球 17 个区域与数十款服务。

据 cnBeta,从网友反馈的时间来看,此次腾讯云崩溃的时间大约在今天下午15:20左右。

另据@非法加冯,傍晚 17 时仍有服务异常的零星用户报告。

故障导致控制台等几乎所有与鉴权有关的功能不可用。而云服务器等产品则正常运行。

腾讯云官方记录显示,官方于15:31发现故障,并于16:45 恢复,腾讯云方面暂未发布故障复盘。


阿里云曾于去年 11 月发生大规模故障,导致云产品控制台及管控API服务异常,并导致大量调用阿里云登录或验证的产品(包括阿里几乎全系产品)无法使用。事后复盘则发现,问题是「访问密钥服务(AK)在读取白名单数据时发生异常,由于处理异常的代码逻辑缺陷,生成了不完整的白名单」。

此次腾讯云故障,虽控制台和依赖鉴权的 PaaS 服务(如 私有 COS)无法使用,但似乎并未影响到腾讯旗下其他产品。


——————

ref:
https://cloud.tencent.com/announce/detail/1995

(图源网络)

可信度:A
OpenAI 为模型微调功能提供了更多增强选项

1. 微调API功能更新

- 保存每个训练周期的完整模型

- 提供多个模型输出对比界面

2. 定制模型计划更新

- 新增辅助微调服务,通过与OpenAI技术团队合作来提高模型性能

- 支持组织利用大量专有数据从头训练定制模型


src:
https://openai.com/blog/introducing-improvements-to-the-fine-tuning-api-and-expanding-our-custom-models-program

——————
可信度:A
#运营通知

一个小站的前置服务器正受到DDoS攻击,已被阿里云黑洞,目前所有服务暂不可用,预计1小时后恢复。

已经恢复。

4.3 日下午约 13 时起攻击者开始了新一轮攻击
由于本次黑洞时间较长,先行部署新服务器恢复部分网站访问。
部分非核心服务请耐心等待恢复。


所有服务已经恢复。

服务状态可见:
https://status.ygxz.xyz/status/ygxz
#Update #ChatGPT

现在,无需注册也可以使用 ChatGPT 3.5 了。

并且,未注册用户使用 ChatGPT 3.5 可以选择不贡献记录改进模型。

点击加入:OpenAI 讨论组(有入群验证的,记得做)
一个小站的自留地
有消息称,ChatGPT Plus 正灰度测试年付购买,一年价格为199.99美元,相当于每年省下40美元。 可信度:C(待核实)
有消息称,ChatGPT Plus 正灰度测试动态聊天限制,即变相放宽 GPT-4 的聊天条数限制,改为与 Claude 看齐。

本频测试发现,目前已经有部分账号可见聊天限制处显示「Usage limits may apply」,而非原先的 Limit 40 messages / 3 hours

鉴于ChatGPT Plus 在很长一段时间里的聊天速率限制本就不太严格,本频猜测此次变更可能仅涉及文案变化,大部分用户的使用限额应该不会有太大提升。

Claude 早在很久以前就采用动态限额,即不会对用户展示具体的聊天限额,而是在限额仅剩 15 条时告知用户。


可信度:B
一个小站的自留地
新款 iPhone 开售后,各渠道仍保持一定溢价。 从9.23的渠道价可以看出,Pro 系列中白色入门版最受追捧,更高的型号中,消费者却普遍偏向原色和黑色,而蓝色最不受欢迎。 数字系列产品中,黄色最不受欢迎。 另据拼多多相关产品评论区,百亿补贴的iPhone 15 Pro中,目前只有蓝色发出。 本代产品由于功耗发热等问题,其实存在一定硬伤。 个人觉得真要买的话可以继续观望,完全没必要溢价入。 最后,华为发布会明天下午就开,咱们拭目以待。
iPhone 16 系列现有爆料汇总

iPhone 16 Pro版:

1. 主摄升级为两颗48MP传感器,仅长焦镜头为12MP。
2. 将新增一个独立的「拍照键」。
3. 有望重新推出「深空灰」和「玫瑰金」两种颜色。
4. 搭载 A18 Pro 芯片。
5. 利用堆叠技术和体积增大改善电池容量;屏幕尺寸扩大。
6. 改进散热系统

iPhone 16标准版:

1. 后置相机模组设计变为垂直排列,呈药丸形状。
2. 主摄规格信息未知,预计与现有iPhone相比几乎没有升级。
3. 搭载 A18 芯片。
4. 改进散热系统
5. 整体电池容量有所提升,但Plus版本可能略有减少。

可信度:C(综合媒体报道)
Back to Top