起于小站,终于生活。
现实之外,一个普通人的思考。

博客地址:ygxz.in
讨论组:https://t.me/+a5Clq4jLuJc4YWQ9
一个小站的自留地
阿里旗下笔记软件语雀官网发生网络故障 据 V2EX 网友,阿里旗下笔记软件「语雀」官网出现无法打开现象,截止发稿故障已经 4 6 小时。 根据网友反馈,语雀官网于下午出现重定向次数过多的报错,随后连接正常,但出现 502 错误。 语雀官方于故障发生约一小时后在微博表示出现网络故障,不会影响用户数据。 —————— 本次故障历时九小时,已经超越了普通网络故障的层面。 据分析故障应在应用层,据说是数据库故障导致。 恢复后,用户数据并无丢失。
语雀官方发布故障复盘

本次故障的原因是由于运维升级工具 bug 导致华东地区生产环境存储服务器被误下线 。

故障发生在10月23日下午 , 持续了7个多小时才完全恢复 。
具体的时间线如下:
14:07收到报警
14:15联系硬件团队尝试重新上线
15:00调整恢复方案为从备份系统中恢复数据
15:10开始恢复数据
19:00完成数据恢复
21:00完成数据校验
22:00恢复语雀全部服务

官方补偿个人用户 6 个月会员时长(注:需手动领取),并承诺增加多地灾备。
至于网友呼声较高的离线模式则未提及。

——————
公告原文:
https://mp.weixin.qq.com/s/WFLLU8R4bmiqv6OGa-QMcw
科大讯飞和百度发布新一代大语言模型

星火认知大模型V3.0和文心大模型4.0于近期接连发布,宣称在中英文生成、理解、推理等方面都有显著的提升。

新华网 ,科大讯飞星火认知大模型V3.0于10月24日在第六届世界声博会暨2023全球1024开发者节上发布,覆盖了文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等七大维度,实现了全面提升。科大讯飞董事长刘庆峰表示,星火大模型的中文能力客观评测已经「超越了ChatGPT,英文能力与之相当」。

IT之家 ,百度文心大模型4.0于10月17日在百度世界大会上发布,开启邀请测试。百度创始人、董事长兼首席执行官李彦宏宣布,这是迄今为止最强大的文心大模型,实现了基础模型的全面升级,在理解、生成、逻辑和记忆能力上都有着明显提升,综合水平「与GPT-4相比毫不逊色」。

——————
文/ChatGPT
图/DALL·E 3

——————
编注:
科大讯飞股票于星火3.0发布同日大幅下跌近10个百分点。
阿里旗下笔记软件语雀官网发生网络故障

V2EX 网友,阿里旗下笔记软件「语雀」官网出现无法打开现象,截止发稿故障已经 4 6 小时。

根据网友反馈,语雀官网于下午出现重定向次数过多的报错,随后连接正常,但出现 502 错误。

语雀官方于故障发生约一小时后在微博表示出现网络故障,不会影响用户数据。

——————

本次故障历时九小时,已经超越了普通网络故障的层面。

据分析故障应在应用层,据说是数据库故障导致。

恢复后,用户数据并无丢失。
勤奋N年定时更新的博主们的画风
A:这个系列要写完了,准备学点新技术写新系列
B: 我也是,但是我还有十篇存稿没发完

我等咸鱼的画风
群友H:Y你博客一年没更新了,快更新
群友Y:? 好意思说我。 H你一年半没更新了,什么时候更新
OpenAI的API服务遇到大规模的服务降级

约两小时前,大量用户报告OpenAI的API服务不可用,据悉为API鉴权部分出现故障导致。

部分ChatGPT用户也遇到故障。

OpenAI官方在 状态页面 表示,已经定位到问题,正在修复中。截至目前,OpenAI宣称已经部署一个修复,但问题仍未完全解决。

Azure提供的OpenAI服务则不受影响。

本站测试中的依托OpenAI的服务均部署于Azure,不受本次故障影响。

虽然由于用户暴增,OpenAI服务经常出现短暂中断,但面向开发者和企业用户的API服务全局中断两小时以上对一家大型公司来说也是极少见,且可能致命的。

据OpenAI官网,其API服务的30天SLA已经快要不足99.9%。


——————
UPDATE1:

故障发生约三小时后,OpenAI于其状态页上表示,「影响我们 API 客户(以及 ChatGPT)的根本问题是我们 API 身份验证栈的上游部分。」

「我们发现底层缓存资源的容量已接近饱和,因此我们正在同时扩容底层缓存资源,并开发不使用缓存的备用系统。」

UPDATE2:

故障发生约3小时30分钟后,OpenAI宣布服务恢复正常。
一个小站的自留地
先搁一下。 近期需要对网站做一次大规模的运维架构调整,由于备用方案承载规模有限,为了方便起见就直接拿生产环境做测试了。 近期各服务SLA可能会短暂下降至95%(24H),如遇无法访问请及时刷新DNS缓存。 为减少打扰,维护期间的业务中断将不另行通知。 另: Nite07的下载源已经撤了,大哥们别打了 —————— 2023.10.18 14:00 更新 维护基本完成,部分区域需暂时等待DNS记录刷新。 维护期间录得24小时SLA为92.28% 其中最 SB 的一次中断是因为我更改 DNS…
——————

本次维护试图解决原香港虚拟主机遭受攻击时无法切换备份的问题,同时针对原美国服务器性能不足的短板,合并美欧两地服务器预算,购置了一台 VDS 用于几乎所有网站服务。

是的,由于预算限制,我们的服务仍为单点部署。

同样的由于预算所限,我们只能用得起野鸡 CDN,效果看下来时好时坏,尚待观察。

在过去的两个多月时间里,我们的 AList 服务器通过为 Nite07 提供下载点来测试 Cloudflare 优选的实际效果,现在测试已经结束,下载源也已经撤下了。
可以说除了移动有某一个神奇的 IP 段以外,我没有找到其他针对电信联通有效的 Cloudflare 优选。

在测试期间本站的 AList 一直遭受断断续续的刷流量和 CC 攻击,由于多次更换服务器,总流出流量已经难以计算。我中途也多次使用 Cloudflare 的防火墙和宝塔的人机验证试图进行防御,但都发现用于下载时可能会降低一般访客的访问体验,遂放弃。

由于目前 AList 和博客主站放置在同一服务器上,未来我们将考虑把 AList 私有化来防止出现占满性能导致全线服务崩溃的情况。
一个小站的自留地
在下方表格填写账号后,可以很快收到画图功能的推送。(前提得是Plus会员) https://forms.gle/bjPwvdZrRyJqKhQLA 最近在准备ChatGPT新功能的长文了 不出意外的话会首次在博客和少数派同时发 但是由于灰度测试这个烦人的东西 啥时候写出来取决于啥时候灰度到我……
先搁一下。

近期需要对网站做一次大规模的运维架构调整,由于备用方案承载规模有限,为了方便起见就直接拿生产环境做测试了。

近期各服务SLA可能会短暂下降至95%(24H),如遇无法访问请及时刷新DNS缓存。

为减少打扰,维护期间的业务中断将不另行通知。

另:
Nite07的下载源已经撤了,大哥们别打了

——————

2023.10.18 14:00 更新

维护基本完成,部分区域需暂时等待DNS记录刷新。

维护期间录得24小时SLA为92.28%

其中最 SB 的一次中断是因为我更改 DNS 解析忘了保存,导致 40 余分钟的 SSL 证书错误。
会引以为戒的……
https://gist.github.com/CwithW/01a726e5af709655d6ee0b2067cdae03

以上为漏洞细节,实际上这是一个2022年的漏洞,编号为CVE-2022-28927。

这个项目主要用来订阅转换的。比如:

v2ray base64格式 —> clash配置文件

大部分在线订阅转换客户端都处于旧版本,所以受影响很大。其实早在去年就已经听到订阅转换有漏洞的风声,个人就特别留意避免使用在线订阅转换。这次的结果还是因为一个20万订阅量的Youtuber 才得以引起重视。

各位用过在线订阅转换的,赶紧去重置订阅吧。 Subconverter v0.7.2 unauthorized RCE
一个小站的自留地
部分 Plus 用户已经可以在 iOS 版本的 ChatGPT 客户端上体验语音双向对话功能。 语音对话的界面为全屏黑白+对话气泡,底部文字显示录音状态,支持无需干预的多轮对话,但是语音识别结果和AI的回复并不会以文字显示。 根据网友分享的视频,哪怕是中文对话,ChatGPT也能生成非常自然的语音回复,甚至还会自己加上语气词。看来OpenAI的TTS还是有点东西。至少目前看起来就比第一梯队的微软Azure还要强。 美中不足的是回复需时较久,大约在3~5s左右。 目前语音对话的灰度率大致在50%上下,而被认为是对标Google…
DALL-E 3 已经开始在ChatGPT Plus 用户中灰度测试。

很可惜,目前所有的灰度测试,频道主自己的账号一样都没有。

评测还得等一会……


再次感谢万能的网友。

绘画功能以GPT-4单独模型的形式出现,目前是在插件模型的下方。

一次绘画会出四张图,在没有指定风格的情况下,四张图一般风格不同。你也可以进一步对话让ChatGPT继续修改。

和Bing不同的是,ChatGPT生成的图片不一定是正方形,而是会自己选择合适的比例。这点使图片可用性高了不少。

由于基于GPT-4,对prompt的理解力非常好,中文提示也完全可以胜任。

当然,审查依然严格,提示词里稍带黄色或脏话就会拒绝画图。

目前各项新功能的灰度率都在50%左右。还没有看到的朋友可以多等几天。
一个小站的自留地
ChatGPT 视觉模型前瞻&云评测 根据部分网友提供的用例,我们已经能一窥GPT-4V模型的真实面目。 在处理实际问题方面,GPT-4V模型具有非常领先的能力,包括解答带图的理科题目、字谜、图表等等。GPT-4V模型在微调过后,具有卓越的OCR能力和图片整体理解能力,因此不仅可以看到图片中各种异性文字,还可以看到一些抽象的信息(比如道路和设施组成的人脸图案)。 GPT-4V模型在去年底就已经训练完成,在今年3月,OpenAI就开始与Be My Eyes合作,在限定的范围中测试模型以改进模型的幻觉问题和安全性。…
感谢万能的网友。

支持常见图片格式,包括 GIF。选择文件/拖拽/粘贴直接上传,一次可以多张。
OCR 英语真挺强的,简单的数学公式也没问题。

但是不咋能看懂中文,至少我测试的中文海报 OCR 全错,甚至会出现经典的 AI 幻觉,估计和训练集有关。
对截图的中文 OCR 倒是还 OK。

对图片内容(物体、风格、意境)的把握倒是没啥大问题。

视觉功能仅可在 GPT-4 模型中直接使用,插件模型无法上传图片。
📃 中国大陆 App Store 审核政策变更

从 2023 年 9 月 30 日起,任何 App 希望上架中国大陆地区的 App Store 都必须有效的互联网信息服务(ICP)备案号;

游戏 App 必须提供网络游戏出版物号;

图书和报刊杂志 App 必须持有中国国家新闻出版署(NPPA)颁发的《网络出版服务许可证》;

新闻 App 必须持有中国国家互联网信息办公室(CAC)颁发的《互联网新闻信息服务许可证》。

Apple Developer 网站已经开始落实该政策,无能提供有效许可的 App 无法上架或更新。
一个小站的自留地
ChatGPT 正式支持多模态 ChatGPT 官方发布公告,新增语音双向对话、图片对话等多模态方式。 其中,图片对话功能(Vision),是 OpenAI 通过与 Be My Eyes 的合作实现的。这场合作在 GPT-4 发布会时就已经官宣。 ChatGPT 的视觉对话功能,甚至可以输入多张图片,或通过标注告诉 AI 图片的重点。 语音对话功能,包含语音转文字和文字转语音两部分。 前者已经在移动端 App 中可用,是利用 OpenAI 的 Whisper 模型。而后者似乎也是利用 OpenAI…
ChatGPT 视觉模型前瞻&云评测

根据部分网友提供的用例,我们已经能一窥GPT-4V模型的真实面目。

在处理实际问题方面,GPT-4V模型具有非常领先的能力,包括解答带图的理科题目、字谜、图表等等。GPT-4V模型在微调过后,具有卓越的OCR能力和图片整体理解能力,因此不仅可以看到图片中各种异性文字,还可以看到一些抽象的信息(比如道路和设施组成的人脸图案)。

GPT-4V模型在去年底就已经训练完成,在今年3月,OpenAI就开始与Be My Eyes合作,在限定的范围中测试模型以改进模型的幻觉问题和安全性。

在正式推送的版本中,不少用户反映模型对于输入图像的审查过于严格,经常出现拒绝回答的情况,特别是涉及人体和有意义的符号的图像。

不过这并不影响我认为全民多模态AI的时代已经到来。

而且,手上的ChatGPT Plus又更香了。
一个小站的自留地
ChatGPT 正式支持多模态 ChatGPT 官方发布公告,新增语音双向对话、图片对话等多模态方式。 其中,图片对话功能(Vision),是 OpenAI 通过与 Be My Eyes 的合作实现的。这场合作在 GPT-4 发布会时就已经官宣。 ChatGPT 的视觉对话功能,甚至可以输入多张图片,或通过标注告诉 AI 图片的重点。 语音对话功能,包含语音转文字和文字转语音两部分。 前者已经在移动端 App 中可用,是利用 OpenAI 的 Whisper 模型。而后者似乎也是利用 OpenAI…
部分 Plus 用户已经可以在 iOS 版本的 ChatGPT 客户端上体验语音双向对话功能。

语音对话的界面为全屏黑白+对话气泡,底部文字显示录音状态,支持无需干预的多轮对话,但是语音识别结果和AI的回复并不会以文字显示。

根据网友分享的视频,哪怕是中文对话,ChatGPT也能生成非常自然的语音回复,甚至还会自己加上语气词。看来OpenAI的TTS还是有点东西。至少目前看起来就比第一梯队的微软Azure还要强。

美中不足的是回复需时较久,大约在3~5s左右。

目前语音对话的灰度率大致在50%上下,而被认为是对标Google Bard的视觉功能上线范围则更小。

另外,今天Claude获得新一笔投资,其API也在Amazon的AWS平台上线,目前申请批准较快。

Meta也宣布了自己打造的定位为“名人数字分身”的AI助手。

AIGC领域似乎又在内卷了。
ChatGPT 正式支持多模态

ChatGPT 官方发布公告,新增语音双向对话、图片对话等多模态方式。

其中,图片对话功能(Vision),是 OpenAI 通过与 Be My Eyes 的合作实现的。这场合作在 GPT-4 发布会时就已经官宣。

ChatGPT 的视觉对话功能,甚至可以输入多张图片,或通过标注告诉 AI 图片的重点。

语音对话功能,包含语音转文字和文字转语音两部分。

前者已经在移动端 App 中可用,是利用 OpenAI 的 Whisper 模型。而后者似乎也是利用 OpenAI 的新模型实现,官网称,他们正将这一技术用于Spotify 的播客语音翻译功能。

这些功能将在未来两周内向 Plus 和 Enterprise 用户推出。iOS 和 Android 平台上都可用。

这些新增的声音和图像功能为用户提供了更多的交互方式,使得与ChatGPT的对话更加丰富和多样化。用户可以通过语音进行实时对话,也可以通过图像展示问题或情境,使得ChatGPT能够更好地理解用户的需求并提供更准确的回答。

——————
src: openai.com
Back to Top