起于小站,终于生活。
现实之外,一个普通人的思考。

博客地址:ygxz.in
讨论组:https://t.me/+a5Clq4jLuJc4YWQ9
Google 登陆界面更换了新设计

该页面从2月21日起开始逐步推出,并于3月4日起面向全部用户。

更改该页面的原因
新版登录页面的布局更好,适用于各种类型的屏幕,包括大屏和宽屏。新版登录页面会根据屏幕大小而调整。

如果您使用的是版本较低的浏览器,可能仍会看到旧版登录页面。

了解新版 Google 登录页面

🗒 标签: #Google
📢 频道: @GodlyNews1
🤖 投稿: @GodlyNewsBot
一个小站的自留地
由于本站公益承载量基本达到上限,现对运营做出如下调整:

关闭邮箱注册,同时开启 Github 注册,新用户仅可通过 Github 新建账户。

对即日起注册的新用户,初始额度由 $5 调整到 $3。邀请双方奖励额度由 $3 调整到 $1。

dall-e-3模型的倍率由 25(官方倍率)上调到 30。

开通 Telegram 群组,如果你有合理需要(如学习、科研等),可在群组中申请免费的额度兑换码。

https://t.me/+a5Clq4jLuJc4YWQ9

今后大部分关于 API 商店的运营通知将不会在频道中推送。
一个小站的自留地
3 月 7 日上午约 9 时起,承载一个小站的主要服务的服务器收到了一波 CC 攻击。 傍晚录得最高 QPS 约 300,导致傍晚造成约 26 分钟宕机。

3 月 8 日早晨约 8 时起,一个小站的源站正在无任何防御的情况下受到 CC 攻击,本次攻击录得最低 24 小时在线率 95.54%。

3 月 10 日凌晨约 4 时起,一个小站的短网址服务的托管流量被 CC 攻击用尽,由于没有可用备份,该站点须等待下月方可重新访问。

目前主站的防火墙已经打开,期间的访问异常和数据缺失会慢慢修复。由于个人原因,我暂时没有多余精力维护网站和应对攻击,如有不便还请见谅。
一个小站的自留地
Claude 3 Opus 快速评测

Anthropic 突袭发布Claude 3家族模型,而对标 GPT-4 的旗舰模型「Claude 3 Opus」也已经对 Pro 会员可用。本频将结合各媒体测试结果和个人体验简单总结。


基础性能

从各方Benchmark来看,Claude 3 Opus 的基础性能(推理能力、知识储备)都和 目前公认的「地表最强模型」 GPT-4-Turbo不相上下。在数学计算、逻辑推理单项测试上,甚至相比GPT-4-Turbo具有微弱优势。

本频实际体验发现,Claude 3 Opus在理解能力上的确可圈可点,不论是中文还是英语提问,绝大多数情况都不会出现误解的情况。

对于创作和翻译类任务,在不使用任何提示词工程的情况下,Claude 3 Opus的中文流畅度表现较佳。


多模态性能

本次Claude 3 全家族三个模型都支持图片输入。英语多模态能力二者不相上下(GPT-4 也已基本达到甚至超过人类水平),而在多语言的文字识别,特别是抽象文本(如手写)的识别和猜测上,Claude 3 Opus 明显占优。本频测试了此前 GPT-4 翻车的中文海报,Claude 3 Opus 已经能识别出大部分较为明显的文本。

尽管如此,Claude 3 Opus 还是没能克服大模型在多模态时的幻觉问题。一旦用户提示「你错了」,Claude 3 Opus 仍然有很大几率「承认错误」并识别出错误的文字。


用户体验

Claude 3 Opus 的上下文窗口相比ChatGPT 网站上提供的32K 上下文的 GPT-4 要高不少,读取文档的功能也是全文读取而非 ChatGPT 通过类似向量库读取,因此总结长文的能力比 ChatGPT 强了不止一点。

然而,Claude网页端当前的功能仍较为简单,对数学公式、Markdown 等格式的原生支持都不如 ChatGPT 完善而成熟。

不同于 ChatGPT 支持无限的对话(即使会自动截断超出窗口的上文),Claude会将上文全部发送。因此单次对话仅限 5 张图片,上传大文档后也很容易出现对话途中达到限制被迫重开对话的情况,体验算不上好。

指令遵循方面,Claude 3 Opus 相比 GPT-4 可以用完败来形容。

GPT-4 可以很轻松地完成的按照指定格式输出的指令,Claude 3 Opus 就经常出错,或在下文中忘记要求,中文对话下的指令遵循表现本频感受甚至只有 GPT-3.5 的水平。而且也许是刚发布服务器压力大的原因,经常出现中文回复一段后莫名出现英语单词的情况,在有图片输入时尤为严重。


ChatGPT 在生产力上的优势仍是Claude难以企及的,但相信随着大模型基础能力差距的缩小,会有越来越多产品选择「性价比更高」的Claude 3 家族模型, 留给OpenAI的时间也许不多了。
一个小站的自留地
据Downdetector,X (Twitter)出现大规模故障。 截至发稿,故障已经超过半小时。 据 网友反馈 ,具体表现为无法加载推文和视频。 此故障已恢复。 可信度:A —————— src: https://downdetector.com/status/twitter/ —————— 较早前,国内数个大厂服务接连故障,引发网友「降本增笑」的群嘲。除本频先前报道过的事件外,还有12日菜鸟无法获取取件码,19日喜马拉雅故障,20日LeetCode网页接口出错等事件。 本频曾多次报道Clo…
Meta 及旗下社交平台遭遇大规模服务降级

据DownDetector, Google,Meta,CloudFlare,X,Microsoft,AWS 等大型网站和云提供商几乎同时出现短暂故障。

CloudFlare 和Google的状态页面并未显示异常,而 Meta 方面则公开表示遇到了故障。

据Android Police,故障受影响最严重的是 Meta 及旗下产品 Facebook、Instagram 。

截止发稿,仍有用户报告 Facebook、X、Massager 等社交平台不可用,且这一故障可能是全球性的。

据网友报告,该故障于北京时间0:35 时许逐渐恢复。

src:

https://downdetector.com/

https://www.theverge.com/2024/3/5/24091207/meta-outage-facebook-instagram-threads-down-signed-out

https://www.androidpolice.com/google-meta-down-hard-right-now/

可信度:A
Switch 模拟器 Yuzu 终止运营并永久下架

Yuzu的开发者Tropical Haze同意支付给任天堂240万美元的赔偿金,并停止所有运营,这是对任天堂提起诉讼的回应。

任天堂指控Yuzu模拟器在大规模上促进了盗版行为。双方已达成和解,前提是得到法院的最终批准。

作为和解的一部分,Tropical Haze将面临永久禁令,禁止其提供、推广、销售、测试、托管、复制、分发或以其他方式贩售Yuzu或其任何源代码或功能,以及任何其他绕过任天堂技术保护措施的软件或设备。

Yuzu团队宣布,即日起停止Yuzu及对Citra的支持,并将在不久的将来关闭他们的网站。

可信度:A
Netflix决定不再通过App Store内购系统接受订阅

据9to5Mac,Netflix已经通知用户,如果他们仍然通过App Store的内购系统支付月费,他们需要添加一种新的支付方式以保持账户活跃。这一变化的主要原因是Netflix不愿意继续支付给Apple的15%的订阅费用分成。

自2018年以来,Netflix已经停止允许消费者通过iOS设备订阅其流媒体服务,但对于已经通过这种方式订阅的客户,Netflix一直允许他们继续使用内购支付。然而,现在Netflix似乎对这种支付方式失去了耐心,并决定进行变更。

报道中提到,Netflix要求使用Apple设备的客户端必须在Netflix网站上注册新的订阅,而iPhone或iPad上的Netflix应用不再提供订阅选项,只提供登录界面。

via
https://www.newmobilelife.com/2024/02/27/netflix-end-app-store-subs/

可信度:A
一个小站的自留地
阿里云发布通义千问 2.0 阿里云刚刚在 2023 年云栖大会上正式发布了通义千问 2.0 ,官方表示,「目前通义千问的综合性能已经超过 GPT-3.5,正加速追赶GPT-4」。 该模型目前已在阿里云上可用,无需等候。另外,通义千问 APP 现已经开放体验,新增语音对话功能。 阿里云 CTO 周靖人宣布将在 11 月开源通义千问 720 亿参数模型。周靖人表示,通义千问 72B 将成为参数规模最大的中国开源大模型,继续支持全球开发者开展模型和应用创新。此外,未来阿里云将持续发布更大规模的开源模型。 …
Mistral发布 Mistral Large

Mistral Large 可通过 Plateforme 获取。还可以通过 Azure(Mistral的第一个分销合作伙伴)提供该模型。Mistral Large 是Mistral的新旗舰模型。

Mistral Large 是Mistral最新的尖端文本生成模型,具有顶级的推理能力,在常用基准测试中取得了优异的成绩,使其成为全球排名第二的可通过 API 获取的模型(仅次于 GPT-4)

与 Mistral Large 一起,Mistral发布了一款新的优化模型——Mistral Small,专为延迟和成本优化。Mistral Small 的性能超过了 Mixtral 8x7B,且延迟更低。

以上模型不开源,且暂不支持中文。

(AI的潜意识)

src:
https://mistral.ai/news/mistral-large/

可信度:A
一个小站的自留地
你好,这里是一个小站的 API 商店 AIGC 的时代已经来临,相信你也早早领略过 ChatGPT 的神奇。 然而身处国内,OpenAI 的政策所限使得我们正当访问 ChatGPT 困难重重, 一览国内互联网,套壳 ChatGPT 宣称 “自研”“免费” 的骗子产品比比皆是,最终却只是赚取了那部分用不到 ChatGPT 的同学的信息差。 ChatGPT 在官网上可以免费使用,而 API 则属于按量计费,价格也远没有国内 API 贩子倒卖得那么离谱。 一个小站的 API 商店提供的是一个基于官方 API…
#运营通知

由于市面上 OpenAI API 转发商近期受封号影响,普遍涨价严重,影响了许多轻度个人用户的体验,我们将对API商店进行降价处理,践行半公益运营的初衷。

目前系统计费倍率已经由官网的八折下调为六折,感谢你的支持。

与此同时,API商店的全球部署也已完成,一个小站将努力通过双节点+全球加速的方式提供高可用的服务。

一个小站的自留地
OpenAI正式宣布ChatGPT的记忆功能,正面向所有用户逐步推出,灰度测试期间免费用户也将可用。 在后期全量推送阶段,Team、Enterprise 用户和 GPTs 才可使用记忆功能 src: https://openai.com/blog/memory-and-new-controls-for-chatgpt 可信度:A
OpenAI发布文生视频大模型Sora

OpenAI宣布发布全新的Diffusion大模型Sora,这是一个可以生成最长60秒视频的视频生成大模型,可以生成非常逼真的电影画面版的视频。

它可以生成持续时间、宽高比和分辨率不同的视频和图像,最长可达一分钟的高清视频。

Sora模型目前还处于测试阶段,并没有开放给大众使用。

(Datalearner)

——————

尽管仍然存在不少改进空间,但与当前文生视频模型比较来看,Sora的进步是变革性的。特别是在物理模拟和前后稳定性方面。

有评论称其「可能会颠覆电影行业的创作方式,开启人类AI的新纪元」。

src:
https://openai.com/sora


可信度:A
一个小站的自留地
Gemini Ultra现已发布 据Google One官网,采用 Ultra 1.0 模型的 Gemini Advanced 以及 Gmail、Google 文档和更多产品中的 Gemini(即将推出)将仅支持英语,并且仅面向年满 18 周岁的用户。 价格方面,新的AI套餐前两个月免费,之后每月19.99美元/18.99英镑/21.99欧元/1950印度卢比。 src: https://one.google.com/explore-plan/gemini-advanced 可信度:A ——————…
Google发布Gemini 1.5 Pro

据Google,Gemini 1.5 Pro是一个中等大小的多模态模型,在各项任务评测结果都接近Gemini Ultra,最高支持100万tokens的上下文。

谷歌公布了Gemini 1.5 Pro在各项评测的分数,结果非常接近Gemini Ultra,同时部分评测结果超过原有模型。其中,GSM8K评测得分91.7,全球最高

Datalearner按照此前发布的信息推测,Gemini Pro的参数量应该是比Gemini Ultra低一个数量级

Gemini 1.5 Pro是一个全新的MoE模型(Mixture of Experts,混合专家)。这意味着这是一个和Mixtral 7B×8类似架构的模型,也可能是大企业中首个公开宣称自己是MoE架构的模型。

(Datalearner)

src:

https://storage.googleapis.com/deepmind-media/gemini/gemini_v1_5_report.pdf

可信度:A
一个小站的自留地
OpenAI正式宣布ChatGPT的记忆功能,正面向所有用户逐步推出,灰度测试期间免费用户也将可用。

在后期全量推送阶段,Team、Enterprise 用户和 GPTs 才可使用记忆功能

src:
https://openai.com/blog/memory-and-new-controls-for-chatgpt

可信度:A
Back to Top