一个小站的自留地

起于小站，终于生活。
现实之外，一个普通人的思考。

博客地址：ygxz.in
讨论组：https://t.me/ygxz_group

15:03 · 2024年6月29日 · 周六

一个小站的自留地

谷歌发布新一代开源大语言模型 Gemma 2 谷歌 DeepMind 团队于 6 月 27 日正式发布了新一代开源大语言模型 Gemma 2。这个轻量级但性能强大的模型系列提供了 90 亿（9B）和 270 亿（27B）参数两个版本,每个版本都有基础（预训练）和指令微调两种变体。 Gemma 2 的主要特点包括: - 卓越性能：27B 版本在同类模型中表现最佳,甚至可与规模大两倍的模型媲美。9B 版本也优于同规模的其他开源模型,如 Llama 3 8B。 - 高效架构：采用交替使用局部滑动窗口和全局注意力的创新设计…

Google 正向少量 Gemini advanced 用户推送新图像生成模型 Imagen3。(仅限 beta version 15.25.31.29 及以上的安卓 App)

（Raddit）

Google 于 2024年6月26日发布Imagen 3，宣称这是其最先进的文本到图像AI模型。最初只允许少数创作者在ImageFX的私人视图中使用。

17:22 · 2024年6月28日 · 周五

一个小站的自留地

多位用户在与模型交互后发现，当被问及身份时，这两个模型均自称是 Google 的 Gemma。考虑到模型的表现和命名方式，社区普遍推测这可能是 Gemma 2 的预览版本。然而，由于模型有时会产生幻觉，这一说法尚未得到确认。

谷歌发布新一代开源大语言模型 Gemma 2

谷歌 DeepMind 团队于 6 月 27 日正式发布了新一代开源大语言模型 Gemma 2。这个轻量级但性能强大的模型系列提供了 90 亿（9B）和 270 亿（27B）参数两个版本,每个版本都有基础（预训练）和指令微调两种变体。

Gemma 2 的主要特点包括:

- 卓越性能：27B 版本在同类模型中表现最佳,甚至可与规模大两倍的模型媲美。9B 版本也优于同规模的其他开源模型,如 Llama 3 8B。

- 高效架构：采用交替使用局部滑动窗口和全局注意力的创新设计,提高了模型的推理效率。还引入了分组查询注意力（GQA）机制,进一步优化了推理速度。

- 训练创新：利用知识蒸馏技术训练 9B 和 2.6B 模型,通过从更大的教师模型学习,显著提升了小型模型的性能。研究团队在主要为英文数据的 13 万亿 token 上对 27B 模型进行了训练,对 9B 模型进行了 8 万亿 token 的训练。

- 灵活部署：27B 模型经过优化,可在单个 Google Cloud TPU 主机、NVIDIA A100 80GB GPU 或 H100 GPU 上以全精度高效运行推理。

- 安全性提升：在预训练和微调阶段都采取了严格的数据筛选和安全措施,并提供了负责任的生成式 AI 工具包,帮助开发者实施安全最佳实践。

- 开放许可：沿用了 Gemma 1 的宽松许可证,允许开发者和研究人员共享创新并进行商业化。

- 广泛兼容性：兼容主要的 AI 框架,如 Hugging Face Transformers,以及通过 Keras 3.0、vLLM、Gemma.cpp、Llama.cpp 和 Ollama 原生支持的 JAX、PyTorch 和 TensorFlow。

在多项基准测试中,Gemma 2 展现出优异表现。在 MMLU 测试中,27B 模型达到 75.2% 的准确率,9B 模型达到 71.3%,均优于同规模竞品。在人类评估的 LMSYS Chatbot Arena 中,27B 指令微调版本创下了开源模型的新纪录。此外,在 HuggingFace 评估套件上,27B 模型在其规模类别中表现最佳,甚至可以与训练时间更长的大模型进行同级别竞争。

谷歌还提供了由一系列实用示例和指南构成的新 Gemma Cookbook,旨在帮助开发者构建自己的应用程序并针对特定任务微调 Gemma 2 模型。同时,谷歌向开发者开放了 Gemini 1.5 Pro 的 200 万 token 上下文窗口访问权限,并在 Gemini API 中为 Gemini 1.5 Pro 和 1.5 Flash 推出了上下文缓存功能,以帮助减少使用相同 token 的多 prompt 任务成本。

有趣的是,在 Gemma 2 正式发布前,AI 爱好者在 LMSYS Chatbot Arena 上发现了两个名为「im-also-a-late-june-chatbot」和「late-june-chatbot」的新模型。这两个模型仅在平台的随机对战模式中出现,当被问及身份时均自称是 Google 的 Gemma。考虑到模型的表现和命名方式,社区普遍推测这可能是 Gemma 2 的预览版本。

据测试者反馈,这些新模型在某些任务上的表现优于 Claude 3 Haiku。它们倾向于使用粗体和项目符号列表来组织输出,显示出独特的风格特征。不过,也有用户指出,在一些基准测试中,特别是英语问题的处理上,新模型的表现不如 Llama 3 70B。

（谷歌 DeepMind、HuggingFace、机器之心）

15:37 · 2024年6月28日 · 周五

polyfill.io 供应链攻击影响超 10 万网站,波及多个行业

polyfill.io 是一个广受欢迎的 JavaScript 库,用于提升旧版浏览器的兼容性。近期安全研究人员发现,该服务已被恶意利用来注入恶意代码,影响超过 10 万个网站,包括 JSTOR、Intuit 和世界经济论坛等知名机构。

今年 2 月,polyfill.io 的域名和 GitHub 账号被一家名为 Funnull 的公司收购。此后,该服务开始在特定条件下向用户提供被植入恶意代码的脚本。

攻击者通过 cdn.polyfill.io 向网站注入恶意 JavaScript 代码。这些代码具有复杂的特征,能够根据 HTTP 头动态生成有效载荷,仅在特定移动设备上激活,并采取多种措施逃避检测。受影响的网站可能会将访客重定向到博彩和色情网站。

技术分析揭示了攻击的具体细节:

攻击触发条件为非 Mac 和 Windows 平台,且请求中包含 referer 信息。

- 恶意脚本会动态加载一个伪装成 Google Analytics 的文件https://www.googie-anaiytics.com/gtags.js。

- 脚本会检查用户的设备类型、时间等因素,符合条件时将用户重定向到博彩网站 https://wweeza.com/redirect?from=bitget。

- 脚本还会检查页面是否包含常见的分析工具代码(如百度统计、Google Analytics 等)。

值得注意的是,脚本中使用了拼音参数,暗示此次供应链攻击的始作俑者可能是「说中文的人」。

为应对此次攻击,Google 已开始阻止使用受影响代码的网站投放 Google Ads。Cloudflare 和 Fastly 等公司则提供了安全的镜像服务作为替代方案。

安全专家强烈建议开发者立即检查并移除代码中对 polyfill.io 的任何引用。同时,建议采用内容安全策略(CSP)和子资源完整性(SRI)等技术来增强网站安全性。

（综合多个来源）

——————

polyfill.io 供应链攻击事件时间线

2024年2月:
- polyfill.io 域名被一家名为 Funnull 的中国公司收购。
- 项目原作者 Andrew Betts 发出警告,建议网站立即停止使用 polyfill.io。

2024年2月底:
- Cloudflare 和 Fastly 创建 polyfill.io 的安全镜像,为用户提供替代选择。

2024年6月25日:
- 安全公司 Sansec 披露 polyfill.io 正被用于大规模供应链攻击,影响超过10万个网站。
- 恶意代码被发现通过 cdn.polyfill.io 注入到使用该服务的网站中。

2024年6月26日:
- Google 开始阻止使用受影响代码的网站投放 Google Ads,并向广告主发出警告。
- Cloudflare 发布自动 JavaScript URL 重写服务,将 polyfill.io 链接替换为安全镜像。
- 多家安全公司呼吁开发者立即移除对 polyfill.io 的引用。

2024年6月27日:
- Namecheap 域名注册商暂停了 polyfill.io 域名。
- Polyfill 服务在新域名 polyfill.com 上重新上线,声称遭到「恶意诽谤」。

15:22 · 2024年6月28日 · 周五

AGI Playground 2024 Google AI 演讲总结

Google Cloud 中国架构团队总监赵霏近日在AGI Playground 2024 上分享了 Google AI 的最新布局和实践经验。

• 硬件升级：第 6 代 TPU 芯片问世，针对 AI 工作负载优化，将带来更强大的算力和带宽。

• 模型创新：推出多模态原生大模型 Gemini，具备天然的多模态理解能力。Model Garden 平台汇聚超过 130 个 AI 模型，包括自研、开源和第三方模型。

• 产品整合：Gemini 正被整合到 Google Workspace、搜索等多个产品中。如在 Google Meet 中，可自动记录会议内容、生成纪要。

• 开发者工具：推出 Model Builder 和 Agent Builder，帮助开发者构建自定义 AI 模型和智能代理。

• 负责任 AI：制定 AI 原则，提供内容审核 API，从 16 个维度分析 AI 生成内容的安全性。

Google Cloud 还将于 7 月 6 日在北京举办线下 Workshop,让开发者有机会亲身体验 Gemini 1.5 Pro 的长文本处理能力等最新功能。

（Founder Park）

11:42 · 2024年6月28日 · 周五

百度发布ERNIE 4.0 Turbo模型,文心一言用户达3亿

百度于6月28日在WAVE SUMMIT深度学习开发者大会上发布了文心大模型4.0 Turbo、飞桨框架3.0等最新技术。百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰宣布,文心一言累计用户规模已达3亿,日调用次数也达到了5亿。

据百度智能云的API文档,ERNIE-4.0-Turbo-8K支持8K tokens的上下文长度,支持自动对接百度搜索插件,保障问答信息时效性。相较于ERNIE 4.0,在性能表现上有"明显提升"。(ERNIE 4.0仅支持5k上文和2k输出)

目前该模型已通过文心一言网页版(模型名:"文心大模型4.0 turbo")、APP和API向用户开放。企业用户可登录百度智能云千帆大模型平台使用API服务。同日,文心一言下架了插件功能。

此外,百度还发布了飞桨框架3.0,具备动静统一自动并行、编译器自动优化、大模型多硬件适配、大模型训推一体等核心技术。目前飞桨文心生态已凝聚1465万开发者,服务37万家企事业单位,创建95万个模型。

（百度智能云）

——————

6月27日，科大讯飞发布讯飞星火大模型V4.0。

科大讯飞称，星火V4.0性能对标美国人工智能研究公司OpenAI发布的GPT-4 Turbo大模型，在文本生成、语言理解、知识问答、逻辑推理、数学能力上超越了后者，在代码能力和多模态能力上仍有差距。

20:46 · 2024年6月27日 · 周四

一个小站的自留地

疑似是 OpenAI 新模型的未知模型出现在大模型竞技场 LMSYS 上一个名为 gpt2-chatbot 的大模型于不久前出现在大模型竞技场 LMSYS 上，尽管基准测试分数不被公开，但根据网友的实测，其性能超过目前市面上的所有大语言模型。通过提示词引导和基于 token 分词器的研究发现， gpt2-chatbot 非常有可能来自 OpenAI，且应该是 GPT-4 的一个改进版本。其在逻辑能力、代码能力和数学能力上具有当今其他任何大模型无法比拟的能力。似乎很有可能,这个神秘模型实际上是GPT…

新神秘模型现身LMSYS 大模型竞技场

近日,AI 爱好者在 LMSYS Chatbot Arena 大模型竞技场上发现了两个新模型,名为"im-also-a-late-june-chatbot"和"late-june-chatbot"。这两个模型仅在平台的随机对战模式中出现,尚未被列入直接聊天的可选列表。

多位用户在与模型交互后发现，当被问及身份时，这两个模型均自称是 Google 的 Gemma。考虑到模型的表现和命名方式，社区普遍推测这可能是 Gemma 2 的预览版本。然而，由于模型有时会产生幻觉，这一说法尚未得到确认。

据测试者反馈,这些新模型在某些任务上的表现优于 Claude 3 Haiku。它们倾向于使用粗体和项目符号列表来组织输出,显示出独特的风格特征。有用户推测这可能是 Gemma 的两种不同尺寸或微调版本。但也有用户指出，在一些基准测试中，特别是英语问题的处理上，新模型的表现不如 Llama 3 70B。

值得注意的是，这两个模型的命名方式与 OpenAI 此前在同一平台上测试新模型时使用的方式相似，这引发了猜测。有人认为这可能是 Google 对 OpenAI 此前行为的模仿或调侃，也有人怀疑这可能是其他公司的障眼法。

目前尚不清楚 Google 是否正在借助 LMSYS Chatbot Arena 大模型竞技场对 Gemma 模型进行实际应用测试。鉴于 AI 领域的激烈竞争,各大公司纷纷推出新模型以保持技术优势,Google 此举或为应对 OpenAI、Anthropic 等竞争对手的最新进展。

（Reddit）

00:55 · 2024年6月27日 · 周四

一个小站的自留地

ChatGPT Team 计划的邀请机制受到大规模滥用 OpenAI于今天早些时候发布了ChatGPT Team 计划，但其邀请机制据信已被大规模滥用。 ChatGPT Team 计划开通最少需要两个席位，月付即60美元，可获得100条/3小时的GPT-4-Turbo-32k 消息配额。然而，当用户邀请新成员进入该团队时，OpenAI并不会立刻扣费，而是在下一个账单日对新增成员计费。这个空窗期为使用拒付手段滥用ChatGPT服务提供了空间。除此之外，开通团队计划的主账户能够邀请子账户，而这些子账户…

本频从多个信源观察到，近期对于OpenAI （通过 Azure）和 Claude（通过 AWS 或 GCP Vertex AI）渠道的滥用正日益泛滥。

由于微软正式发布 Azure AI Studio 后开放了 OpenAI 模型的流式输出（或称「打字机模式」），现在 API 转发商使用 Azure 转发的 API 与官方已无二异。
而 AWS 平台由于账号可采用预付费模式，加上对 Claude-3.5 Sonnet 模型的宽松开放政策，使得 API 转发商可以以非常低的边际成本盈利。

目前，使用 Azure OAI 的 API 额度，市场价已经下探至 0.7-1.1 人民币/美元，

而 AWS 额度则大约 0.3-0.6 人民币/美元或近乎无穷低。

因此，近期出现的部分「免费」Claude-3.5 Sonnet 服务，基本都是使用大量 AWS 平台账号叠加额度或并发限制实现。但本频预计这一漏洞将很快被 AWS 封堵。

而随着 OpenAI 官方风控政策不断收紧，或许通过大厂云服务获取大模型的访问会成为未来中国用户的主流。

08:11 · 2024年6月26日 · 周三

一个小站的自留地

OpenAI 在昨晚线上直播了 Spring Update（春季更新），时间不仅故意选在对家谷歌年度 I/O 大会的前一天，而且早在发布会前就通过放料+辟谣的连环操作吊足了各路媒体和网友的胃口。本次发布会可以说非常具有工科人的那种直率气质，在一开始就把整场发布会的要点放在了身后的 Slides 上，也就是号称「人人都能用上」的「GPT-4o」模型。 GPT-4o是OpenAI继GPT-4后推出的全新基础模型,其中o代表omni,即"全能"的意思,体现了模型在多模态等方面的全面升级。 GPT-4o最大的亮点是支持多模态输入输出…

OpenAI 推迟 ChatGPT 高级语音模式发布

OpenAI 官方在 Discord 群组通知了 ChatGPT 高级语音模式的最新进展。他们表示，「需要再多一个月的时间来达到发布标准」。

该公司在今年春季更新中曾演示这一功能，原计划于 6 月底向部分 ChatGPT Plus 用户推出 alpha 版本。

OpenAI表示，延迟的主要原因包括提升模型检测和拒绝某些内容的能力、改进用户体验，以及为大规模用户使用做好基础设施准备，以保证实时响应。

OpenAI 计划采用灰度发布，即先向一小部分用户开放以收集反馈，然后根据反馈逐步扩大范围。该公司预计所有 Plus 用户将于今年秋季获得该功能，但具体时间表取决于是否达到其严格的安全和可靠性标准。

ChatGPT 的高级语音模式在上个月春季更新发布会上首次公开亮相，旨在理解和回应情绪及非语言线索，使 AI 与人类的实时自然对话更进一步。OpenAI 表示，他们的目标是谨慎而周到（thoughtfully）地为用户带来这些新体验。

（OpenAI）

——————

稍早之前，OpenAI 正式发布了此前发布会上提到的 macOS ChatGPT 客户端。

https://x.com/OpenAI/status/1805679342439284831

——————

尽管发布延期,但 ChatGPT iOS 应用已进行了相关更新。据 Alexey Shabanov 报道,最新版本的 iOS 应用中出现了一些隐藏的 UI 组件,这些组件可能会向未来的 alpha 测试者展示。测试界面内容如下:

- 该功能将以「限量 alpha」形式推出,意味着只有少数用户能获得访问权限。

- 用户可能需要启用音频和视频内容的训练选项才能参与 alpha 测试。

- 新功能将支持实时自然对话,能感知和回应情绪、幽默和讽刺等。

- 用户可以通过点击摄像头图标来分享周围环境,但 alpha 版本可能不支持屏幕共享。

- 用户可以在高级模式和标准模式之间切换。

- ChatGPT 应用新增了一项设置,允许用户关闭后台对话功能。

23:51 · 2024年6月25日 · 周二

一个小站的自留地

Anthropic 发布新 AI 模型 Claude 3.5 Sonnet 2024 年 6 月 21 日，Anthropic 宣布推出其最新的 AI 模型 Claude 3.5 Sonnet，这是即将到来的 Claude 3.5 模型家族中的首个成员。相比其前身 Claude 3 Opus，Claude 3.5 Sonnet 在 Anthropic 的内部评估中得分更高，不仅速度增加了两倍，而且成本仅为 Opus 的五分之一。此外，Claude 3.5 Sonnet 在多项基准测试中表现优于其竞争对手，包括…

Anthropic 推出 Claude Projects 功能

Anthropic 刚刚宣布为其 AI 助手 Claude 推出 Projects（项目）功能，旨在提升用户的协作体验和工作效率。该功能现已面向所有 Claude Pro 和 Team 订阅用户开放。

Projects 功能的主要特点如下：

1. 协作空间：为团队成员提供一个共享精选对话和知识的平台。

2. 大容量上下文：每个项目拥有 200K 词元（Token）的上下文窗口。用户可以在其中存储文档、代码和其他数据，以改善 Claude 的输出质量。

3. 知识库功能：用户可以上传相关文档，为 Claude 提供完成任务所需的背景知识。

4. 自定义指令：每个项目可以设置独立的自定义指令（Custom Instructions），以进一步调整 Claude 的响应方式。

5. 团队协作（仅限 Team 计划）：Team 计划的用户可以在组织内共享项目，实现协作和知识共享。多个成员可以在同一项目环境中贡献文档、参与对话和共同工作。

（Anthropic）

19:42 · 2024年6月25日 · 周二

OpenAI 宣布即将终止对中国等地区提供 API 服务

OpenAI 于近日宣布,自 2024 年 7 月 9 日起将停止对包括中国在内的不支持地区提供 API 服务。

据悉,OpenAI 向开发者发送的邮件中表示,将采取额外措施阻止来自非支持国家和地区的 API 流量。目前 OpenAI 的 API 向约 161 个国家和地区开放,但中国未包含在内。这意味着依赖 OpenAI API 的中国开发者和企业将无法继续使用该服务。

对此,国内多家 AI 公司迅速做出反应。

- 智谱 AI 推出「搬家计划」,为 OpenAI API 用户提供 1.5 亿词元 (Token) 免费额度、迁移培训等服务。

- 百度智能云千帆发布「大模型普惠计划」,为新注册企业用户提供 0 元调用、培训和迁移服务。同时文心旗舰模型首次免费,赠送 ERNIE 3.5 旗舰模型 5000 万词元包。

- 阿里云百炼宣布为 OpenAI 用户提供 2200 万免费词元和专属迁移服务。

- 零一万物推出「Yi API 二折平替计划」,提供充值赠送等优惠。

- 硅基流动宣布 SiliconCloud 平台上的 Qwen2 (7B)、GLM4 (9B)、Yi1.5 (9B) 等顶尖开源大模型将支持免费使用。

OpenAI 此前于 2 月 14 日曾发表「阻止国家相关威胁行为者对人工智能的恶意使用」一文,其中提及限制包括中国在内的一些用户使用。此次措施被视为进一步加强了这一限制。

事实上，OpenAI 的 API 服务在中国大陆的调用一直不甚顺利，不时有开发者在中国大陆甚至中国香港调用 API 而被 OpenAI 停止服务的消息传出。而微软 Azure 提供的 OpenAI 服务一直不受该禁令影响，进而成为在中国大陆使用正规 OpenAI 服务的最佳选择。对于非正规渠道，中国商家们早已将「逆向、反代、官转」渠道做成了一门「大生意」。

（36氪, 机器之心, 蓝鲸新闻, 证券时报, 财联社）

10:57 · 2024年6月25日 · 周二

阿里云盘即将推出三方应用权益包，SVIP 将无法直接播放转码视频

阿里云盘近日宣布调整会员权益，并计划在 7 月中旬推出新的三方应用权益包。

SVIP 会员将保留 API 高速下载权限（实测速度可达 1 Gbps 以上），但取消官方转码的 H264 视频串流（最高 2K 清晰度）。作为补偿，TV 版新增了原文件视频流功能。

例如，Alist 的浏览器页面在线播放调用官方转码视频接口（受影响），第三方播放器播放和下载均调用下载接口（不受影响）。Infuse 等第三方播放器，均调用下载接口。也有如 Fileball 等播放器同时提供基于下载接口和转码视频接口的画质切换功能。

至于此前传言的限制 SVIP 会员 API 并发请求数，公告中暂时没有说明。

新推出的三方应用权益包将包含以下功能：与 SVIP 相同的 API 高速下载、支持 API 和官方 App 的 H264 转码视频流（最高 2K）、官方原生 WebDAV 功能、官方原生挂载功能，以及与 SVIP 相同的 1 TB 单文件上传、2 万文件转存和 60 天回收站保留期限。

随 6.0 版本上线，阿里云盘将停止魔法棒、智能速览等部分功能服务，表示未来将继续探索个人云服务与 AI 能力的结合。具体功能与权益细节以实际线上效果为准。

（阿里云盘）

23:37 · 2024年6月24日 · 周一

一个小站的自留地

WWDC 24 前瞻：全面拥抱 AI 距离 WWDC 24 开幕还有三天时间，各种关于苹果即将发布的 AI 特性爆料已经铺天盖地。以下是本频根据多方信源整理出的 WWDC 24 全方位爆料信息。 - Project Greymatter / Apple Intelligence 多个信源指出，苹果将推出一个名为「Project Greymatter」的 AI 工具集（彭博社声称「该系统将被称为 Apple Intelligence」），集成到 Safari、照片、备忘录、邮件等核心应用中。这个 AI…

Apple Watch X: 苹果十周年纪念款智能手表或将大改设计

据多方消息,苹果正在筹备推出Apple Watch X(或称Series 10),作为Apple Watch发布10周年的纪念款产品。作为该系列产品迄今最大的一次更新，这款新手表可能会在2024年或2025年发布,并带来重大设计变革。

主要改进预计包括:

1. 更薄的机身设计,屏幕尺寸增大至45mm和49mm。

2. 全新的表带连接机制,可能采用磁吸式设计,为内部腾出更多空间。

3. 更高效的微型LED显示屏,提升亮度和能效。

4. 新增血压监测和睡眠呼吸暂停检测等健康功能。

5. 采用树脂包裹铜线的更薄逻辑板,提升耐用性和防水性。

此外,Apple Watch Ultra 3可能推出黑色或深色款式。

业内预计,Apple Watch X预计将于今年9月随iPhone 16系列一同发布,不过也有分析师指出，由于首代Apple Watch于2015年4月上市,苹果也可能选择在2025年推出这款十周年纪念产品。

（综合MacRumors、CNET等）

21:59 · 2024年6月23日 · 周日

一个小站的自留地

新引入的 Artifacts 工具扩展了用户与 Claude 的互动方式。用户在 Claude.ai 上生成的内容，如代码片段、文本文档或网站设计，会出现在对话窗口旁边的专用窗口中，创建一个动态工作空间，用户可以实时查看、编辑并构建 Claude 的创作内容。

6 月 22 日，DeepSeek 官网的代码助手上线了代码在线执行功能。用户只需访问 coder.deepseek.com，选择「代码助手 V2」，输入提示词后点击「运行 HTML」，即可在浏览器中直接运行生成的代码。

该功能目前支持 HTML、CSS 和 JavaScript，可实现网页设计、经典小游戏、计算器、音乐播放器、数据可视化等多种应用。DeepSeek 表示，目前仅支持 HTML 解释器，未来可能会加入 Python 等其他语言支持。

（DeepSeek）

19:02 · 2024年6月22日 · 周六

钉钉总裁叶军：百度「几乎都是广告」，智能化技术正在彻底改变搜索交互方式

在 2024 年 6 月 21 日至 22 日于深圳举办的「亚布力中国企业家论坛第十届创新年会」上，钉钉总裁叶军发表了演讲，针对当前搜索引擎市场提出了尖锐的批评，特别点名了百度搜索结果广告过多的问题。

叶军表示，OpenAI 推出 ChatGPT 后，百度可能就失去了存在意义。他指出百度搜索结果前 10 条几乎都是广告，用户难以获得有用信息。相比之下，ChatGPT 能直接给出准确答案，没有广告干扰。

叶军认为，如果百度不跟进这一变革，用户可能会转向小红书等替代平台。他表示，小红书的知识密度很高，搜索结果往往更有用。叶军还还提到，视频号等平台在某些场景下比百度更实用。他强调，智能化技术正在彻底改变搜索交互方式，百度需要尽快应对这一趋势。

此外，叶军还分享了钉钉在海外市场的拓展经验。他坦言，早期钉钉的产品力不足是最大的问题，因为产品是根据中国市场需求开发的。如今，钉钉已经在新加坡和马来西亚设立了实体公司，不断加强在海外市场的布局。

（蓝点网）

18:20 · 2024年6月21日 · 周五

华为正式发布 HarmonyOS NEXT「纯血鸿蒙」

在 6 月 21 日的华为开发者大会（HDC 2024）上,华为正式发布了 HarmonyOS NEXT 操作系统,这是一个独立于 Android 的全新系统:

- HarmonyOS NEXT 采用全新的鸿蒙内核,摒弃了 Linux 内核,性能较上一代提升 10.7%。

- 系统集成了华为盘古大模型,推出「鸿蒙原生智能」(Harmony Intelligence),为系统带来强大的 AI 能力。

- 小艺智能助手全面升级,可实现跨应用操作、多模态交互等功能。

- 新系统重构了安全架构,采用首创的安全访问机制,从「管权限」细化到「管数据」。

- 华为自研编程语言「仓颉」正式亮相,性能优于 Java、Go、Swift 等主流语言。

- 目前已有 5000+ 鸿蒙原生应用启动开发,1500+ 应用完成上架。

HarmonyOS NEXT 将于今日启动开发者 Beta 测试,8 月启动公测,预计第四季度正式在手机和平板上推出。

（APPSO）

22:21 · 2024年6月20日 · 周四

Anthropic 发布新 AI 模型 Claude 3.5 Sonnet

2024 年 6 月 21 日，Anthropic 宣布推出其最新的 AI 模型 Claude 3.5 Sonnet，这是即将到来的 Claude 3.5 模型家族中的首个成员。

相比其前身 Claude 3 Opus，Claude 3.5 Sonnet 在 Anthropic 的内部评估中得分更高，不仅速度增加了两倍，而且成本仅为 Opus 的五分之一。此外，Claude 3.5 Sonnet 在多项基准测试中表现优于其竞争对手，包括 OpenAI 的 GPT-4o 和 Google's Gemini 1.5 Pro。并且仍然拥有200K 词元的上下文窗口。

定价方面，Claude 3.5 Sonnet的定价是每百万输入token 3美元，输出token 15美元。相比之下，GPT-4o的定价是每百万输入token 5美元，输出token 15美元。

据Anthropic 介绍，Claude 3.5 Sonnet 在研究生水平推理 (GPQA)、本科知识 (MMLU) 和编程能力 (HumanEval) 方面设立了新的行业基准。它在理解细微差别、幽默和复杂指令方面表现出显著提升，并能以自然且具有亲和力的语气撰写高质量内容。Claude 3.5 Sonnet 解决了 64% 的编码问题，远超 Claude 3 Opus 的 38%，能够独立编写、编辑和执行代码，展示出强大的推理和故障排除能力。

此外，Claude 3.5 Sonnet 在视觉任务中也表现优异，特别是在需要视觉推理的任务中，如解释图表和图形。它还能从不完美的图像中准确转录文本。

新引入的 Artifacts 工具扩展了用户与 Claude 的互动方式。用户在 Claude.ai 上生成的内容，如代码片段、文本文档或网站设计，会出现在对话窗口旁边的专用窗口中，创建一个动态工作空间，用户可以实时查看、编辑并构建 Claude 的创作内容。

Anthropic 表示，计划在今年晚些时候发布 Claude 3.5 Haiku 和 Claude 3.5 Opus。Anthropic 还在开发新功能以支持更多业务用例，包括与企业应用程序的集成，以及能够记住用户偏好和交互历史的功能，以提升个性化和效率。

（Anthropic、Reuters、Fortune）

22:14 · 2024年6月20日 · 周四

月之暗面与 Google 相继推出 Context Caching 功能

在同一周内，月之暗面和 Google 各自宣布了其平台的上下文缓存功能，旨在通过缓存重复出现的输入词元 (Token) 来提高效率并降低成本。

月之暗面 Kimi 开放平台宣布，将启动 Context Caching 功能内测。这项功能能够缓存重复的 Token 内容，从而降低用户在请求相同内容时的成本。

月之暗面称，Context Caching 适用于频繁请求和引用大量初始上下文的场景，例如提供大量预设内容的 QA Bot、固定文档集合查询、静态代码库分析等。官方表示，这项功能可以显著提升 API 的接口响应速度和首字返回速度，并将在未来发布详细的技术文档和计费方案。

Google 方面，Gemini API 也推出了相似的 Context Caching 功能。该功能允许开发者将频繁使用的输入 Token 存储在缓存中，并在后续请求中引用这些缓存的 Token，从而减少重复传递相同 Token 的需求。Context Caching 支持 Gemini 1.5 Pro 和 Gemini 1.5 Flash 模型，并特别适用于大规模文档查询、代码库分析、冗长视频文件的重复分析等场景。Google 表示，这项功能不仅能降低成本，还能提高延迟和性能。

（IT之家、Google 开发者文档）

08:51 · 2024年6月18日 · 周二

Runway发布全新Gen-3 Alpha模型

2024年6月17日，Runway正式发布了其最新的视频生成模型Gen-3 Alpha。该模型在保真度、一致性和运动性等方面显著提升，实现了高保真、可控的视频生成。

Gen-3 Alpha支持文字转视频、图像转视频等多种创作方式，并提供精准时间控制和逼真人物角色生成。

Runway还引入了运动画笔 (Motion Brush)、相机控制 (Advanced Camera Controls) 和导演模式 (Director Mode) 等高级工具，旨在帮助创作者实现更高的控制力。同时，Runway与多个娱乐和媒体组织合作，定制Gen-3模型版本，以满足不同行业需求。

此外，Luma也发布了新功能预告，包括更好的编辑和控制功能，以及Extend功能，可将视频时间扩充到10秒以上。

（赛博禅心、数字生命卡兹克）

Before

After

Home

个人博客

讨论组