一个小站的自留地
OpenAI 在昨晚线上直播了 Spring Update(春季更新),时间不仅故意选在对家谷歌年度 I/O 大会的前一天,而且早在发布会前就通过放料+辟谣的连环操作吊足了各路媒体和网友的胃口。 本次发布会可以说非常具有工科人的那种直率气质,在一开始就把整场发布会的要点放在了身后的 Slides 上,也就是号称「人人都能用上」的「GPT-4o」模型。 GPT-4o是OpenAI继GPT-4后推出的全新基础模型,其中o代表omni,即"全能"的意思,体现了模型在多模态等方面的全面升级。 GPT-4o最大的亮点是支持多模态输入输出…
OpenAI 推迟 ChatGPT 高级语音模式发布

OpenAI 官方在 Discord 群组通知了 ChatGPT 高级语音模式的最新进展。他们表示,「需要再多一个月的时间来达到发布标准」

该公司在今年春季更新中曾演示这一功能,原计划于 6 月底向部分 ChatGPT Plus 用户推出 alpha 版本。

OpenAI表示,延迟的主要原因包括提升模型检测和拒绝某些内容的能力、改进用户体验,以及为大规模用户使用做好基础设施准备,以保证实时响应。

OpenAI 计划采用灰度发布,即先向一小部分用户开放以收集反馈,然后根据反馈逐步扩大范围。该公司预计所有 Plus 用户将于今年秋季获得该功能,但具体时间表取决于是否达到其严格的安全和可靠性标准。

ChatGPT 的高级语音模式在上个月春季更新发布会上首次公开亮相,旨在理解和回应情绪及非语言线索,使 AI 与人类的实时自然对话更进一步。OpenAI 表示,他们的目标是谨慎而周到(thoughtfully)地为用户带来这些新体验。

(OpenAI)

——————

稍早之前,OpenAI 正式发布了此前发布会上提到的 macOS ChatGPT 客户端。

https://x.com/OpenAI/status/1805679342439284831

——————

尽管发布延期,但 ChatGPT iOS 应用已进行了相关更新。据 Alexey Shabanov 报道,最新版本的 iOS 应用中出现了一些隐藏的 UI 组件,这些组件可能会向未来的 alpha 测试者展示。测试界面内容如下:

- 该功能将以「限量 alpha」形式推出,意味着只有少数用户能获得访问权限。

- 用户可能需要启用音频和视频内容的训练选项才能参与 alpha 测试。

- 新功能将支持实时自然对话,能感知和回应情绪、幽默和讽刺等。

- 用户可以通过点击摄像头图标来分享周围环境,但 alpha 版本可能不支持屏幕共享。

- 用户可以在高级模式和标准模式之间切换。

- ChatGPT 应用新增了一项设置,允许用户关闭后台对话功能。
 
 
Back to Top