一个小站的自留地 ChatGPT 正式支持多模态 ChatGPT 官方发布公告,新增语音双向对话、图片对话等多模态方式。 其中,图片对话功能(Vision),是 OpenAI 通过与 Be My Eyes 的合作实现的。这场合作在 GPT-4 发布会时就已经官宣。 ChatGPT 的视觉对话功能,甚至可以输入多张图片,或通过标注告诉 AI 图片的重点。 语音对话功能,包含语音转文字和文字转语音两部分。 前者已经在移动端 App 中可用,是利用 OpenAI 的 Whisper 模型。而后者似乎也是利用 OpenAI…