语音对话的界面为全屏黑白+对话气泡,底部文字显示录音状态,支持无需干预的多轮对话,但是语音识别结果和AI的回复并不会以文字显示。
根据网友分享的视频,哪怕是中文对话,ChatGPT也能生成非常自然的语音回复,甚至还会自己加上语气词。看来OpenAI的TTS还是有点东西。至少目前看起来就比第一梯队的微软Azure还要强。
美中不足的是回复需时较久,大约在3~5s左右。
目前语音对话的灰度率大致在50%上下,而被认为是对标Google Bard的视觉功能上线范围则更小。
另外,今天Claude获得新一笔投资,其API也在Amazon的AWS平台上线,目前申请批准较快。
Meta也宣布了自己打造的定位为“名人数字分身”的AI助手。
AIGC领域似乎又在内卷了。