本次发布会可以说非常具有工科人的那种直率气质,在一开始就把整场发布会的要点放在了身后的 Slides 上,也就是号称「人人都能用上」的「GPT-4o」模型。
GPT-4o是OpenAI继GPT-4后推出的全新基础模型,其中o代表omni,即"全能"的意思,体现了模型在多模态等方面的全面升级。
GPT-4o最大的亮点是支持多模态输入输出,能够接受和生成文本、语音、图像的任意组合,使人机交互更加自然流畅。语音响应速度大幅提升,可在232毫秒内给出回应,接近人类水平。
性能方面,GPT-4o在英语文本和编程方面与GPT-4 turbo相当,但在非英语文本、视觉、语音理解等方面有显著提升。同时推理速度更快,API价格降低50%。
在多个基准测试中,GPT-4o刷新了之前模型的最好成绩。如在MMLU(语言理解能力评测)上得分88.7,为综合模型最高分;在MATH数学推理上较此前最好模型(Claude3-Opus)提升27.5%;在HumanEval编程评测中达90.5分,也是最高水平。
在发布会中,OpenAI表示,希望把最强大的AI工具免费提供给所有人使用,未来每个人或将拥有像GPT-7这样的AI算力。