谷歌 I/O 2024发布会：用AI突袭OpenAI1. Gemini 1.5 Pro模型上下文长度提升至200万token,为目前最长,可处理2小时视频、22小时音频或超60,000行代码

一个小站的自留地

OpenAI春季更新：大戏到来前的半代升级 1. 发布ChatGPT新UI,界面更加圆润和易用。 2. 推出GPT-4o模型,在文本、语音、视频三个方面有重大升级,足以颠覆多个行业: - 文本方面达到GPT-4级别,向所有人开放。 - 语音功能可以随时打断对话、声音实时自然,能生成切合场景的音调。 - 视频功能可以进行视频对话,比如在线解题,反应自然。 3. 推出桌面版ChatGPT应用,通过快捷键即可快速使用。可以直接讨论应用内的屏幕截图。 4. 开放GPT-4o的API,相比GPT-4 turbo…

谷歌 I/O 2024发布会：用AI突袭OpenAI

1. Gemini 1.5 Pro模型上下文长度提升至200万token,为目前最长,可处理2小时视频、22小时音频或超60,000行代码。

2. 推出轻量级Gemini 1.5 Flash模型,更便宜更快,同样支持100万token长上下文和多模态输入。价格仅为GPT-4的二十分之一。

3. 谷歌搜索引入AI Overviews功能,在搜索结果顶端提供AI生成的全面答案总结。已向美国用户开放。

4. 发布全新AI智能助理Astra,效果不输GPT-4o,可通过摄像头识别物体、代码等,并进行语音交互。展示了配合AR眼镜使用的强大效果。

5. 推出文生视频模型Veo,可生成1080p、超60秒长度的高质量视频,打破GPT-4的Sora的多项纪录。

6. 升级Imagen图像生成模型至第三代,细节更丰富,理解能力更强。Music AI Sandbox可协助音乐创作。

7. 第六代TPU芯片Trillium发布,算力比上一代提升4.7倍。Gemini将广泛应用于谷歌生态各个产品和服务中。