一个小站的自留地
阿里云发布通义千问 2.0 阿里云刚刚在 2023 年云栖大会上正式发布了通义千问 2.0 ,官方表示,「目前通义千问的综合性能已经超过 GPT-3.5,正加速追赶GPT-4」。 该模型目前已在阿里云上可用,无需等候。另外,通义千问 APP 现已经开放体验,新增语音对话功能。 阿里云 CTO 周靖人宣布将在 11 月开源通义千问 720 亿参数模型。周靖人表示,通义千问 72B 将成为参数规模最大的中国开源大模型,继续支持全球开发者开展模型和应用创新。此外,未来阿里云将持续发布更大规模的开源模型。 …
商汤科技23日发布日日新5.0大模型,大部分核心测试集指标已对标或超过GPT-4 Turbo。

据商汤科技,日日新5.0大模型采用了混合专家架构(MoE),训练数据超过10TB tokens,具备200K的推理上下文窗口。

此外,商汤发布会现场还演示了文生图、扩图、多模态、工具调用等能力,也演示了端云结合的较小模型。

4月24日,商汤科技港股股价大涨后,公司公告临时停牌,停牌前涨幅高达31.15%。

官网链接:
chat.sensetime.com

(财联社)
——————
可信度:A
 
 
Back to Top