商汤科技23日发布日日新5.0大模型,大部分核心测试集指标已对标或超过GPT-4 Turbo。
据商汤科技,日日新5.0大模型采用了混合专家架构(MoE),训练数据超过10TB tokens,具备200K的推理上下文窗口。
此外,商汤发布会现场还演示了文生图、扩图、多模态、工具调用等能力,也演示了端云结合的较小模型。
4月24日,商汤科技港股股价大涨后,公司公告临时停牌,停牌前涨幅高达31.15%。
官网链接:
chat.sensetime.com
(财联社)
——————
  据商汤科技,日日新5.0大模型采用了混合专家架构(MoE),训练数据超过10TB tokens,具备200K的推理上下文窗口。
此外,商汤发布会现场还演示了文生图、扩图、多模态、工具调用等能力,也演示了端云结合的较小模型。
4月24日,商汤科技港股股价大涨后,公司公告临时停牌,停牌前涨幅高达31.15%。
官网链接:
chat.sensetime.com
(财联社)
——————
可信度:A