一个小站的自留地
阿里正式开源1100亿参数Qwen1.5-110B模型 Qwen1.5-110B模型是截止目前为止国内开源模型中参数规模最大的模型。Qwen1.5-110B模型与其它Qwen1.5系列模型架构一致。采用了分组查询注意力机制,因此推理效率很高。该模型最高支持32K上下文,并且支持多语言。 根据官方公布的评测结果,Qwen1.5-110B模型的评测结果略超过Llama-3-70B和Mixtral-8×22B,是除了Llama3-70B-Instruct模型外最强的开源模型。 国内此前开源领域最大的参数模…
5 月9日,阿里云召开峰会,正式发布通义千问2.5,模型性能全面赶超GPT-4-Turbo,成为“地表最强”中文大模型。同时,通义千问1100亿参数开源模型在多个基准测评收获最佳成绩,超越Meta的Llama-3-70B,成为开源领域最强大模型。

(券商中国)

另据 SuperCLUE 的测评结果,通义千问2.5取得总分74.93分,与GPT-4 Turbo仍有一定差距,相差5.21分。其他如编码和数学能力也有差距,但值得一提的是数学能力位居国内大模型第一。
 
 
Back to Top