腾讯在北京举办的混元发布会上宣布开源两款人工智能模型:混元 Large (Hunyuan-Large) 和混元 3D 1.0 (Hunyuan3D-1.0)。
混元 Large 是目前业界最大规模的开源混合专家 (MoE) 大语言模型,总参数量达到 389B,实际激活参数量为 52B。该模型具备 256K 的上下文长度,通过优化的 KV 缓存压缩技术可节省 50% 的 GPU 内存使用。在 MMLU、MMLU-Pro 和 CMMLU 等多个基准测试中,混元 Large 表现优于同规模的 Llama 405B 和 Mixtral-8x22B 等模型。
混元 3D 1.0 是首个同时支持文字和图像生成的开源 3D 生成模型。该模型采用级联架构,通过多视图扩散模型和前馈重建模型两个阶段,可在约 11 秒内完成 3D 模型生成。目前该模型已在腾讯地图、元宝 APP 等多个产品中落地,支持 UGC 3D 创作、商品素材合成等应用场景。
腾讯还将推出一个专门用于评估大模型长文本处理能力的测试数据集「企鹅卷轴」。
两款模型已在 GitHub 和 Hugging Face 平台开源。其中混元 Large 将同步支持在腾讯云 TI 平台上的业务精调及部署,而混元 3D 1.0 的体验入口则开放在元宝 APP 的「3D 角色梦工厂」功能中。
混元 Large:https://github.com/Tencent/Hunyuan-Large
混元 3D:https://github.com/Tencent/Hunyuan3D-1
(综合媒体报道)