Black Forest Labs 公司(原Stable Diffusion团队成员创立)近日发布了革命性的 FLUX 系列图像生成模型。FLUX 采用创新的混合架构,结合 Transformer 和扩散技术,拥有 120 亿参数,在图像质量、提示词响应和输出多样性方面均达到了新高度。
模型版本:
- FLUX.1 [pro]:顶级商业版本,提供最高质量的图像生成能力。
- FLUX.1 [dev]:开放权重的非商业版本,适合研究和开发使用。
- FLUX.1 [schnell]:速度优化版本,适合本地开发和个人使用,采用 Apache 2.0 许可。
模型特点:
- 采用流匹配(flow matching)技术,相比传统扩散模型效果更佳。
- 引入旋转位置嵌入和并行注意力层,进一步提升性能。
- 图像细节和质量极佳,尤其在人体解剖学方面表现出色,特别是手部细节。
- 提示词遵循度高,能准确理解和执行复杂指令。
- 输出结果多样化,适应不同风格和场景。
- 复杂场景构图能力强,能创造出富有想象力的画面。
(Black Forest Labs)
在线体验:https://replicate.com/black-forest-labs/flux-pro