My App

One Transformer Fits All Distributions in Multi-Modal Diffusion at Scale

提出了一种统一的扩散框架, 可以在一个模型中适应与多模态数据集相关的所有分布. 它能够执行图像生成, 文本生成, 文本到图像生成, 图像到文本生成以及图像-文本对生成, 而无需额外开销, 另外还有一些洞察.

Loading...