直观理解Vision Transformer(ViT)及Diffusion Models使用扩散模型进行图像合成,
发布人