What Matters for Diffusion-Friendly Latent Manifold? Prior-Aligned Autoencoders for Latent Diffusion
AI总结 本文研究了对扩散模型友好的潜在流形应具备的特性,发现其关键在于潜在空间的结构一致性、局部连续性和全局语义性,而非单纯的重建保真度。基于这一发现,作者提出了先验对齐自编码器(PAE),通过引入改进的先验知识和扰动正则化,显式地引导潜在流形的组织结构。实验表明,PAE在ImageNet 256x256数据集上显著提升了训练效率和生成质量,达到与现有方法相比更优的性能。