A Closer Look on Memorization in Tabular Diffusion Model: A Data-Centric Perspective
表格扩散模型中记忆化的深入探究:以数据为中心的观点
发表机构 * Department of Computer and Data Sciences(计算机与数据科学系) ; Case Western Reserve University(凯斯西储大学) ; Department of Computer Science & Engineering(计算机科学与工程系) ; Texas A&M University(德克萨斯大学) ; Department of Biochemistry(生物化学系) ; Center for RNA Science and Therapeutics(RNA科学与治疗中心) ; Department of Biomedical Engineering(生物医学工程系)
AI总结 本文首次从数据角度研究表格扩散模型中的记忆化动态,通过量化每个真实样本的记忆化程度,发现少数样本贡献了大部分泄露,并提出两阶段缓解方法DynamicCut。
Comments Published in Transactions on Machine Learning Research (TMLR), 2026