Beyond Uniform Forgetting: A Study of Sequential Direct Preference Optimization Across Preference Settings
超越统一遗忘:不同偏好设置下顺序直接偏好优化的研究
发表机构 * Network Analysis and Social Influence Modelling (NASIM) Lab(网络分析与社会影响建模实验室) ; School of Physics Maths and Computing, The University of Western Australia(西澳大学物理数学与计算学院) ; School of Psychological Science, The University of Western Australia(西澳大学心理科学学院) ; School of Computing, Macquarie University(麦考瑞大学计算机学院)
专题命中 后训练 :研究顺序DPO在不同偏好设置下的影响,涉及对齐方法。
AI总结 研究顺序DPO在不同偏好设置下的影响,发现遗忘模式并非统一,而是取决于目标关系、信号强度和训练顺序,并提出未来对齐流程应考虑目标兼容性。
Comments Submitted to EMNLP 2026