2606.18521
2026-06-18
cs.LG
cs.AI
新提交
专题 60
Sparsity Curse: Understanding RLVR Model Parameter Space from Model Merging
稀疏性诅咒:从模型合并理解RLVR模型参数空间
Chenrui Wu, Zexi Li, Jiajun Bu, Jiangchuan Liu, Haishuai Wang
专题命中
其他推理
:RLVR增强推理能力
AI总结
本文发现RLVR模型的稀疏更新在参数空间中分散更远,形成近正交捷径导致合并脆弱,并提出SAR-Merging方法解决该问题。