Pion: A Spectrum-Preserving Optimizer via Orthogonal Equivalence Transformation
AI总结 本文提出了一种基于正交等价变换的谱值保持优化器Pion,用于大语言模型的训练。与Adam等加法优化器不同,Pion通过左右正交变换更新权重矩阵,从而在训练过程中保持其奇异值不变。该方法在调整权重矩阵几何结构的同时固定其谱范数,实验表明Pion在大模型预训练和微调任务中表现出稳定且具有竞争力的性能。
Comments Technical report v1 (30 pages, 19 figures, project page: https://spherelab.ai/pion/)