Flatland: The Adventures of Gradient Descent with Large Step Sizes
平面国:大步长梯度下降的冒险
发表机构 * University of British Columbia(不列颠哥伦比亚大学) ; Munich Center for Machine Learning(慕尼黑机器学习中心) ; Canada CIFAR AI Chair (Amii)(加拿大CIFAR人工智能主席(Amii))
AI总结 针对非全局L-光滑的神经网络目标函数,提出一种只需梯度局部Lipschitz连续的定义,设计自适应一阶方法实现大步长并始终处于稳定性边缘,发现过早进入全局平坦区域会降低收敛速度和泛化能力。
Comments Accepted for the International Conference on Machine Learning (ICML 2026)