Momentum
1. 简介
Momentum 类似于物理中的冲量的思想,Momentum 算法优化的过程给人的感觉就像是小球在地面上滚动。
2. 原理
第 次迭代时:
其中, 为需要更新的参数, 为损失函数, 为 关于 的梯度, 为学习率, 类似于物理上的速度, 为动量因子,承担使 逐渐减小的任务,对应于物理上的阻力,通常设为 。
本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!
Momentum 类似于物理中的冲量的思想,Momentum 算法优化的过程给人的感觉就像是小球在地面上滚动。
第 次迭代时:
其中, 为需要更新的参数, 为损失函数, 为 关于 的梯度, 为学习率, 类似于物理上的速度, 为动量因子,承担使 逐渐减小的任务,对应于物理上的阻力,通常设为 。
本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!
目录