Nesterov
1. 简介
Nesterov 加速梯度算法是一种对 Momentum 动量法的改进。
2. 原理
第 次迭代时:
其中, 为需要更新的参数, 为损失函数, 为 关于 的梯度, 为学习率, 为动量因子,通常设为 。
本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!
Nesterov 加速梯度算法是一种对 Momentum 动量法的改进。
第 次迭代时:
其中, 为需要更新的参数, 为损失函数, 为 关于 的梯度, 为学习率, 为动量因子,通常设为 。
本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!
目录