版权归原作者所有,如有侵权,请联系我们

[科普中国]-梯度下降法

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

梯度下降法(英语:Gradient descent)是一个一阶最优化算法,通常也称为最速下降法。 要使用梯度下降法找到一个函数的局部极小值,必须向函数上当前点对应梯度(或者是近似梯度)的反方向的规定步长距离点进行迭代搜索。如果相反地向梯度正方向迭代进行搜索,则会接近函数的局部极大值点;这个过程则被称为梯度上升法

简介梯度下降法(英语:Gradient descent)是一个一阶最优化算法,通常也称为最速下降法。 要使用梯度下降法找到一个函数的局部极小值,必须向函数上当前点对应梯度(或者是近似梯度)的反方向的规定步长距离点进行迭代搜索。如果相反地向梯度正方向迭代进行搜索,则会接近函数的局部极大值点;这个过程则被称为梯度上升法。1

描述梯度下降方法基于以下的观察:如果实值函数在点处可微且有定义,那么函数点沿着梯度相反的方向下降最快。

因而,如果

对于为一个够小数值时成立,那么

考虑到这一点,我们可以从函数F的局部极小值的初始估计出发,并考虑如下序列使得

因此可得到


如果顺利的话序列收敛到期望的极值。注意每次迭代步长可以改变。

右侧的图片示例了这一过程,这里假设F定义在平面上,并且函数图像是一个碗形。蓝色的曲线是等高线(水平集),即函数F为常数的集合构成的曲线。红色的箭头指向该点梯度的反方向。(一点处的梯度方向与通过该点的等高线垂直)。沿着梯度下降方向,将最终到达碗底,即函数F值最小的点。1

参阅共轭梯度法

随机梯度下降法

最优化

反向传播算法

本词条内容贡献者为:

李宗秀 - 副教授 - 黑龙江财经学院

评论
科普5d5135acc689c
太师级
梯度下降法是一个一阶最优化算法,通常也称为最速下降法。
2023-04-29