[科普中国]-拟牛顿法- · 科普中国网

基本概念

拟牛顿法和最速下降法(Steepest Descent Methods)一样只要求每一步迭代时知道目标函数的梯度。通过测量梯度的变化，构造一个目标函数的模型使之足以产生超线性收敛性。这类方法大大优于最速下降法，尤其对于困难的问题。另外，因为拟牛顿法不需要二阶导数的信息，所以有时比牛顿法(Newton's Method)更为有效。如今，优化软件中包含了大量的拟牛顿算法用来解决无约束，约束，和大规模的优化问题。

拟牛顿法是解非线性方程组及最优化计算中最有效的方法之一.它是一类使每步迭代计算量少而又保持超线性收敛的牛顿型迭代法。

拟牛顿法还有很多具体算法，这类算法最早是由戴维登(Davidon，W.D.)于1959年提出的，弗莱彻(Fletcher，R.)和鲍威尔(Powell，M.J.D.)于1963年给出了后来称为DFP的秩2拟牛顿法，布罗依丹(Broyden，C.G.)于1965年给出了秩1拟牛顿法.方法的收敛性是20世纪60年代末到20世纪70年代才逐渐被证明的.由于这类方法受到广泛注意，从20世纪60年代到20世纪70年代近20年中，前后发表了一千多篇文章，提出了很多不同的算法及收敛性证明。中国也有一些学者在这方面做出很好的结果。1

基本思想拟牛顿法的基本思想如下。首先构造目标函数在当前迭代的二次模型：

这里是一个对称正定矩阵，于是我们取这个二次模型的最优解作为搜索方向，并且得到新的迭代点，其中我们要求步长满足Wolfe条件。这样的迭代与牛顿法类似，区别就在于用近似的Hesse矩阵代替真实的Hesse矩阵。所以拟牛顿法最关键的地方就是每一步迭代中矩阵的更新。现在假设得到一个新的迭代，并得到一个新的二次模型：