[科普中国]-引导影像滤波器-

在图像处理上，引导视频滤波器（英语：Guided Image Filter）是一种能使视频平滑化的非线性滤波器。

介绍在图像处理上，引导视频滤波器（英语：Guided Image Filter）是一种能使视频平滑化的非线性滤波器。与双边滤波器（Bilateral Filter）相同，这个视频滤波器同样能够在清楚保持视频边界的情况下，达到让视频平滑的效果。1

但不同于双边滤波器，引导视频滤波器有两个优点：首先，双边滤波器有非常大的计算复杂度，但引导视频滤波器因为并未用到过于复杂的数学计算，有线性的计算复杂度。再来，双边滤波器因为数学模型的缘故，在某些时候会发生梯度反转（gradient reverse）的状况，出现视频有损；而在引导视频滤波器，因为这个滤波器在数学上以线性组合为基础出发，输出图片（Output Image）必与引导图片（Guidance Image）的梯度方向一致，并不会出现梯度反转的问题。

原理为了达到将视频平滑化、即去除噪声的效果，首先定义输出的结果图片是输入图片减去噪声后的结果；同时，为了让输出的图片匹配引导图片的视频边界，将输出图片定为引导图片的线性组合。

以下为引导视频滤波器的基础模型：

(1)

(2)

在上述公式中，是第i个输出的像素，是第i个输入的像素，是第i个输入像素的噪声成分，是第i个引导图片的像素，则是用来衡量输入权重的参数。

定义为线性组合（Linear Combination）的原因在于，一对象的边界与其梯度（Gradient）相关，而在线性组合的定义下，输出图片之梯度必与引导图片之梯度成对比（微分时高幂次系数保留而常量项则被去除），故可以达到保留梯度的效果、保留视频边界的目的。

为了导出上述线性组合的参数，将(1)及(2)相减得到公式(3)；同时，定义一个代价方程式(cost function)(4)：

(3)

(4)

在上式中，是一用来惩罚（penalize）过大的的参数，是以第k个像素为中心点的窗格（window）。

在这个方程式中可以看到，希望同时让最终的输出图片做到让噪声减少以及让引导图片在输出图片的影响减小（引导图片的系数项）两件事，遂定义每个像素噪声和系数项的平方总合为最后须付出的价值项（cost）。并且，基于让价值项最小化的原则，可以将(4)以线性回归（linear regression）的方法找出它的线性模型，从而求得、使得出它的价值方程式有最小解的到以下两参数和：

(5)

(6)

在这里，分别是引导图片 I 在窗格的平均数（mean）和标准差（variance），而是在窗格中像素的平均值；这两项系数，换句话说，即是一以输入图片为考虑计算权重之平均滤波器（weighted mean）。

算法依据上式，可以列出此滤波器之算法：2

Algorithm 1. 引导图片滤波器

**输入：**输入图片 p，引导图片 I ，窗格半径r，修正项

**输出：**输出图片q

第一部分

第二部分

第三部分

第四部分

第五部分

是一个有线性计算复杂度的平均滤波器（mean filter）。

特性引导图片滤波器保留边界的特性，其实也可以被理解为是保留梯度的特性。由下图可以看到，可以将一张图分为细节图层和基底图层两层，基底图层的能量并无小幅度的升降，只有大幅度诸入梯度的能量升降；而细节图层，只有噪声式的小幅度能量升降。而引导图片滤波器所作的，其实就是将细节层和基底层分离并保留基底层，也就是保留梯度而去除噪声，达到平滑效果。

延伸功能由引导图片滤波器的特性，可以延伸出除了原先的平滑化外的几项功能

细节加强当一视频图同时为输出图片和引导图片时，可知最终得到的会是以该图片的边界为依据的基底层和细节层；因此，若要加强依视频之细节，可以将细节层的能量放大n倍后再次叠加回基底层，以达到增强细节的效果。

深度图修整无论是利用光场（light field）技术或是焦点合成（focal-stack）所制作的深度图（depth map），在出制作完成时往往都会有一些坑洞（holo）；而这时若使用引导视频滤波器，以原始视频为引导图片、以深度图为输入图片，便可得到一完整、无坑洞的深度图。

本词条内容贡献者为:

王沛 - 副教授、副研究员 - 中国科学院工程热物理研究所