近日,中国科学院合肥物质院智能所仿生智能技术研究中心黄炫和韦虎课题组与中国科学技术大学、中国矿业大学与清华大学部分课题组合作完成的文章“Efficient Multi-scale Network with Learnable Discrete Wavelet Transform for Blind Motion Deblurring”被计算机视觉和模式识别领域的顶级会议Conference on Computer Vision and Pattern Recognition(CVPR)接收发表。
图像运动模糊的消除技术致力于修复因未知模糊核影响而产生运动模糊的退化图像,旨在恢复其清晰度,重现图像的原始细节和价值。这一技术不仅对于提升图像质量具有重要意义,同时也对语义分割、目标检测和目标追踪等关键的图像处理应用有着显著的促进作用,增强了这些应用的准确性和稳定性。在传统的单图像去模糊方法中,通常采用由粗到细的处理策略。但在深度学习的应用场景下,现行的多尺度算法面临着挑战:它们不仅依赖于复杂的结构来整合低分辨率的RGB图像和深度特征,还需要人工生成那些置信度不高的低分辨率图像对。
在该项工作中,科研团队提出了一种基于单输入多输出(SIMO)的多尺度运动去模糊网络,简化了现有基于由粗到细方案算法的复杂性。同时,为了减轻使用多尺度架构带来的细节信息修复缺陷,团队将真实世界的模糊轨迹特征与可学习的小波变换模块相结合,重点关注从模糊图像到清晰图像之间逐步复原的方向连续性和频率特性。团队创新了一种具有可学习离散小波变换的多尺度网络(MLWNet),它在多个真实世界的模糊数据集上,无论在主观和客观质量方面,还是计算效率方面,都表现出了最先进的性能。
智能所硕士研究生邱天衡为共同第一作者,黄炫副研究员为共同通讯作者,该项工作得到了国家自然科学基金与国家高技术研究发展计划的支持。
CVPR 是计算机视觉方向的三大顶级会议之一。根据谷歌学术公布的2022年最新学术期刊和会议影响力排名,CVPR在所有学术刊物中位居第4,仅次于Nature、NEJM和Science。
MLWNet与其他sota模型在RealBlur-J测试集上的对比结果示意图
MLWNet模型架构图
MLWNet与其他sota模型在RSBlur测试集上的可视化结果对比图