更好也更快！最先进的图像去模糊算法DeblurGAN-v2

2024-04-25 05:13:11

以GAN为代表的生成模型正在视觉造假的路上越来越成熟，狗变猫、白马变斑马、实景变素描是GAN用于高级图像生成的例证。

能否将GAN应用于低级的图像处理呢？比如图像去模糊。

答案是肯定的。将GAN用于图像去模糊，生成器用于生成清晰图像，鉴别器区分真实且清晰图像与造假或模糊图像。

DeblurGAN （CVPR 2018）是这一方向新出算法中的佼佼者。

昨日公布的ICCV 2019 论文 DeblurGAN-v2: Deblurring (Orders-of-Magnitude) Faster and Better，原作者对其再升级，改进了生成器的网络结构与鉴别器，且使得算法可以方便使用现有成熟的骨干网，不仅提升了去模糊后图像的质量，同时可以轻易设计计算代价小的模型。实现了更好也更快！

该文作者信息：

由论文标题知，DeblurGAN-v2在速度上获得了数量级的提升。

下图展示了该文描述的DeblurGAN-v2使用不同骨干网获得的三个模型在GoPro数据集上与其他三个SOTA去模糊算法比较结果。

可见，使用SSIM为度量标准，DeblurGAN-v2的三个模型计算代价都较低，在使用复杂度高的inception网络时，DeblurGAN-v2可取得最好的去模糊效果，而使用轻量级网络，在FLOPs大幅度下降情况下，SSIM结果仍处于SOTA水平。

因为效果好计算代价小，将 DeblurGAN-v2用于视频去模糊也是可行的！

算法改进

下图展示了该文作者对算法的改进：

在生成器部分作者引入了特征金字塔网络，不同于使用图像金字塔，这种特征重用的结构可大幅降低计算时间和模型size。

且这种结构允许方便的使用不同的CNN骨干网，是一种计算量可伸缩的结果。

另外，在鉴别器部分，作者设计了新的损失函数：

另外，不仅保留DeblurGAN中PatchGAN鉴别器，对图像Patch进行鉴别，还引入了全局鉴别器（如架构图的右侧部分），称此为双尺度鉴别器（double-scale discriminator）。作者发现这样的改进，可以使得DeblurGAN-v2更好的处理较大的和异质的真实世界模糊。

实验结果

作者在多个图像去模糊数据集上进行了实验。

在几大数据集上客观评价指标结果：

可见DeblurGAN-v2算法既可以获得最高精度的模型，也可以获得精度接近最好但计算量极低的模型，更加实用。

在Lai数据集上的主观评价结果：

在Kohler数据集的去模糊示例：

结论

本文提出的去模糊框架DeblurGAN-v2可以很方便切换骨干网，能够取得目前最好的效果，而计算量却减少几个数量级，非常值得参考。

值得一提的是，DeblurGAN-v2中生成器的网络结构和双尺度鉴别器也同样适用于其他低级图像处理任务，比如图像超分辨。期待也能对相关领域的研究有所启发。

论文地址：

https://arxiv.org/pdf/1908.03826v1.pdf

赞 (0)

【技术综述】人脸妆造迁移核心技术总结

美颜和美妆是人脸中很常见的技术,在网络直播以及平常的社交生活中都有很多应用场景.常见的如磨皮,美白,塑形等美颜技术我们已经比较熟悉了,而本文重点介绍的是人脸妆造迁移的核心技术及其相关资源. 作者&am ...
模型压缩经典解读：解决训练数据问题，无需数据的神经网络压缩技术

作者丨科技猛兽来源丨极市平台编辑丨极市平台极市导读目前很少有工作关注在无数据情况下的网络压缩,然而,这些方法得到的压缩后的网络准确率下降很多,这是因为这些方法没有利用待压缩网络的信息.为了解决 ...
障眼法修行指南：GAN是怎样一步步学会“骗人”的？

算法,就像是武林绝学中的"内功",是计算机领域最重要的基石.不过,算法多了也很麻烦.不断推陈出新的算法是否更新更快更好,大厂各执一词,评价褒贬不一. 没有"内功" ...
陈根：智能换脸风靡一时，快速下架

文/陈根不论技术用怎样的特效打造了可供娱乐的智能换脸,其背后的风险都值得人们警惕. 过去几天,人工智能生成动图的风潮席卷了大半个互联网.从抖音到微博,人们齐唱"蚂蚁呀嘿"的画面不 ...
【杂谈】那些底层的图像处理问题中，GAN能有什么作为？

【杂谈】那些底层的图像处理问题中，GAN能有什么作为？
给你看个宝贝：GitHub 最野的开源模型库！

前阵子抖音爆火的应用蚂蚁呀嘿都笑过吧?这技术让一向严肃认真的giao哥都多了几分俏皮,这么秀的代码,必须狗一波.于是本狗啊不本人有了一个温暖(欠揍)的想法:想弄一个自家爹妈爷爷奶奶一起摇摆的鬼畜视频. ...
【杂谈】有三AI知识星球最近都GAN了哪些内容？

欢迎大家来到<知识星球>专栏,有三AI知识星球GAN已经更新了好一段时间了,那么最近这一个月主要是在更新什么内容呢,下面简单的介绍一下. 作者&编辑 | 言有三 1 GAN与人脸年 ...
【技术综述】人脸算法新热点，人脸编辑都有哪些方向，如何学习

人脸属性编辑是一个很广的应用领域,不仅可以用于辅助其他诸如人脸识别等相关的任务,也可以独立成若干新的任务,在人机交互,娱乐社交领域有广泛应用,本文我们简单介绍其中核心算法以及如何深入学习. 作者&am ...
GANs是如何创造出高分辨率的图像的

本文主要介绍DCGAN适应渐进式增长创建高分辨率图像的思路深度卷积生成对抗网络是2020年最精致的神经网络体系结构.生成模型可以追溯到60年代,但是Ian Goodfellow在2014年创造的GA ...
字节跳动开源最新 GAN 压缩算法，算力消耗可减少至 1/46

8月27日消息,字节跳动近期开源了一项代号为OMGD的压缩技术.这是字节自研的GAN(生成对抗网络)压缩算法,在保证生成效果不变的前提下,算力消耗最低可以减少到原来的1/46,相比之前业界的最佳压缩效 ...
字节跳动提出面向GAN压缩的在线多粒度蒸馏算法，算力降至1/46

机器之心专栏字节跳动-智能创作团队字节跳动 - 智能创作团队提出了一种用于学习轻量级 GAN 的在线多粒度蒸馏算法 OMGD.该算法能够把 GAN 模型的计算量减少到最低 1/46.参数量减少到最 ...