【杂谈】如何系统性地学习生成对抗网络GAN

2024-06-19 11:28:42

1 了解GAN基本原理和应用

有三最早写的一篇GAN相关的文章就是一篇综述，链接如下：

虽然因为后来比较忙，一直没有更新下，但是在这个综述上中，已经介绍了GAN的来龙去脉，优化目标，以及GAN的图像生成，风格迁移，超分辨等各类应用，有超过30篇参考文献，适合对GAN感兴趣的初学者。

有三说GANs

2 GAN的重要理论

GAN的重点和难点一方面是它的理论，包括优化目标，评测指标，另一方面包括各类工程训练技巧。有三同一个实验室的亲师弟郭晓洲在自身扎实的数学系背景知识的支持下，在公众号开设了《GAN优化》专栏，从GAN的基本理论，f散度度量和Wasserstein距离，到GAN与动力学，各种GAN的正则项的优劣，模式崩溃问题，进行了细致的总结，浓浓的数学味道，并持续更新中，希望你会喜欢。

GAN优化目标

3 GAN实战专栏

好记性不如烂笔头，终究还是要靠实战，于是我们在有三AI知识星球的网络结构1000变中添加了GAN专栏，内容会包括论文详细解读，部分包括代码解读和实战，形式如下：

有三AI知识星球-网络结构1000变

SRGAN

SRGAN(super-resolution GAN)是第一个基于GAN的图像超分辩模型，能够取得4倍的高分辨率放大。

作者/编辑言有三

早期的基于CNN模型的超分辨率框架如SRCNN，ESPCN都使用MSE损失作为优化目标，它们能取得较高的PSNR和SSIM指标，但是存在结果过于平滑的问题。全局的MSE指标较小并不能保证局部细节的清晰度，较大的MSE指标也并不意味着结果差，比如图偏移一个像素后与原图的MSE可能很大，但是感知结果非常相近，因此人眼对结果的感知评价并不完全与这些指标相符。

为了获得与人眼感知更加相符的结果，研究者从风格迁移等任务中进行借鉴，使用了感知损失替代MSE损失，它就是基于特征空间的欧式距离。

在文[2]中将SRCNN模型[1]的像素损失改为感知损失后，显著提高了视觉效果，如下图的倒数第二幅图与最后一幅图的比较。

另外，随着生成对抗网络GAN的发展，生成器和判别器的对抗学习机制在图像生成任务中展现出很强大的学习能力。

基于以上两个特点，SRGAN[3]被提出，它使用ResNet作为生成器结构，使用VGG作为判别器结构，具体结果如上图。

生成器结构包含了若干个不改变特征分辨率的残差模块和两个基于亚像素卷积的后上采样模块，因此它实现了4倍的分辨率提升。

判别器结构则包含了若干个通道数不断增加的卷积层，每次特征通道数增加一倍时，特征分辨率降低为原来的一半。

损失函数包括两部分，分别是内容损失和对抗损失。

根据内容损失选择MSE损失还是感知损失，以及是否添加GAN损失，作者比较了多个模型，SRResNet-MSE, SRResNet-VGG22，SRGAN-MSE, SRGAN-VGG22, SRGAN-VGG54。SRResNet即不使用GAN损失，MSE和VGG22分别表示不同的内容损失。

上图展示了对比结果，其中SRResNet就是SRResNet-MSE。可以看出添加GAN损失能显著改善视觉效果，而使用感知损失的结果细节也比MSE损失更好。

下图统计了一些自然的图像块，基于MSE生成的图像块和基于GAN生成的图像块的对比，也可以发现MSE的结果更加平滑。

github的tensorflow和pytorch开源代码如下:

https://github.com/brade31919/SRGAN-tensorflow

https://github.com/leftthomas/SRGAN

上图展示了一些结果，感兴趣的读者可以使用自己的数据进行训练。

参考文献

[1] Dong C, Loy C C, He K, et al. Image super-resolution using deep convolutional networks[J]. IEEE transactions on pattern analysis and machine intelligence, 2015, 38(2): 295-307.

[2] Johnson J, Alahi A, Fei-Fei L. Perceptual losses for real-time style transfer and super-resolution[C]//European conference on computer vision. Springer, Cham, 2016: 694-711.

[3] Ledig C, Theis L, Huszár F, et al. Photo-realistic single image super-resolution using a generative adversarial networ k[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2017: 4681-4690.

一些内容预览如下：

开启生成式视频压缩：谷歌基于GAN来实现，性能与HEVC相当

选自arXiv 机器之心编译编辑:陈萍来自谷歌的研究者提出了一种基于生成对抗网络 (GAN) 的神经视频压缩方法,该方法优于以前的神经视频压缩方法,并且在用户研究中与 HEVC 性能相当. 通常, ...
即插即用！视频超分中的涨点神器：iSeeBetter

CNN让超分结果更真实,GAN让超分结果更丰满,所以CNN+GAN=GOOD! 添加一个鉴别器组件就能使结果增加0.32dB,即插即用,涨点神器!是否在其他的CNN架构上也可行,还需实验验证. 题目: ...
必读论文 | 生成对抗网络经典论文推荐10篇

生成式对抗网络(Generative adversarial networks, GAN)是当前人工智能学界最为重要的研究热点之一.其突出的生成能力不仅可用于生成各类图像和自然语言数据,还启发和推动了 ...
2019年上半年收集到的人工智能GAN干货文章

2019年上半年收集到的人工智能GAN干货文章 GAN简介及其常见应用训练GAN,你应该知道的二三事了解生成对抗网络(GAN) CosmoGAN:训练GAN,让AI寻找宇宙中的暗物质关于GAN的 ...
【图像上色小综述】生成对抗网络的GAN法

获取有趣.好玩的前沿干货! 超100篇!CVPR 2020最全GAN论文梳理汇总! 0,图像上色及其分类图像上色一般分为两种:无引导上色和有引导上色. 顾名思义,无引导指的是全交由算法进行自动化上色 ...
NICE-GAN：新的图像转换网络框架

DrugAI 3天前以下文章来源于深度奇点 ,作者AITA|于志勇深度奇点DeepSingularity致力于将AI与生物.医疗.城市.海洋等各个领域结合,找到深度奇点. 摘要在传统无监督的图像 ...
LSTM之父再称ResNet、GAN等五大网络都有他的功劳！网友却说：自负大于引用数

丰色发自凹非寺转载自:量子位(QbitAI) "现在引用最多的几个神经网络都是建立在我的实验室成果之上的!" 能说出此话的不是别人,正是在深度学习领域作出了巨大贡献的LSTM ...
【CV秋季划】生成对抗网络GAN有哪些研究和应用，如何循序渐进地学习好？

GAN的研究在这几年发展可以说是非常迅猛,已经被用于各个研究方向,其应用涉及图像与视频生成,数据仿真与增强,各种各样的图像风格化任务,人脸与人体图像编辑,图像质量提升. 那我们究竟如何去长期学好相关的 ...
生成对抗网络(GAN)的发展史

来源:https://en.wikipedia.org/wiki/Edmond_de_Belamy 五年前,Generative Adversarial Networks(GANs)在深度学习领域掀起 ...
【百战GAN】新手如何开始你的第一个生成对抗网络(GAN)任务

大家好,欢迎来到专栏<百战GAN>,我们在公众号已经输出了非常多的GAN相关的理论,这一次我们开设<百战GAN>专栏,在这个专栏里,我们会进行算法的核心思想讲解,代码的详解,模 ...
【GAN优化】长文综述解读如何定量评价生成对抗网络(GAN)

欢迎大家来到<GAN优化>专栏,这里将讨论GAN优化相关的内容,本次将和大家一起讨论GAN的评价指标. 作者&编辑 | 小米粥编辑 | 言有三在判别模型中,训练完成的模型要在测 ...
【杂谈】有三AI秋季划增加生成对抗网络小组，你准备好大GAN一场了吗

作为被誉为"下一代深度学习技术",同时已经在工业界能够真正成熟稳定应用的GAN,有三AI一直在关注相关的技术,并输出了大量的内容. 那如何从理论上和实践上更好地学好GAN这一个基础 ...
一种基于生成对抗网络的无人机图像去雾算法

一种基于生成对抗网络的无人机图像去雾算法随着人类社会的不断发展与科技的不断进步,人们已经进入了信息时代.无人机作为这个时代信息获取的独特载体,凭借自身优势,在航拍.农业.救灾防灾.野生动物观测.测绘 ...
改善图像处理效果的五大生成对抗网络

作者 | Martin Isaksson 译者 | Sambodhi 策划 | 刘燕在图像处理方面,机器学习实践者们正在逐渐转向借助生成对抗网络的力量,本文带你了解其中五种生成对抗网络,可根据自己的 ...
【神经网络】综合篇——人工神经网络、卷积神经网络、循环神经网络、生成对抗网络

前言本文综合整理常用的神经网络,包括生物神经网络.人工神经网络.卷积神经网络.循环神经网络.生成对抗网络:参考了许多高校的课程.论文.博客和视频等.文章的结构是先进行概念了解,然后结合图片.结构图. ...
如何系统性地学习NLP 自然语言处理？

安装工具如果大家已经安装nlpia包(https://github.com/totalgood/nlpia),就可以运行本书中的所有示例.我们会保持README文件中的安装说明为最新版本.但是,如果 ...

【杂谈】如何系统性地学习生成对抗网络GAN

相关推荐