SWAGAN：基于样式的小波驱动生成模型

2024-05-04 23:06:07

重磅干货，第一时间送达

小白导读

论文是学术研究的精华和未来发展的明灯。小白决心每天为大家带来经典或者最新论文的解读和分享，旨在帮助各位读者快速了解论文内容。个人能力有限，理解难免出现偏差，建议对文章内容感兴趣的读者，一定要下载原文，了解具体内容。

摘要

近年来，生成对抗网络(GANs)在视觉质量方面取得了长足的进展。即便如此，由于频谱偏向的架构和类似的不利损失函数，这些网络仍然遭受高频内容质量下降的问题。为了解决这个问题，作者提出了一种新颖的通用风格和基于小波的GAN (SWAGAN)，它实现了频域渐进生成。SWAGAN在其发生器和鉴别器体系结构中引入小波，在每一步都加强了频率感知的潜在表示。这种方法增强了生成图像的视觉质量，并大大提高了计算性能。通过将其集成到SyleGAN2框架中，作者展示了作者的方法的优势，并验证了小波域中的内容生成会导致更高质量的图像，具有更真实的高频内容。此外，作者验证了作者模型的潜在空间保留了允许StyleGAN作为大量编辑任务基础的特性，并表明作者的频率感知方法也诱导了下游视觉质量的改善。

论文创新点

作者的主要贡献是:

一种分层的、基于小波的图像生成方法，实现了更好的视觉保真度和更真实的光谱。
一种网络设计方法，可减少网络的自然频谱偏置倾向，从而显著减少训练高分辨率生成模型所需的计算预算。

框架结构

作者的SWAGAN发生器(左)和鉴别器(右)架构。每个ConvBlock等价于StyleGAN2体系结构的一个特性分辨率递增块，该体系结构本身由两个样式块组成。小波和小波对应于StyleGAN2的tRGB和fRGB层，它们的目的是学习小波分解和高维特征之间的映射。小波反变换用IWT表示，而Up和Down是非学习层，分别负责将图像转换为更高分辨率或更低分辨率的初始小波分解。

实验结果

结论

作者概述了一种基于样式的生成框架的替代方法，它在频域上运行，而不是直接在rgb空间中。这种方法被证明可以产生更真实的视觉效果，特别是在中高频率范围内。该模型直接在频率空间中操作，可以通过表示的低频变化即小波系数来影响输出的高频变化。这直接解决了神经网络的频谱偏差，并提示显著提高了收敛速度。事实证明，采用基于小波的生成式方法可以训练一个基于样式的生成式模型，其性能类似，而计算开销仅为其计算开销的四分之一。作者进一步表明，作者的质量优势可以扩展到下游任务，允许更真实的图像重建或编辑操作。

频域生成的景象为未来的研究留下了许多场所。作者的探索集中在一个单一的小波函数(Haar小波)，它不一定是最优的。事实上，它可能学习一个更好的小波，或利用一组不同的小波，同时允许网络使用适当的权值在它们之间混合和匹配。进一步研究的另一个有趣的方向可能是将频域生成适应于视频领域，例如通过建立在现有的时空小波方案上。

在涉及下游任务时，作者将自己限制在那些通过直接优化方法处理的任务中。然而，最近，基于编码器的方法[28]越来越受欢迎，它提供了一种比优化更快的替代方法，并提高了各种图像到图像转换任务的质量。这些编码器遭受急性高频缺点，部分由于他们使用L2基损失。因此，为此类编码器探索类似的基于频率的处理方法可能是有益的。此外，一些解缠任务可能更适合于频谱表示，特别是那些与频率相关的任务。这条道路也应该被探索。

总之，作者希望作者的工作能启发其他人考虑用于内容生成的替代表示，因为正如这里所展示的，这些表示更适合于网络学习，在质量、运行时和训练收敛方面产生广泛的优势。

论文链接：https://arxiv.org/pdf/2102.06108.pdf

每日坚持论文分享不易，如果喜欢我们的内容，希望可以推荐或者转发给周围的同学。

- END -

CVPR2021 最佳论文候选—提高图像风格迁移的鲁棒性

CVPR2021 最佳论文候选—提高图像风格迁移的鲁棒性
IJCAI 2021 | 腾讯和复旦联合出品：Adv-Makeup人脸黑盒攻击对抗算法

分享一篇来自 IJCAI 2021 的论文:Adv-Makeup: A New Imperceptible and Transferable Attack on Face Recognition,由腾 ...
如何将深度学习研究论文实现为代码

作者:Bipin Krishnan P 编译:ronghuaiyang 导读如果深度学习是一种超能力,那么将理论从论文转化为可用的代码就是一种超超能力. 为什么要去复现机器学习研究论文? 正如我所说 ...
一键生成《泰坦尼克号》漫画书！中国高校学者开发全自动漫画生成系统，无需手动输入，不限视频类型

近年来,随着计算机科学得到飞速发展,科学家们不断取得新的技术突破,尤其是随着机器学习的迅猛发展,各种各样的计算模型被创造出来,比如可以自动生成文本.图像和其他类型数据的计算模型.这些模型相较于传统计算 ...
下一代艺术创作工具？

前阵子社群成员ML668跟我交流了这款工具,今天我终于有空去详细了解了一下,这是一款名为runway的工具. 自称下一代的创意工具. 最大的特点就是底层封装了很多的神经网络模型,用户只要像使用word ...
新论文 | 卷积神经网络 + 小波时频图：基于地震动时频域特征的震害评估新方法

想必很多我的同龄人都对这张脸印象深刻.由于相貌特点,成奎安成功的塑造了诸多经典反派角色.只要他一出场,就知道这是一个好凶好凶的大坏蛋. 图像中蕴含着很多微妙的信息,但是在人工智能技术获得突破前,发掘图 ...
学术︱基于小波神经网络的新型配电网单相短路选线算法试验研究

中国电工技术学会定于2016年9月8~9日在安徽省合肥市举办"2016第五届新能源发电系统技术创新大会"(原"分布式发电与微电网技术大会"),主题为" ...
【好设计论文】基于小波包络差异性的数字调制方式识别技术

摘要:针对通信系统中数字信号调制方式难以准确识别的问题,根据归一化前后小波变换包络的差异性,提出基于小波变异系数差值(ΔCV)和相似度特征的识别算法.该算法对MASK.MFSK.MPSK和MQAM 4 ...
王小波撞墙身亡，葬礼无同行肯送

小编衣食,诸君海涵,下方广告这样吃这5种黑色食物,赶走白发.告别失眠! 一招拯救便秘,肠子润到会打滑,宿便毒素全排出! 耳后有个"安眠穴",睡前按一按,一觉睡到天亮,打雷都吵不醒 ...
王小波曾经评价过张爱玲：“张爱玲的小说有...

王小波曾经评价过张爱玲:"张爱玲的小说有种不同凡响之处,在于她对女人的生活理解得很深刻." 余秋雨也曾说:"是她(张爱玲)告诉历史,二十世纪的中国文学还存在着不带多少火焦 ...
王小波说，王道乾译《情人》，用了最好的译笔

张佳玮 1小时前王小波在<我的师承>里,夸了两位诗人译者. 一是查良铮先生,一是王道乾先生.他认为小说可以有诗歌般的韵律. 对查良铮先生,他赞美的例子是: 我爱你,彼得兴建的大城, 我爱 ...
“教父”王小波死前煎熬又痛苦？他的弟弟更惨，43岁被黑人割颈

1997年4月11日,年仅44岁的王小波因心脏病而猝死于家中.彻底结束之前,他曾遭受没日没夜的痛苦,尽管是最喜爱的写作也无法消除身体之痛. 当时,他还只是文坛中的边缘人物,很少有人知道他的作品,甚至去 ...
王小波：驴与西方智慧

驴与西方智慧文:王小波编:木叶我有一位朋友在内蒙古插过队,他告诉我说,草原上绝不能有驴.假如有了的话,所有的马群都要"炸"掉. 原因是这样的:那个来自内地的.长耳朵的善良动 ...
“天才作家”王小波居然是撞墙而亡？葬礼上竟无同行肯送！

直到离世的那时刻,他前后花费二十年心血的发行6000册(黄金时代)还没有卖完,这也成了他的遗憾.因为那段时间(黄金时代)讲述了性的文化超前突出,被各大出版社禁止,书中描绘了,粗鲁,低俗,荒唐有趣,被大 ...

SWAGAN：基于样式的小波驱动生成模型

相关推荐