哈工大等提出轻量级盲超分辨模型LESRCNN，代码已开源

2024-07-30 00:22:57

近年来图像超分辨率（super-resolution ，SR）已经获得长足发展，但计算量大仍阻碍相关研究进入产品，来自哈工大等单位的学者提出一种轻量级SR 模型，在取得了state-of-the-art结果的同时，显著降低计算量，代码已经开源，相信对从事相关方向的学术和产业界的朋友都会有参考价值。

Lightweight image super-resolution with enhanced CNN

作者：Chunwei Tian, Ruibin Zhuge, Zhihao Wu, Yong Xu, Wangmeng Zuo, Chen Chen, Chia-Wen Lin

单位：哈工大、美国北卡夏洛特分校和台湾国立清华大学

01

背景与动机

数字设备在收集图像过程中常受到拍摄物周围环境、相机硬件和人为因素影响，导致捕获到图像不清晰，这严重影响后续视觉任务性能。已有深度学习方法都通过单一缩放因子来恢复高清图像，这不适用于现实中捕获的受损程度不同图像。

此外，已有方法都通过增大网络深度提升图像超分辨性能，但这会增大网络计算代价，也不适用于手机和相机等。

针对这些问题，本文提出一种轻量级增强的超分辨网络（A lightweight enhanced SR CN, LESRCNN）。LSRCNN主要从网络结构和解决问题两方面来设计网络的。在网络结构方面，LESRCNN采用异构结构，结合低频特征和高频特征，提升网络超分辨性能。在解决任务上，采用一组自适应的子像素卷积计算实现盲超分辨网络。

02

工作原理

本文提出的LESRCNN由信息提取和增强块（IEEB）、重构块（RB）和信息提纯块（IRB）组成。结构图如图1所示：

图1 LESRCNN的网络结构图

IEEB: IEEB能提取层次的低频特征和逐步加强获得特征的作用来增强网络浅层对深层的记忆能力。为了移除冗余的低频特征，3x3和1x1卷积组成的异构结构应用到IEEB中。

RB: 因为SR任务目标是把低分辨率图像转换为高分辨率图像，所以RB能通过子像素卷积技术把低频特征转换为高频特征。

为了防止原始输入低频图像在转换过程中丢失重要信息，RB通过融合局部和全局特征来解决网络长期依赖问题。

此外，为了实现盲超分辨网络，一组灵活的子像素卷积技术应用到RB中，如图2所示。

其中，这个灵活的子像素卷积技术由x2、x3和x4三种模式组成。当训练固定缩放因子的超分辨模型时，选择三种模式中一种即可。当训练盲超分辨模型时，三种模式同时开启。

图2 灵活的子像素卷积技术

IRB: IRB能进一步学习RB获得高频特征，以恢复更多的高频细节信息，提升SR性能。此外，IRB也负责构造高清图像。

03

创新点

（1）LESRCNN通过级联三个块，以减少参数量和获得高的图像超分辨性能；

（2）LESRCNN通过提取层次低频特征并融合这些特征，以解决网络长期依赖问题。此外，LSRCNN中异构卷积结构能在不降低SR性能情况下降低网络参数和提高SR网络效率。低频和高频特征同时使用能提升SR性能。

（3）LESRCNN能处理固定缩放因子的低分辨率图像和盲超分辨任务。

04

实验效果

表1不同方法在Set5上恢复不同缩放因子（x2、x3和x4）的低分辨率图像获得PSNR和SSIM值

表2不同方法在Set14上恢复不同缩放因子（x2、x3和x4）的低分辨率图像获得PSNR和SSIM值

表3不同方法在B100上恢复不同缩放因子（x2、x3和x4）的低分辨率图像获得PSNR和SSIM值

表4不同方法在U100上恢复不同缩放因子（x2、x3和x4）的低分辨率图像获得PSNR和SSIM值

表5不同方法恢复256x256,512x512和1024x1024高质量图像的运行时间

表6不同图像超分辨网络的复杂度

图3 不同方法在U100上恢复缩放因子2的高质量图像视觉效果

图4 不同方法在Set14上恢复缩放因子3的高质量图像视觉效果

图5 不同方法在B100上恢复缩放因子4的高质量图像视觉效果

论文：

https://arxiv.org/pdf/2007.04344.pdf

代码：

https://github.com/hellloxiaotian/LESRCNN

END

在看，让更多人看到

赞 (0)

超实用性！哈工大提出ACNet：用于超分辨的非对称卷积神经网络

由哈尔滨工业大学.鹏城实验室.国立清华大学及香港中文大学的学者提出了一种用于盲噪声的盲超分辨的非对称卷积神经网络,该论文已经在AriXv上发表.该论文打破传统的一个模型只能处理固定缩放因子的图像超分辨 ...
【AI产品】你我当年的老照片，如今修复了可还行？

欢迎来到<AI产品>专栏,这一个专栏是面向所有对人工智能技术感兴趣的朋友.在这个专栏里,我们会给大家推荐好玩的AI产品,剖析背后的关键技术,并推荐相关学习资料. 今天要推荐的这款产品是你我 ...
【计算摄影】图像与视频超分辨，深度学习核心技术与展望

大家好,这是专栏<计算摄影>的第七篇文章,这一个专栏来自于计算机科学与摄影艺术的交叉学科. 作者&编辑 | 言有三图像超分,就是要将低分辨率的图像恢复为高分辨率的图像,它在日常的 ...
【杂谈】为什么你在有三AI看不到最新论文的解读，其实一直都有的

有许多朋友都问过我这个问题,有三兄为什么你不解读最新的论文呢?今天来给大家说道说道. 最新的论文解读当然是有的其实最新的论文解读一直都是有的,只是没有放在公众号.我们的内容生态分为:书+季划+知识星 ...
ECCV 2020 | 空间-角度信息交互的光场图像超分辨，性能优异代码已开源

光场相机可以记录当前场景不同视角的图像,每个视角图像的上下文信息(空间信息)与不同视角之间的互补信息(角度信息)都有助于提升图像超分辨的性能. 近日,来自国防科技大学.上海科技大学等单位的学者提出了新 ...
哈工大硕士生实现 11 种数据降维算法，代码已开源！

阅读大概需要15分钟 Follow小博主,每天更新前沿干货网上关于各种降维算法的资料参差不齐,同时大部分不提供源代码.这里有个 GitHub 项目整理了使用 Python 实现了 11 种经典的数据 ...
哈工大硕士生实现11种数据降维算法，代码已开源！

来自:相约机器人编辑:huber 大家好,我是huber! 网上关于各种降维算法的资料参差不齐,同时大部分不提供源代码.这里有个 GitHub 项目整理了使用 Python 实现了 11 ...
多功能的图像超分辨模型：用于盲图像超分辨的非对称卷积神经网络

哈工大.台湾国立清华大学与香港中文大学的研究人员联合提出用于盲图像超分辨的非对称卷积网络,该文收录于IEEE Transactions on Systems, Man, and Cybernetics ...
灵感来自螃蟹，中国西交大首次提出仿生外骨骼关节模型，刚柔一体，突破传统外骨骼边界

导读外骨骼机器人是由不同机器人零件制成的可穿戴"外壳",可以提高使用者的力量,能力和稳定性,帮助他们轻松举起百斤重量,或康复治疗.到目前为止,大多数外骨骼都是使用基于固定轴旋转铰 ...
RefineDetLite：腾讯提出轻量级高精度目标检测网络

前几天腾讯公布了一篇论文RefineDetLite: A Lightweight One-stage Object Detection Framework for CPU-only Devices,提 ...
ICCV 2019 | 北邮提出高阶注意力模型，大幅改进行人重识别SOTA精度

这种新出的注意力模型,很显然也可以适用于其他视觉问题建模,作者已于近日开源了代码,非常值得参考. 论文作者信息: 作者均来自北京邮电大学. 什么是注意力模型? 在视觉问题建模中,注意力模型是让算法能对 ...
1亿人的期盼！人民大学、中科院、中国民航大学、哈工大等提出郑州建校规划

投实消息:一大批优质高校项目布局河南,优秀教育资源加速入豫!中国人民大学.中国科学院大学.中国民航大学.哈尔滨工业大学等一大批高等学府纷纷表示将在郑州设立研究院.郑州校区. 与郑州1000万常住人 ...
ICCV2019 | 旷视提出轻量级目标检测网络ThunderNet

本文作者:Liyang 作者学校:复旦大学研究方向:Object Detection/CNN complier 论文地址:https://arxiv.org/pdf/1903.11752.pdf 源 ...