清华&旷视：让VGG再次伟大！

2024-08-01 15:40:43

CNN经典模型VGG自2014年诞生以来，由于相比于各种多分支架构（如ResNet） 性能不佳，已渐“没落”……

但来自清华大学和旷视科技等机构的研究人员，他们居然只用3x3卷积和ReLU激活函数的超级简单架构，通过结构重参数化 （structural re-parameterization），就让这个7年前的老架构再次“容光焕发”！Great Again！

简单到什么程度？研究人员表示：

下午5点看完文章，晚饭前就能写完代码开始训练，第二天就能看到结果。如果没时间看完这篇文章，只要点开GitHub上的代码，看完前100行就可以完全搞明白。

新架构RepVGG结合了多分支架构和单路架构的优点，在速度和性能上直达SOTA，在ImageNet上精度超过80%!

相关论文已被CVPR 2021接收，开源预训练模型和代码在GitHub上也已收获1700+ 标星！

兼顾多分支和单路架构的优点

一个已经快要“没落”的老模型，为什么还要重新捡起利用？

研究人员介绍道，因为简单的VGG式模型（单路架构、仅使用3x3卷积和ReLU激活函数）有五大现实优势：

1、3x3卷积非常快。在GPU上，3x3卷积的计算密度（理论运算量除以所用时间）可达1x1和5x5卷积的四倍。
2、单路架构因为并行度高也非常快。同样的计算量，“大而整”的运算效率远超“小而碎”的运算。
3、单路架构省内存。例如，ResNet的shortcut虽然不占计算量，却增加了一倍的显存占用。
4、单路架构灵活性更好，容易改变各层的宽度（如剪枝）。
5、RepVGG主体部分只有一种算子：3x3卷积接ReLU。在设计专用芯片时，给定芯片尺寸或造价，我们可以集成海量的3x3卷积-ReLU计算单元来达到很高的效率。别忘了，单路架构省内存的特性也可以帮我们少做存储单元。

由于多分支架构性能更好，为了让新架构RepVGG兼顾两者优点，他们提出一个新的做法：先训练一个多分支模型，然后将多分支模型等价转换为单路模型，最后部署这个单路模型。

具体来说，首先借鉴ResNet的做法，在训练时为每一个3x3卷积层添加平行的1x1卷积分支和恒等映射分支，构成一个RepVGG Block。

然后需将RepVGG Block转换为一个卷积，也就是将训练好的模型等价转换为只有3x3卷积的单路模型。

怎么转换？结构重参数化！

如上图，利用卷积的相加性，需经过两次变换。

示例中，输入输出通道数都是2，那3x3卷积核所对应的参数矩阵为2x2x3x3，也就是4个3x3矩阵，1x1卷积核对应的参数矩阵为2x2x1x1，也就是4个1x1矩阵，为了画图方便换成1个2x2矩阵。

把1x1卷积等价转换为3x3卷积，只要用0填充一下就行了。

而恒等映射是一个特殊（以单位矩阵为卷积核）的1x1卷积，因此也是一个特殊的3x3卷积。

以上三个分支都有BN（batch normalization）层，推理时的卷积层和其后的BN层可转换为一个带bias的卷积层。

最后，将三分支得到的卷积核和bias分别相加，完成等价转换为只有3x3卷积的单路模型。

从这一转换过程中，我们看到了“结构重参数化”的实质：训练时的结构对应一组参数，推理时我们想要的结构对应另一组参数；只要能把前者的参数等价转换为后者，就可以将前者的结构等价转换为后者。

不少人都称赞这篇论文的思路非常有意思，简单易懂，让人眼前一亮！

效果确实也非常不错——

速度和精度达SOTA

RepVGG这样只用3x3卷积和ReLU激活函数的简单架构，特别适用于GPU和特殊推理芯片（inference chips）。

研究人员在1080Ti上对RepVGG进行了测试。在公平的训练设定下，同精度的RepVGG速度是ResNet-50的183%，ResNet-101的201%，EfficientNet的259%，RegNet的131%。

在Cityscapes上的语义分割实验表明，在速度更快的情况下，RepVGG模型比ResNet系列高约1%到1.7%的mIoU，或在mIoU高0.37%的情况下速度快62%。

通过结构重参数化，RepVGG在ImageNet上达到了80.57%的top1精度，与最先进的复杂模型相比，速度-精度都非常出色。

关于作者

论文一作：丁霄汉，清华大学计算机视觉博士生，研究方向是计算机视觉和机器学习。在CVPR、ICML、ICCV、NeurIPS作为第一作者发表论文5篇。曾获得第七届百度奖学金荣誉——“十位顶尖 AI 学子”之一。

论文二作：张详雨，旷视科技旷视研究院base model组负责人，西安交大博士生。曾在微软亚洲研究院实习，是ResNet的主要作者之一。

论文三作：马宁宁，香港科技大学与旷视联合培养博士，主要研究方向为计算机视觉和高性能卷积神经网络。

论文地址：https://arxiv.org/abs/2101.03697
GitHub地址：https://github.com/DingXiaoH/RepVGG

参考链接：

[1]https://www.reddit.com/r/MachineLearning/comments/nqflsp/rrepvgg_making_vggstyle_convnets_great_again/
[2]https://zhuanlan.zhihu.com/p/344324470

— 完 —

赞 (0)

ICLR最佳论文“彩票假设”：如何通过彩票假设构建轻量化模型(上)

作者丨科技猛兽编辑丨极市平台极市导读 winning tickets相比于原网络,稀疏子网络的参数量与复杂度要低许多,但推理精度基本相当.今天这篇文章将会详细介绍彩票假设的原理及其泛化性能. &g ...
干货｜深度学习中的重参数技巧

作者丨灿视来源丨灿视学长编辑丨极市平台极市导读本文介绍的重参数技巧主要包含两方面,一种是用于生成模型中的重参数技巧,一种是目前比较火的RepVGG等合并参数的技巧. 重参数技巧的简述大家好, ...
RepVGG：让VGG网络再次变成最优秀的网络

点击上方"深度学习爱好者",选择加"星标"或"置顶" 重磅干货,第一时间送达小白导读论文是学术研究的精华和未来发展的明灯.小白决心每天为 ...
深度学习之卷积神经网络经典模型介绍

深度学习之卷积神经网络经典模型介绍
CNN网络架构演进：从LeNet到DenseNet

卷积神经网络可谓是现在深度学习领域中大红大紫的网络框架,尤其在计算机视觉领域更是一枝独秀.CNN从90年代的LeNet开始,21世纪初沉寂了10年,直到12年AlexNet开始又再焕发第二春,从ZF ...
利用CNN来检测伪造图像

重磅干货,第一时间送达随着像Facebook和Instagram这样的社交网络服务的出现,在过去十年中产生的图像数据量有一个巨大增加.使用图像(和视频)等处理软件GNU Gimp,Adobe Pho ...
基于转移学习的图像识别

重磅干货,第一时间送达 01.前言我们希望编写一个简单的算法用来识别狗狗的品种,假设我们想知道这只狗是什么品种. 算法该如何分辨这只狗可能属于哪个品种?当然小伙伴们可以训练自己的卷积神经网络来对这张 ...
ICCV2019 | 港科大、清华与旷视提出基于元学习的自动化神经网络通道剪枝网络

MetaPruning:Meta Learning for Automatic Neural Network Channel Pruning 论文作者:Zechun Liu , Haoyuan Mu ...
斩获“中国智能建筑行业影响力品牌”，旷视智慧城市微单元亮相中国国际智能建筑展览会

5月6-8日,以"聚焦智能时代,引领智慧风向"为主题的2021中国国际智能建筑展览会在北京国家会议中心拉开帷幕.超过500位智能建筑领域的主管领导.专家学者出席了展会开幕式.本次展 ...
仓库空间利用率提升3倍，旷视助力梦燕打造自动化物流中心

市场.技术.社会多重因素推动下,智能制造.智慧物流已成企业降本增效.增强竞争力的必选项之一.以何种路径稳步推进数字化.智能化升级,也是制造企业未来十年的必答题.工信部<"十四五&quo ...
旷视艾瑞思机器人的“AI+IOT”战略

文/新战略机器人全媒体王博文 4月8日晚,旷视科技(Face++)宣布收购艾瑞思机器人,进军智能机器人业务.AGV行业,乃至整个人工智能领域都在好奇--艾瑞思机器人有哪些值得收购的亮点?被收购后的艾 ...
旷视艾瑞思：从电商转战制造业仓储物流

智能物流是工业4.0的重要组成部分,在工业4.0智能工厂的框架内,智能物流是连接供应和生产的重要环节.而在智慧物流的趋势下,随着人工智能.物联网还有机器人各项技术发展和成熟,厂内搬运设备也将从&quo ...
旷视科技重磅发布智能机器人网络协同大脑—河图

2019年1月16日,中国人工智能企业旷视科技在北京举办机器人战略发布会,重磅发布了旷视机器人战略的核心产品--"河图(Hetu)",同时分享了旷视在物联网组网前夜的思考.开拓.部 ...
智能物流这块蛋糕，旷视准备怎么吃？

智能物流作为北京旷视科技有限公司(以下简称"旷视")三大业务板块之一,成为其深度布局的重点领域.2018年2月,旷视宣布收购移动机器人公司艾瑞思,2019年年初,旷视发布机器人协同 ...
旷视河图系统发布近一年，市场应用如何？

年初,旷视发布智能机器人操作系统河图引发业界热议,如今已近一年,河图的市场应用情况如何?当初的设想又是否实现?在10月末的亚洲物流展上,我们与旷视副总裁彭广平一起聊了聊关于河图的那些事. 实践是检验真 ...
旷视中山供电局智慧仓储中心

项目基本描述为助力数字中山智慧城市建设.满足社会系统运转基本电力需求.提升企业可持续发展能力,中山供电局与人工智能独角兽旷视达成合作,由旷视为其提供全面的智慧物流中心建设,引入先进的仓储自动化 ...