【模型解读】说说移动端基准模型MobileNets

2024-04-24 06:08:35

这是深度学习模型解读第4篇，本篇我们将介绍MobileNets。

李健

武汉大学硕士，研究方向为机器学习与计算机视觉

作者 | 李健（微信号：lijian05170517）

编辑 | 李健

概述

Google开发的MobileNets【1】是用于嵌入式平台计算机视觉应用的基准模型。MobileNets是流线型的架构，它使用depthwise sparable convolution(深度可分离卷积)来构建轻量级的深层神经网络。通过引入两个简单的全局超参数，可实现在速度和准确度之间有效地进行平衡。这两个超参数允许模型构建者根据问题的约束条件，为其应用选择合适大小的模型。MobileNets应用在广泛的场景中，包括物体检测，细粒度分类，人脸属性等。

Mobilenets结构

Mobilenets基本组成单元是depthwise sparable convolution+pointwise convolution，下图是其组成结构图。

我们可以看到它由3*3的通道分组卷积（depthwise separable convolution）加1*1的普通卷积（point wise convolution）组成。它的组成结构本质上就是Xception结构，如下图。

从图中可以看出，经过3*3深度卷积，每个通道的输出信息只和之前的对应通道信息相关，而普通3*3卷积每个通道输出信息和之前所有通道信息相关，这是它们的本质区别。

下面我们计算一下depthwise sparable convolution和普通卷积之间的计算量的比较，便于我们客观理解depthwise sparable convolution的有效性。

假设输入图片是DF*DF*M，输出图片是DF*DF*N，卷积核尺度是DK*DK。

普通卷积计算量：

depthwise sparable convolution计算量：

两个比值为：

一般情况下N比较大，当DK=3时，depthwise sparable convolution计算量仅为普通卷积计算量的1/9。

Mobilenets结构就是由这些depthwise sparable convolution+pointwise convolution线性叠加构成的。结构如下图。

从图中可以看出先是一个3*3普通卷积，然后是叠加depthwise sparable convolution+pointwise convolution，之后是全局均值池化，接着是全连接层，最后Softmax输出。

下图是MobileNets和各个网络的比较。

可以看出在参数量减小的领先优势之下，还能取的很高的准确率。

模型压缩

可以通过定义width multiplier α（宽度乘数）和resolution multiplier ρ （分辨率乘数）两个超参数，来实现不同版本的mobilenets，从而实现不同要求的模型压缩。

1.第一个参数α主要是按比例减少通道数，其取值范围为(0,1)，α ∈ {1, 0.75, 0.5, 0.25} 的测试效果如下图：

可以看出随着α减小，准确率下降，参数量减小，速度提升。

2.第二个超参数ρ 主要是按比例改变输入数据的分辨率。ρ 如果为{1，6/7，5/7，4/7}，则对应输入分辨率为{224，192，160，128}。测试效果如下图：

可以看出，随着分辨率下降，准确率下降，随之速度加快。日常应用中，可以通过这两个参数的选取来综合考虑选择模型。

MobileNetsV2

MobileNets 是一种经典的小型 CNN 网络,主要使用了深度可分离卷积结构 (Depthwise Separable Convolution),具有较小的参数量和计算量,能够很好地用在移动端. ...
CVPR2020论文解读—华为高效轻量级网络GhostNet, 性能超越谷歌MobileNetV3

AI研习图书馆,发现不一样的精彩世界论文解读华为诺亚方舟实验室提出的新型端侧神经网络架构GhostNet,在同样精度条件下,模型速度和计算量均少于此前SOTA算法,值得一看.GhostNet论文已 ...
ConvMLP：你见过长得像CNN的MLP吗？UO&UIUC提出了用于视觉任务的层次卷积MLP

详细信息如下: 论文链接:https://arxiv.org/abs/2109.04454 项目链接:https://github.com/SHI-Labs/Convolutional-MLPs 导言 ...
轻量级CNN架构设计

GiantPandaCV导语卷积神经网络架构设计,又指backbone设计,主要是根据具体任务的数据集特点以及相关的评价指标来确定一个网络结构的输入图像分辨率,深度,每一层宽度,拓扑结构等细节.公开 ...
图像分类：常用分类网络结构（附论文下载）

加入极市专业CV交流群,与6000+来自腾讯,华为,百度,北大,清华,中科院等名企名校视觉开发者互动交流!更有机会与李开复老师等大牛群内互动! 同时提供每月大咖直播分享.真实项目需求对接.干货资讯汇总 ...
盘点卷积神经网络中 6 种经典卷积操作！

概述: 深度学习的模型大致可以分为两类,一类是卷积神经网络,另外一类循环神经网络,在计算机视觉领域应用最多的就是卷积神经网络(CNN).CNN在图像分类.对象检测.语义分割等经典的视觉任务中表现出色, ...
MicroNets：更小更快更好的MicroNet，三大CV任务都秒杀MobileNetV3

▊ 写在前面本文旨在以极低的计算成本解决性能大幅下降的问题.作者发现有两个因素是可以有效提高精度的,分别是:稀疏连通性和动态激活函数.前者避免了网络宽度的大幅度缩减的危害,而后者则减轻了网络深度缩减 ...
素质内在结构模型：160页经理人员能力素质模型解读，果断收藏

为职场精英打造个人知识体系,升职加薪! 经理人员能力素质模型解读什么是能力素质模型特定岗位或人群中的绩效优异者所具备素质特点被称为胜任素质或胜任力: 特定岗位或人群中的绩效优异者所具备素质特点集合 ...
乡村开发的6种模型解读

发展乡村产业,最重要的是顺应经济社会发展规律,以满足市场需求为导向,以乡村资源.产业基础.人文历史等优势为依托,因地制宜地选择适合本地的乡村产业.防止盲目跟风,避免形成"千人一面" ...
『名医经验』用“三明治”模型解读张仲景与刘河间

大道至简! 如果还没简单到多数老百姓都能听懂,笔者认为便是道还不够通.不够"大".于是,让中医的道理尽量简单而不失正确便成了笔者的理想之一,经常会努力用一些通俗的.流行的.甚至是时 ...
干货|模型系列5：对角互补模型（深度解读与典例详解）

干货|模型系列5：对角互补模型（深度解读与典例详解）
中考数学：相似模型重点模型解读例题

数学好教师 2020-11-27 关于相似的问题,相信初三的小伙伴们都明白它在中考里的比重.不管是选择填空,还是大题应用,"相似"总是是变着花样的来为难大家.今天就来具体看看相似模 ...
中考数学专题：相似模型重点模型解读例题

相似模型解读
五运六气原理之术数模型解读III

前文说过五运和五行相配合确立年干.必须明确一点概念:五运是来自天上,而五行是来自太阳系的五星.故而两者是天庭和地方的关系,不是一回事.观现今五运六气的教材的解释:五运即木.火.土.金.水五行的运动.这 ...
【组织诊断】麦肯锡7S模型解读（完整篇）

(ID:HR-empowerment) 作者:Tiger OD三部曲,诊断-变革与效能评价. 诊断是OD的起点,是为了发现企业目前发展存在的问题,诊断之后,就要形成系统的解决方案,解决方案推动的过程就 ...
中考数学相似重点模型解读例题

相似模型解读

【模型解读】说说移动端基准模型MobileNets

相关推荐