【连载17】GoogLeNet Inception V2

2024-08-05 13:02:10

公众号后台回复“python“，立刻领取100本机器学习必备Python电子书

GoogLeNet Inception V2在《Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift》出现，最大亮点是提出了Batch Normalization方法，它起到以下作用：

使用较大的学习率而不用特别关心诸如梯度爆炸或消失等优化问题；
降低了模型效果对初始权重的依赖；
可以加速收敛，一定程度上可以不使用Dropout这种降低收敛速度的方法，但却起到了正则化作用提高了模型泛化性；
即使不使用ReLU也能缓解激活函数饱和问题；
能够学习到从当前层到下一层的分布缩放( scaling (方差)，shift (期望))系数。

一些思考‍

在机器学习中，我们通常会做一种假设：训练样本独立同分布(iid)且训练样本与测试样本分布一致，如果真实数据符合这个假设则模型效果可能会不错，反之亦然，这个在学术上叫Covariate Shift，所以从样本（外部）的角度说，对于神经网络也是一样的道理。从结构（内部）的角度说，由于神经网络由多层组成，样本在层与层之间边提特征边往前传播，如果每层的输入分布不一致，那么势必造成要么模型效果不好，要么学习速度较慢，学术上这个叫Internal Covariate Shift。
假设：为样本标注，为样本x通过神经网络若干层后每层的输入；
理论上：的联合概率分布应该与集合中任意一层输入的联合概率分布一致，如：；
但是：，其中条件概率p(y|x)是一致的，即，但由于神经网络每一层对输入分布的改变，导致边缘概率是不一致的，即，甚至随着网络深度的加深，前面层微小的变化会导致后面层巨大的变化。

BN原理‍

BN整个算法过程如下：

以batch的方式做训练，对m个样本求期望和方差后对训练数据做白化，通过白化操作可以去除特征相关性并把数据缩放在一个球体上，这么做的好处既可以加快优化算法的优化速度也可能提高优化精度，一个直观的解释：

左边是未做白化的原始可行域，右边是做了白化的可行域；
当原始输入对模型学习更有利时能够恢复原始输入（和残差网络有点神似）：

这里的参数和是需要学习的。

参数学习依然是利用反向传播原理：

对卷积神经网络而言，BN被加在激活函数的非线性变换前，即：

由于BN参数的存在，这里的偏置可以被去掉，即：

所以在看相关代码实现时大家会发现没有偏置这个参数。
另外当采用较大的学习率时，传统方法会由于激活函数饱和区的存在导致反向传播时梯度出现爆炸或消失，但采用BN后，参数的尺度变化不影响梯度的反向传播，可以证明：

在模型Inference阶段，BN层需要的期望和方差是固定值，由于所有训练集batch的期望和方差已知，可以用这些值对整体训练集的期望和方差做无偏估计修正，修正方法为：

其中为训练集所有（大小都为）的集合集合

Inference时的公式变为：

卷积神经网络中的BN‍

卷积网络中采用权重共享策略，每个feature map只有一对，需要学习。

代码实践

import copy

import numpy as np

import pandas as pd

import matplotlib

matplotlib.use("Agg")

import matplotlib.pyplot as plt

from matplotlib.pyplot import plot,savefig

from keras.datasets import mnist, cifar10

from keras.models import Sequential

from keras.layers.core import Dense, Dropout, Activation, Flatten, Reshape

from keras.optimizers import SGD, RMSprop

from keras.utils import np_utils

from keras.regularizers import l2

from keras.layers.convolutional import Convolution2D, MaxPooling2D, ZeroPadding2D, AveragePooling2D

from keras.callbacks import EarlyStopping

from keras.preprocessing.image import ImageDataGenerator

from keras.layers.normalization import BatchNormalization

import tensorflow as tf

tf.python.control_flow_ops = tf

from PIL import Image

def build_LeNet5():

model = Sequential()

model.add(Convolution2D(96, 11, 11, border_mode='same', input_shape = (32, 32, 3), dim_ordering='tf'))

#注释1 model.add(BatchNormalization())

model.add(MaxPooling2D(pool_size=(2, 2)))

#注释2 model.add(BatchNormalization())

model.add(Activation("tanh"))

model.add(Convolution2D(120, 1, 1, border_mode='valid'))

#注释3 model.add(BatchNormalization())

model.add(Flatten())

model.add(Dense(10))

model.add(BatchNormalization())

model.add(Activation("relu"))

#注释4 model.add(Dense(10))

model.add(Activation('softmax'))

return model

if __name__=="__main__":

from keras.utils.vis_utils import plot_model

model = build_LeNet5()

model.summary()

plot_model(model, to_file="LeNet-5.png", show_shapes=True)

(X_train, y_train), (X_test, y_test) = cifar10.load_data()#mnist.load_data()

X_train = X_train.reshape(X_train.shape[0], 32, 32, 3).astype('float32') / 255

X_test = X_test.reshape(X_test.shape[0], 32, 32, 3).astype('float32') / 255

Y_train = np_utils.to_categorical(y_train, 10)

Y_test = np_utils.to_categorical(y_test, 10)

# this will do preprocessing and realtime data augmentation

datagen = ImageDataGenerator(

featurewise_center=False, # set input mean to 0 over the dataset

samplewise_center=False, # set each sample mean to 0

featurewise_std_normalization=False, # divide inputs by std of the dataset

samplewise_std_normalization=False, # divide each input by its std

zca_whitening=False, # apply ZCA whitening

rotation_range=25, # randomly rotate images in the range (degrees, 0 to 180)

width_shift_range=0.1, # randomly shift images horizontally (fraction of total width)

height_shift_range=0.1, # randomly shift images vertically (fraction of total height)

horizontal_flip=False, # randomly flip images

vertical_flip=False) # randomly flip images

datagen.fit(X_train)

# training

model.compile(loss='categorical_crossentropy',

optimizer='adadelta',

metrics=['accuracy'])

batch_size = 32

nb_epoch = 8

model.fit(X_train, Y_train, batch_size=batch_size, nb_epoch=nb_epoch,

verbose=1, validation_data=(X_test, Y_test))

score = model.evaluate(X_test, Y_test, verbose=0)

print('Test score:', score[0])

print('Test accuracy:', score[1])

三组实验对比：

第一组：放开所有注释
第二组：放开注释4
第三组：注释掉所有BN

‍‍‍‍‍‍‍‍

1.机器学习原来这么有趣！【第一章】

2.机器学习原来这么有趣！【第二章】：用机器学习制作超级马里奥的关卡

3.机器学习从零开始系列连载(1)——基本概念

4.机器学习从零开始系列连载(2)——线性回归

5.机器学习从零开始系列连载(3)——支持向量机

6.机器学习从零开始系列连载(4)——逻辑回归

7.机器学习从零开始系列连载(5)——Bagging and Boosting框架

8.机器学习从零开始系列连载(6)—— Additive Tree 模型

记得把公号加星标，会第一时间收到通知。

创作不易，如果觉得有点用，希望可以随手转发或者”在看“，拜谢各位老铁

Keras之ML~P：基于Keras中建立的回归预测的神经网络模型(根据200个数据样本预测新的5+1个样本)——回归预测

Keras之ML~P:基于Keras中建立的回归预测的神经网络模型(根据200个数据样本预测新的5+1个样本)--回归预测输出结果核心代码 # -*- coding: utf-8 -*- #Ker ...
神经网络调参经验大汇总。

炼丹笔记干货作者:Andrej Karpathy,翻译:杰少 A Recipe for Training Neural Networks 简介今天看到一篇非常非常棒的调节NN的文章,作者是特斯拉高 ...
Keras之CNN：基于Keras利用cv2建立训练存储卷积神经网络模型(2+1)并调用摄像头进行实时人脸识别

Keras之CNN:基于Keras利用cv2建立训练存储卷积神经网络模型(2+1)并调用摄像头进行实时人脸识别输出结果设计思路核心代码 # -*- coding:utf-8 -*- import ...
Keras之ML~P：基于Keras中建立的简单的二分类问题的神经网络模型(根据200个数据样本预测新的5+1个样本)——类别预测

Keras之ML~P:基于Keras中建立的简单的二分类问题的神经网络模型(根据200个数据样本预测新的5+1个样本)--类别预测输出结果核心代码 # -*- coding: utf-8 -*- ...
简单的融合模型：基于keras 的少量样本集迁移学习 VGG16 MeanShift PAC降维混合模型的苹果识别

案例分析更多是是一种思想而不是具体实现 1 数据集样本总数为30个其中普通苹果和其他苹果各占一半其中有10个苹果已经标注其他均无标签 2 数据集扩容由于数据集中数据数量少无法满足模型训练 ...
Python用Keras神经网络序列模型回归拟合预测、准确度检查和结果可视化

原文链接:http://tecdat.cn/?p=23573 我们可以很容易地用Keras序列模型拟合回归数据并预测测试数据. 在这篇文章中,我们将简要地学习如何用Python中的Keras神经网络 ...
【机器学习】随机森林是我最喜欢的模型

机器之心编辑部 TensorFlow 决策森林 (TF-DF) 现已开源,该库集成了众多 SOTA 算法,不需要输入特征,可以处理数值和分类特征,为开发者节省了大量时间. 在人工智能发展史上,各类算 ...
【连载16】GoogLeNet Inception V1

公众号后台回复"python",立刻领取100本机器学习必备Python电子书 GoogLeNet是由google的Christian Szegedy等人在2014年的论文< ...
失传的营养学》连载17 肝的脂肪代谢

②肝的脂肪代谢1 29'43" 肝是人体内脂肪代谢的场所,食物中的脂肪会在小肠内分解,以甘油和脂肪酸的形式吸收,进入人体后,要在肝细胞内重新合成为甘油三脂,即脂肪,然后以脂蛋白的形式运出肝脏 ...
历代画论（连载17）唐宋：《画山水诀》(摘抄)（宋）李澄叟撰

立宾主之位,定远近之势.然后穿凿境物,布置高低.落墨无令太重,太重则浊而不清,落墨无令太轻,太轻则燥涩乾枯而不润.蒙染切忌太见,太见则翻成光滑.辟绰无令手絮,手絮则必损精神.要在不亏不盈,皴染得中.发 ...
义乌之狼：深挖互联网捡钱小道道（连载17）

义乌之狼：深挖互联网捡钱小道道（连载17）
刘有权：荒诞人生（周末连载17）

第二十二章商海浮沉半死生(上) 我的野心一直在跳,梦想为教育兴国尽绵薄之力.岂知命运捉弄,阴差阳错,逼迫跳海. 如果我没有野心,凭着分得的土地,凭着我不服输的性格,再凭着我 ...
【小说】爱恨蛤蟆坪(五)·连载17 || 作者南岳

爱恨蛤蟆坪作者 | 南岳作者南岳近照作者南岳,本名南衡山,甘肃会宁人.一九九二年首次在报刊发表作品,后长期搁笔,近两年又间断写作. 作者前期文字链接: <爱恨蛤蟆坪(一)·连载1> ...
《风起2》连载17

酒杯碰得蹦蹦蹦响 "江东美食汇"流量确实上去了,这使小强他们三个都十分高兴.尤其是吕萍萍,一天到晚拿着手机查看点击率.因为现场直播以后,平台还在定时推送,一些粉丝也会回过头来再看一 ...
如何让健康离开“危险的悬崖”？-《儿童健康讲记》连载17

今天选择对的能量和信息如果你自己和家人有比较严重的健康问题,怎么自我调理或者配合中医呢?除了需要留意上焦.中焦.下焦这三个部分之外,还需要让自己的神保持稳定的状态. 比如,看完一场电影,你会觉得有 ...
【连载17】《痕影·心眼》（中篇小说连载17）

[连载17]<痕影·心眼>(中篇小说连载17) = 李富的爹接过了那东西,就在李富的面前慢慢地打开了一层又一层那变黄了的布子,完后,啊,里面原来就是那张十年前他曾经提到的照片.李富的爹小心 ...

【连载17】GoogLeNet Inception V2

相关推荐