使用tensorflow构建一个卷积神经网络

2024-05-13 19:18:02

本文是对tensforflow官方入门教程的学习和翻译，展示了创建一个基础的卷积神经网络模型来解决图像分类问题的过程。具体步骤如下

1. 加载数据集

tensorflow集成了keras这个框架，提供了CIFAR10数据集，该数据集包含了10个类别共6万张彩色图片，加载方式如下

>>> import tensorflow as tf>>> from tensorflow.keras import datasets,layers, models>>> import matplotlib.pyplot as plt>>> (train_images, train_labels), (test_images, test_labels) = datasets.cifar10.load_data()Downloading data from https://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz170500096/170498071 [==============================] - 33s 0us/step>>> train_images, test_images = train_images / 255.0, test_images / 255.0

可以通过如下代码来查看部分图片

>>> for i in range(25):... plt.subplot(5, 5, i + 1)... plt.xticks([])... plt.yticks([])... plt.grid(False)... plt.imshow(train_images[i], cmap = plt.cm.binary)... plt.xlabel(class_names[train_labels[i][0]])...>>> plt.show()

可视化效果如下

2. 构建卷积神经网络

通过keras的Sequential API来构建卷积神经网络，依次添加卷积层，池化层，全连接层，代码如下

>>> model = models.Sequential()>>> model.add(layers.Conv2D(32, (3, 3), activation = "relu", input_shape = (32, 32, 3)))>>> model.add(layers.MaxPooling2D((2, 2)))>>> model.add(layers.Conv2D(64, (3,3), activation = "relu"))>>> model.add(layers.MaxPooling2D((2, 2)))>>> model.add(layers.Conv2D(64, (3, 3), activation = "relu"))>>> model.add(layers.Flatten())>>> model.add(layers.Dense(64, activation = "relu"))>>> model.add(layers.Dense(10))>>> model.summary()Model: "sequential"_________________________________________________________________Layer (type) Output Shape Param #=================================================================conv2d_1 (Conv2D) (None, 30, 30, 32) 896_________________________________________________________________max_pooling2d (MaxPooling2D) (None, 15, 15, 32) 0_________________________________________________________________conv2d_2 (Conv2D) (None, 13, 13, 64) 18496_________________________________________________________________max_pooling2d_1 (MaxPooling2 (None, 6, 6, 64) 0_________________________________________________________________conv2d_4 (Conv2D) (None, 4, 4, 64) 36928_________________________________________________________________flatten (Flatten) (None, 1024) 0_________________________________________________________________dense_1 (Dense) (None, 64) 65600_________________________________________________________________dense_2 (Dense) (None, 10) 650=================================================================Total params: 122,570Trainable params: 122,570Non-trainable params: 0_________________________________________________________________

3. 编译模型

模型在训练之前，必须对其进行编译，主要是确定损失函数，优化器以及评估分类效果好坏的指标，代码如下

>>> model.compile(optimizer = 'adam', loss = tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True), metrics = ['accuracy'])

4. 训练模型

使用训练集训练模型，代码如下

>>> history = model.fit(train_images, train_labels, epochs = 10, validation_data = (test_images, test_labels))

2021-06-23 10:59:43.386592: I tensorflow/compiler/mlir/mlir_graph_optimization_pass.cc:176] None of the MLIR Optimization Passes are enabled (registered 2)

Epoch 1/10

1563/1563 [==============================] - 412s 203ms/step - loss: 1.5396 - accuracy: 0.4380 - val_loss: 1.2760 - val_accuracy: 0.5413

Epoch 2/10

1563/1563 [==============================] - 94s 60ms/step - loss: 1.1637 - accuracy: 0.5850 - val_loss: 1.1193 - val_accuracy: 0.6084

Epoch 3/10

1563/1563 [==============================] - 95s 61ms/step - loss: 1.0210 - accuracy: 0.6398 - val_loss: 0.9900 - val_accuracy: 0.6556

Epoch 4/10

1563/1563 [==============================] - 88s 56ms/step - loss: 0.9186 - accuracy: 0.6781 - val_loss: 0.9399 - val_accuracy: 0.6687

Epoch 5/10

1563/1563 [==============================] - 95s 61ms/step - loss: 0.8472 - accuracy: 0.7023 - val_loss: 0.8984 - val_accuracy: 0.6868

Epoch 6/10

1563/1563 [==============================] - 85s 55ms/step - loss: 0.7917 - accuracy: 0.7220 - val_loss: 0.8896 - val_accuracy: 0.6888

Epoch 7/10

1563/1563 [==============================] - 88s 56ms/step - loss: 0.7450 - accuracy: 0.7381 - val_loss: 0.8843 - val_accuracy: 0.6974

Epoch 8/10

1563/1563 [==============================] - 87s 55ms/step - loss: 0.7024 - accuracy: 0.7530 - val_loss: 0.8403 - val_accuracy: 0.7089

Epoch 9/10

1563/1563 [==============================] - 92s 59ms/step - loss: 0.6600 - accuracy: 0.7676 - val_loss: 0.8512 - val_accuracy: 0.7095

Epoch 10/10

1563/1563 [==============================] - 91s 58ms/step - loss: 0.6240 - accuracy: 0.7790 - val_loss: 0.8483 - val_accuracy: 0.7119

通过比较训练集和验证集的准确率曲线，可以判断模型训练是否有过拟合等问题，代码如下

>>> plt.plot(history.history['accuracy'], label='accuracy')[<matplotlib.lines.Line2D object at 0x000001AAC62A7B08>]>>> plt.plot(history.history['val_accuracy'], label = 'val_accuracy')[<matplotlib.lines.Line2D object at 0x000001AAC28F8988>]>>> plt.xlabel('Epoch')Text(0.5, 0, 'Epoch')>>> plt.ylabel('Accuracy')Text(0, 0.5, 'Accuracy')>>> plt.ylim([0.5, 1])(0.5, 1.0)>>> plt.legend(loc='lower right')<matplotlib.legend.Legend object at 0x000001AAC62A7688>>>> plt.show()

结果如下

当模型过拟合时，会看到accuracy非常高，而val_accuracy较低，两条线明显偏离。从上图中看到，两个准确率比较接近，没有明显的分离现象，而且值都比较低，模型存在欠拟合的问题。

5. 评估模型

用测试集评估模型效果，结果如下

>>> test_loss, test_acc = model.evaluate(test_images, test_labels, verbose=2)313/313 - 7s - loss: 0.8483 - accuracy: 0.7119

>>> print(test_acc)0.711899995803833

准确率达到了70%，对于一个由几行代码快速构建的初步卷积神经网络模型而言，这个效果还可以接受。后续可以考虑数据增强，模型改进，调整学习率等方式，来提高模型的准确率。

·end·

用于NLP的Python：使用Keras的多标签文本LSTM神经网络分类

原文链接:http://tecdat.cn/?p=8640 介绍在本文中,我们将看到如何开发具有多个输出的文本分类模型.我们开发一个文本分类模型,该模型可分析文本注释并预测与该注释关联的多个标签.多 ...
Python 中组合分类和回归的神经网络模型

某些预测问题需要为同一输入预测数字值和类别标签.一种简单的方法是在同一数据上开发回归和分类预测模型,然后依次使用这些模型.另一种通常更有效的方法是开发单个神经网络模型,该模型可以根据同一输入预测数字和 ...
深度学习在图像分类中的应用ーー利用 Pytorch 从零开始创建 CNN

重磅干货,第一时间送达推荐阅读 31个Python实战项目教你掌握图像处理,PDF开放下载 opencv_contrib扩展模块中文教程pdf,限时领取引言本文将解释一个卷积神经网络(CNN)的 ...
【pytorch速成】Pytorch图像分类从模型自定义到测试

言有三毕业于中国科学院,计算机视觉方向从业者,有三工作室等创始人作者 | 言有三(微信号Longlongtogo) 编辑 | 言有三前面已跟大家介绍了Caffe和TensorFlow,链接如下. ...
图像中的裂纹检测

点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达推荐阅读 42个pycharm使用技巧,瞬间从黑铁变王者 Goog ...
零基础入门语义分割-Task5 模型训练与验证

一个成熟合格的深度学习训练流程至少具备以下功能: 在训练集上进行训练,并在验证集上进行验证: 模型可以保存最优的权重,并读取权重: 记录下训练集和验证集的精度,便于调参. 5 模型训练与验证为此本章 ...
Python中用PyTorch机器学习神经网络分类预测银行客户流失模型

原文链接:http://tecdat.cn/?p=8522 分类问题属于机器学习问题的类别,其中给定一组特征,任务是预测离散值.分类问题的一些常见示例是,预测肿瘤是否为癌症,或者学生是否可能通过考试. ...
【Keras速成】Keras图像分类从模型自定义到测试

这是给大家准备的Keras速成例子杨照璐计算机视觉.深度学习方向从业者作者 | 杨照璐(微信号lwyzl0821) 编辑 | 言有三这一次我们讲讲keras这个简单.流行的深度学习框架,一个图 ...
训练一个自己的分类 | 【包教包会，数据都准备好了】

参考:https://blog.csdn.net/m0_37935211/article/details/83021723 前言: 在找工作的时候,经常被问到你自己有没有做过什么项目,我回答跑过手写数 ...
TF之CNN：Tensorflow构建卷积神经网络CNN的简介、使用方法、应用之详细攻略

TF之CNN:Tensorflow构建卷积神经网络CNN的简介.使用方法.应用之详细攻略 TensorFlow 中的卷积有关函数入门 TensorFlow 构建卷积网络之前,我们需要了解一下 Tens ...
使用tensorflow创建一个简单的神经网络

本文是对tensorflow官方入门教程的学习和翻译,展示了创建一个基础的神经网络模型来解决图像分类问题的过程.具体步骤如下 1. 加载数据 tensorflow集成了keras这个框架,提供了Fa ...
没有卷积！华人博士生首次用两个Transformer构建一个GAN，TransGAN来了！

重磅干货,第一时间送达本文转载自:机器之心 | 作者:Yifan Jiang等「attention is really becoming『all you need』.」最近,CV 研究者对 ...
带动画效果的卷积神经网络的讲解.pptx

刚在学习深度学习的时候,对卷积神经网络还比较模糊,后来发现一位黄海广老师的卷积神经网络课件,带很多动画,把卷积神经网络讲得很清楚.值得推荐. 文末提供原版的ppt的下载方式,ppt效果见下图: 下载方 ...
卷积神经网络是如何实现不变性特征提取的？

转载于 :OpenCV学堂图像特征传统的图像特征提取(特征工程)主要是基于各种先验模型,通过提取图像关键点.生成描述子特征数据.进行数据匹配或者机器学习方法对特征数据二分类/多分类实现图像的对象检 ...
深度信号处理：利用卷积神经网络测量距离

在信号处理中,有时需要测量信号某些特征(例如峰)之间的水平距离. 一个很好的例子就是解释心电图(ECG),这在很大程度上取决于测量距离. 我们将考虑下图中只有两个峰的平滑信号的一个样例. 解决这个问题 ...
【时间序列】时间卷积神经网络

在深度学习的知识宝库中,除了前面文章中介绍的RNN,还有一个重要的分支:卷积神经网络(CNN),其广泛应用于视觉,视频等二维或者多维的图像领域.卷积网络具有深度,可并行等多种特性,这种技术是否可以应用 ...
总结 | 卷积神经网络必读的40篇经典论文，包含检测/识别/分类/分割多个领域

转载于 :极市平台作为深度学习的代表算法之一,卷积神经网络(Convolutional Neural Networks,CNN)在计算机视觉等领域上取得了当前最好的效果. 1998 年,Yann L ...
【隐创118期】基于卷积神经网络的海面目标检测方法研究（节选二）

编者按: 深度学习算法已被证明是图像与视频处理的强大工具,广泛应用于国防安全之中.在海洋环境中,光电传感器数据与人类智能技术的融合对于应对安全问题具有重要作用.例如,态势感知可以通过一个自动系统来增强 ...

使用tensorflow构建一个卷积神经网络

相关推荐