DL之DNN优化技术：神经网络算法简介之数据训练优化【mini-batch技术+etc】

2024-08-06 21:30:12

DL之DNN优化技术：神经网络算法简介之数据训练优化【mini-batch技术+etc】

1、mini-batch技术

输出结果

实现代码

# coding: utf-8
#DL之mini-batch：理解深度学习算法中的优化技术【mini-batch技术+etc】

import numpy as np
from DIY_module.mnist import load_mnist

(x_train, t_train), (x_test, t_test) = load_mnist(normalize=True, one_hot_label=True)
#设定参数one_hot_label=True，可以得到one-hot 表示（即仅正确解标签为1，其余为0 的数据结构）。

print(x_train.shape) # (60000, 784)
print(t_train.shape) # (60000, 10)

#从训练数据中随机抽取10笔数据，只需指定这些随机选出的索引，取出mini-batch，然后使用这个mini-batch 计算损失函数即可！
train_size = x_train.shape[0]
batch_size = 10
batch_mask = np.random.choice(train_size, batch_size)
#np.random.choice(60000, 10)会从0 到59999 之间随机选择10 个数字

x_batch = x_train[batch_mask]
t_batch = t_train[batch_mask]

#实现mini-batch版交叉熵误差
#同时处理单个数据和批量数据（数据作为batch集中输入）两种情况的函数。
def cross_entropy_error(y, t):
    if y.ndim == 1: #if判断y的维度为1 时，即求单个数据的交叉熵误差时，需要改变数据的形状
        t = t.reshape(1, t.size)
        y = y.reshape(1, y.size) #当输入为mini-batch 时，要用batch 的个数进行正规化，计算单个数据的平均交叉熵误差。
    batch_size = y.shape[0]
    return -np.sum(t * np.log(y + 1e-7)) / batch_size

#当监督数据是标签形式（非one-hot 表示，而是像“2”“7”这样的标签）时，交叉熵误差可通过如下代码实现。
#(1)、实现的要点是，由于one-hot表示中t为0的元素的交叉熵误差也为0，因此针对这些元素的计算可以忽略。即如果可以获得神经网络在正确解标签处的输出，就可以计算交叉熵误差。
def cross_entropy_error(y, t):
    if y.ndim == 1:
        t = t.reshape(1, t.size)
        y = y.reshape(1, y.size)
    batch_size = y.shape[0]
    return -np.sum(np.log(y[np.arange(batch_size), t] + 1e-7)) / batch_size  #微小值1e-7

#np.log(y[np.arange(batch_size),t]) #np.arange(batch_size)会生成一个从0到batch_size-1的数组
#y[np.arange(batch_size),t]  #会生成NumPy数组[y[0,2], y[1,7], y[2,0],y[3,9], y[4,4]])。

赞 (0)

keras搭建多层LSTM时间序列预测模型

参考基于 Keras 的 LSTM 时间序列分析--以苹果股价预测为例 ######################导入库##########################import osos.e ...
解析Transformer模型

❝ GiantPandaCV导语:这篇文章为大家介绍了一下Transformer模型,Transformer模型原本是NLP中的一个Idea,后来也被引入到计算机视觉中,例如前面介绍过的DETR就是将 ...
DL之CNN优化技术：卷积神经网络算法简介之特有的优化技术及其代码实现——im2col技术等技术

DL之CNN优化技术:卷积神经网络算法简介之特有的优化技术及其代码实现--im2col技术等技术 im2col技术 im2col简介 1.im2col 的示意图 2.将滤波器的应用区域从头开始依次横向 ...
DL框架之MXNet ：神经网络算法简介之MXNet 常见使用方法总结(神经网络DNN、CNN、RNN算法)之详细攻略(个人使用)

DL框架之MXNet :神经网络算法简介之MXNet 常见使用方法总结(神经网络DNN.CNN.RNN算法)之详细攻略(个人使用) 相关文章 DL框架之MXNet :深度学习框架之MXNet 的简介. ...
DL之CNN：卷积神经网络算法简介之原理简介——CNN网络的3D可视化(LeNet-5为例可视化)

DL之CNN:卷积神经网络算法简介之原理简介--CNN网络的3D可视化(LeNet-5为例可视化) CNN网络的3D可视化 3D可视化地址:http://scs.ryerson.ca/~aharley ...
DL之DNN优化技术：神经网络算法简介之GD/SGD算法的简介、代码实现、代码调参之详细攻略

DL之DNN优化技术:神经网络算法简介之GD/SGD算法的简介.代码实现.代码调参之详细攻略 GD算法的简介 GD算法,是求解非线性无约束优化问题的基本方法,最小化损失函数的一种常用的一阶优化方法.如 ...
DL之DNN之BP：神经网络算法简介之BP算法/GD算法之不需要额外任何文字，只需要八张图讲清楚BP类神经网络的工作原理

DL之DNN之BP:神经网络算法简介之BP算法/GD算法之不需要额外任何文字,只需要八张图讲清楚BP类神经网络的工作原理 BP类神经网络理解 1.BP算法 1.信号正向传播FP 2.误差反向传播BP+ ...
DL之BP：神经网络算法简介之BP算法简介(链式法则/计算图解释)、案例应用之详细攻略

DL之BP:神经网络算法简介之BP算法简介(链式法则/计算图解释).案例应用之详细攻略相关文章:DL之DNN之BP:神经网络算法简介之BP算法/GD算法之不需要额外任何文字,只需要八张图讲清楚BP类神 ...
DL之DNN：基于神经网络(从1层~50层)DNN算法实现对非线性数据集点进行绘制决策边界

DL之DNN:基于神经网络(从1层~50层)DNN算法实现对非线性数据集点进行绘制决策边界输出结果设计代码首先查看数据集 import numpy as np from sklearn.data ...
DL：神经网络算法简介之Affine 层的简介、使用方法、代码实现之详细攻略

DL:神经网络算法简介之Affine 层的简介.使用方法.代码实现之详细攻略 Affine 层的简介 Affine层:神经网络的正向传播中,进行的矩阵的乘积运算,在几何学领域被称为"仿射变换 ...
DL：神经网络算法简介之耗算力的简介、原因、经典模型耗算力计算、GPU使用之详细攻略

DL:神经网络算法简介之耗算力的简介.原因.经典模型耗算力计算.GPU使用之详细攻略神经网络算法耗算力的简介通过比特币来理解算力.算力(也称哈希率)是比特币网络处理能力的度量单位.即为计算机(CP ...