DL之DNN优化技术：神经网络算法简介之GD/SGD算法的简介、代码实现、代码调参之详细攻略

2024-06-19 00:18:42

GD算法的简介

GD算法，是求解非线性无约束优化问题的基本方法，最小化损失函数的一种常用的一阶优化方法。如图所示，找出最陡峭的方向作为下山的方向。

1、如何求梯度？

沿着梯度方向，函数值下降最快。

2、二元曲面

具有两个输入权重的线性神经元的误差曲面，Error surface of a linear neuron with two input weights

3、GD算法容易陷入局部最小值

GD/SGD算法的代码实现

1、Matlab编程实现

%% 最速下降法图示
% 设置步长为0.1，f_change为改变前后的y值变化，仅设置了一个退出条件。
syms x;f=x^2;
step=0.1;x=2;k=0;         %设置步长,初始值,迭代记录数
f_change=x^2;             %初始化差值
f_current=x^2;            %计算当前函数值
ezplot(@(x,f)f-x.^2)       %画出函数图像
axis([-2,2,-0.2,3])       %固定坐标轴
hold on
while f_change>0.000000001                %设置条件，两次计算的值之差小于某个数，跳出循环
    x=x-step*2*x;                         %-2*x为梯度反方向，step为步长，！最速下降法！
    f_change = f_current - x^2;           %计算两次函数值之差
    f_current = x^2 ;                     %重新计算当前的函数值
    plot(x,f_current,'ro','markersize',7) %标记当前的位置
    drawnow;pause(0.2);
    k=k+1;
end
hold off
fprintf('在迭代%d次后找到函数最小值为%e，对应的x值为%e\n',k,x^2,x)

2、基于python实现SGD算法

class SGD:
    def __init__(self, lr=0.01):
        self.lr = lr  #学习率，实例变量

    #update()方法，在SGD中会被反复调用
    def update(self, params, grads):
        for key in params.keys():
            params[key] -= self.lr * grads[key]  #参数params、grads依旧是字典型变量，按params['W1']、grads['W1']的形式，分别保存了权重参数和它们的梯度。

'伪代码：神经网络的参数的更新'
network = TwoLayerNet(...)
optimizer = SGD()
for i in range(10000):
    ...
    x_batch, t_batch = get_mini_batch(...) # mini-batch
    grads = network.gradient(x_batch, t_batch)
    params = network.params
    optimiz

GD算法的改进算法

1、SGD算法
(1)、mini-batch
如果不是每拿到一个样本即更改梯度，而是若干个样本的平均梯度作为更新方向，则是mini-batch梯度下降算法。

(1)、SGD与学习率、Rate、Loss

GD算法中的超参数

1、学习率

(1)、固定学习率实验的C代码

(2)、回溯线性搜索(Backing Line Search)

(3)、二次插值线性搜索：回溯线性搜索的思考——插值法，二次插值法求极值

梯度下降法的三种形式BGD、SGD以及MBGD

阅读目录 1. 批量梯度下降法BGD 2. 随机梯度下降法SGD 3. 小批量梯度下降法MBGD 4. 总结在应用机器学习算法时,我们通常采用梯度下降法来对采用的算法进行训练.其实,常用的梯度下降法 ...
【调参实战】那些优化方法的性能究竟如何，各自的参数应该如何选择？

大家好,欢迎来到专栏<调参实战>,虽然当前自动化调参研究越来越火,但那其实只是换了一些参数来调,对参数的理解和调试在机器学习相关任务中是最基本的素质,在这个专栏中我们会带领大家一步一步理解 ...
节省显存新思路，在PyTorch里使用2 bit激活压缩训练神经网络

设为 "星标",重磅干货,第一时间送达! 转载自 | PaperWeekly ©作者 | 郑怜悯.陈键飞来源 | 机器之心随着超大规模深度学习模型逐渐成为 AI 的趋势,如何在 ...
深度学习三十问！一位算法工程师经历30+场CV面试后总结的常见问题合集（含答案）

作者丨灯会来源丨极市平台编辑丨极市平台极市导读作者灯会为21届中部985研究生,凭借自己整理的面经,去年在腾讯优图暑期实习,七月份将入职百度cv算法工程师.在去年灰飞烟灭的算法求职季中,经过3 ...
DL之DNN优化技术：神经网络算法简介之数据训练优化【mini-batch技术+etc】

DL之DNN优化技术:神经网络算法简介之数据训练优化[mini-batch技术+etc] 1.mini-batch技术输出结果实现代码 # coding: utf-8 #DL之mini-batch ...
DL之DNN优化技术：利用Batch Normalization(简介、入门、使用)优化方法提高DNN模型的性能

DL之DNN优化技术:利用Batch Normalization优化方法提高DNN模型的性能 Batch Normalization简介 1.Batch Norm的反向传播的推导有些复杂,但是可借助于 ...
DL之DNN优化技术：利用Dropout(简介、使用、应用)优化方法提高DNN模型的性能

DL之DNN优化技术:利用Dropout(简介.入门.使用)优化方法提高DNN模型的性能 Dropout简介随机失活(dropout)是对具有深度结构的人工神经网络进行优化的方法,在学习过程中通过将 ...
DL之DNN优化技术：自定义MultiLayerNetExtend算法(BN层使用/不使用+权重初始值不同)对Mnist数据集训练评估学习过程

DL之DNN优化技术:自定义MultiLayerNetExtend算法(BN层使用/不使用+权重初始值不同)对Mnist数据集训练评估学习过程相关文章: DL之DNN优化技术:采用三种激活函数(si ...
DL之DNN优化技术：DNN优化器的参数优化—更新参数的四种最优化方法(SGD/Momentum/AdaGrad/Adam)的案例理解、图表可视化比较

DL之DNN优化技术:DNN优化器的参数优化-更新参数的四种最优化方法(SGD/Momentum/AdaGrad/Adam)的案例理解.图表可视化比较四种最优化方法简介 DL之DNN优化技术:神经网 ...
DL之DNN优化技术：自定义MultiLayerNet【5*100+ReLU】对MNIST数据集训练进而比较三种权重初始值（Xavier参数初始化、He参数初始化）性能差异

DL之DNN优化技术:自定义MultiLayerNet[5*100+ReLU]对MNIST数据集训练进而比较三种权重初始值(Xavier参数初始化.He参数初始化)性能差异导读 #思路:观察不同的权 ...
DL：神经网络算法简介之耗算力的简介、原因、经典模型耗算力计算、GPU使用之详细攻略

DL:神经网络算法简介之耗算力的简介.原因.经典模型耗算力计算.GPU使用之详细攻略神经网络算法耗算力的简介通过比特币来理解算力.算力(也称哈希率)是比特币网络处理能力的度量单位.即为计算机(CP ...
CV之FC：计算机视觉之人脸识别(Face Recognition)方向的简介、代码实现、案例应用之详细攻略

CV之FC:计算机视觉之人脸识别(Face Recognition)方向的简介.代码实现.案例应用之详细攻略人脸识别简介 1.人脸识别的任务 Face Verification Face Ident ...
ML之DR之SVD：SVD算法相关论文、算法过程、代码实现、案例应用之详细攻略

ML之DR之SVD:SVD算法相关论文.算法过程.代码实现.案例应用之详细攻略 SVD算法相关论文奇异值分解Singular Value Decomposition:简称SVD,特征分解的广义化,是 ...

DL之DNN优化技术：神经网络算法简介之GD/SGD算法的简介、代码实现、代码调参之详细攻略

GD算法的简介

GD/SGD算法的代码实现

1、Matlab编程实现

GD算法的改进算法

GD算法中的超参数

相关推荐