Pytorch - TORCH.NN.INIT 参数初始化的操作

2024-06-20 13:53:09

这篇文章主要介绍了Pytorch - TORCH.NN.INIT 参数初始化的操作，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧路径：https://pytorch.org/docs/master/nn.init.html#nn-init-dochttp://www.cncsto.com/article/7390初始化函数：torch.nn.init123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108# -*- coding: utf-8 -*-"""Created on 2019@author: fancp"""import torchimport torch.nn as nnw = torch.empty(3,5)#1.均匀分布 - u(a,b)#torch.nn.init.uniform_(tensor, a=0.0, b=1.0)print(nn.init.uniform_(w))# =============================================================================# tensor([[0.9160, 0.1832, 0.5278, 0.5480, 0.6754],# [0.9509, 0.8325, 0.9149, 0.8192, 0.9950],# [0.4847, 0.4148, 0.8161, 0.0948, 0.3787]])# =============================================================================#2.正态分布 - N(mean, std)#torch.nn.init.normal_(tensor, mean=0.0, std=1.0)print(nn.init.normal_(w))# =============================================================================# tensor([[ 0.4388, 0.3083, -0.6803, -1.1476, -0.6084],# [ 0.5148, -0.2876, -1.2222, 0.6990, -0.1595],# [-2.0834, -1.6288, 0.5057, -0.5754, 0.3052]])# =============================================================================#3.常数 - 固定值 val#torch.nn.init.constant_(tensor, val)print(nn.init.constant_(w, 0.3))# =============================================================================# tensor([[0.3000, 0.3000, 0.3000, 0.3000, 0.3000],# [0.3000, 0.3000, 0.3000, 0.3000, 0.3000],# [0.3000, 0.3000, 0.3000, 0.3000, 0.3000]])# =============================================================================#4.全1分布#torch.nn.init.ones_(tensor)print(nn.init.ones_(w))# =============================================================================# tensor([[1., 1., 1., 1., 1.],# [1., 1., 1., 1., 1.],# [1., 1., 1., 1., 1.]])# =============================================================================#5.全0分布#torch.nn.init.zeros_(tensor)print(nn.init.zeros_(w))# =============================================================================# tensor([[0., 0., 0., 0., 0.],# [0., 0., 0., 0., 0.],# [0., 0., 0., 0., 0.]])# =============================================================================#6.对角线为 1，其它为 0#torch.nn.init.eye_(tensor)print(nn.init.eye_(w))# =============================================================================# tensor([[1., 0., 0., 0., 0.],# [0., 1., 0., 0., 0.],# [0., 0., 1., 0., 0.]])# =============================================================================#7.xavier_uniform 初始化#torch.nn.init.xavier_uniform_(tensor, gain=1.0)#From - Understanding the difficulty of training deep feedforward neural networks - Bengio 2010print(nn.init.xavier_uniform_(w, gain=nn.init.calculate_gain('relu')))# =============================================================================# tensor([[-0.1270, 0.3963, 0.9531, -0.2949, 0.8294],# [-0.9759, -0.6335, 0.9299, -1.0988, -0.1496],# [-0.7224, 0.2181, -1.1219, 0.8629, -0.8825]])# =============================================================================#8.xavier_normal 初始化#torch.nn.init.xavier_normal_(tensor, gain=1.0)print(nn.init.xavier_normal_(w))# =============================================================================# tensor([[ 1.0463, 0.1275, -0.3752, 0.1858, 1.1008],# [-0.5560, 0.2837, 0.1000, -0.5835, 0.7886],# [-0.2417, 0.1763, -0.7495, 0.4677, -0.1185]])# =============================================================================#9.kaiming_uniform 初始化#torch.nn.init.kaiming_uniform_(tensor, a=0, mode='fan_in', nonlinearity='leaky_relu')#From - Delving deep into rectifiers: Surpassing human-level performance on ImageNet classification - HeKaiming 2015print(nn.init.kaiming_uniform_(w, mode='fan_in', nonlinearity='relu'))# =============================================================================# tensor([[-0.7712, 0.9344, 0.8304, 0.2367, 0.0478],# [-0.6139, -0.3916, -0.0835, 0.5975, 0.1717],# [ 0.3197, -0.9825, -0.5380, -1.0033, -0.3701]])# =============================================================================#10.kaiming_normal 初始化#torch.nn.init.kaiming_normal_(tensor, a=0, mode='fan_in', nonlinearity='leaky_relu')print(nn.init.kaiming_normal_(w, mode='fan_out', nonlinearity='relu'))# =============================================================================# tensor([[-0.0210, 0.5532, -0.8647, 0.9813, 0.0466],# [ 0.7713, -1.0418, 0.7264, 0.5547, 0.7403],# [-0.8471, -1.7371, 1.3333, 0.0395, 1.0787]])# =============================================================================#11.正交矩阵 - (semi)orthogonal matrix#torch.nn.init.orthogonal_(tensor, gain=1)#From - Exact solutions to the nonlinear dynamics of learning in deep linear neural networks - Saxe 2013print(nn.init.orthogonal_(w))# =============================================================================# tensor([[-0.0346, -0.7607, -0.0428, 0.4771, 0.4366],# [-0.0412, -0.0836, 0.9847, 0.0703, -0.1293],# [-0.6639, 0.4551, 0.0731, 0.1674, 0.5646]])# =============================================================================#12.稀疏矩阵 - sparse matrix#torch.nn.init.sparse_(tensor, sparsity, std=0.01)#From - Deep learning via Hessian-free optimization - Martens 2010print(nn.init.sparse_(w, sparsity=0.1))# =============================================================================# tensor([[ 0.0000, 0.0000, -0.0077, 0.0000, -0.0046],# [ 0.0152, 0.0030, 0.0000, -0.0029, 0.0005],# [ 0.0199, 0.0132, -0.0088, 0.0060, 0.0000]])# =============================================================================补充：【pytorch参数初始化】 pytorch默认参数初始化以及自定义参数初始化本文用两个问题来引入1.pytorch自定义网络结构不进行参数初始化会怎样，参数值是随机的吗？2.如何自定义参数初始化？先回答第一个问题在pytorch中，有自己默认初始化参数方式，所以在你定义好网络结构以后，不进行参数初始化也是可以的。1.Conv2d继承自_ConvNd，在_ConvNd中，可以看到默认参数就是进行初始化的，如下图所示

2.torch.nn.BatchNorm2d也一样有默认初始化的方式

3.torch.nn.Linear也如此

现在来回答第二个问题。pytorch中对神经网络模型中的参数进行初始化方法如下：123456789101112from torch.nn import init#define the initial function to init the layer's parameters for the networkdef weigth_init(m):if isinstance(m, nn.Conv2d):init.xavier_uniform_(m.weight.data)init.constant_(m.bias.data,0.1)elif isinstance(m, nn.BatchNorm2d):m.weight.data.fill_(1)m.bias.data.zero_()elif isinstance(m, nn.Linear):m.weight.data.normal_(0,0.01)m.bias.data.zero_()首先定义了一个初始化函数，接着进行调用就ok了，不过要先把网络模型实例化：123#Define Networkmodel = Net(args.input_channel,args.output_channel)model.apply(weigth_init)此上就完成了对模型中训练参数的初始化。在知乎上也有看到一个类似的版本，也相应的贴上来作为参考了：123456789101112131415def initNetParams(net):'''Init net parameters.'''for m in net.modules():if isinstance(m, nn.Conv2d):init.xavier_uniform(m.weight)if m.bias:init.constant(m.bias, 0)elif isinstance(m, nn.BatchNorm2d):init.constant(m.weight, 1)init.constant(m.bias, 0)elif isinstance(m, nn.Linear):init.normal(m.weight, std=1e-3)if m.bias:init.constant(m.bias, 0)initNetParams(net)再说一下关于模型的保存及加载1.保存有两种方式，第一种是保存模型的整个结构信息和参数，第二种是只保存模型的参数12345#保存整个网络模型及参数torch.save(net, 'net.pkl')#仅保存模型参数torch.save(net.state_dict(), 'net_params.pkl')2.加载对应保存的两种网络1234567# 保存和加载整个模型torch.save(model_object, 'model.pth')model = torch.load('model.pth')# 仅保存和加载模型参数torch.save(model_object.state_dict(), 'params.pth')model_object.load_state_dict(torch.load('params.pth'))以上为个人经验，希望能给大家一个参考

【pytorch速成】Pytorch图像分类从模型自定义到测试

言有三毕业于中国科学院,计算机视觉方向从业者,有三工作室等创始人作者 | 言有三(微信号Longlongtogo) 编辑 | 言有三前面已跟大家介绍了Caffe和TensorFlow,链接如下. ...
PyTorch 学习笔记（六）：PyTorch的十七个损失函数

加入极市专业CV交流群,与6000+来自腾讯,华为,百度,北大,清华,中科院等名企名校视觉开发者互动交流!更有机会与李开复老师等大牛群内互动! 同时提供每月大咖直播分享.真实项目需求对接.干货资讯汇总 ...
【CV实战】年轻人的第一个GAN项目应该是什么样的（Pytorch框架）？

欢迎大家来到咱们的深度学习CV项目实战专栏,GAN是当下非常热门的技术,本次我们给大家介绍如何来训练自己的第1个生成对抗网络项目. 作者&编辑 | 言有三本项目结果展示本文篇幅:4000字 ...
牛刀小试之用pytorch实现LSTM

LSTM参数首先需要定义好循环网络,需要nn.LSTM(),首先介绍一下这个函数里面的参数 LSTM数据格式: num_layers: 我们构建的循环网络有层lstm num_directions: ...
深度学习在图像分类中的应用ーー利用 Pytorch 从零开始创建 CNN

重磅干货,第一时间送达推荐阅读 31个Python实战项目教你掌握图像处理,PDF开放下载 opencv_contrib扩展模块中文教程pdf,限时领取引言本文将解释一个卷积神经网络(CNN)的 ...
Pytorch教程：新手的快速指南

11分钟阅读 > Image Source: Author Python被确定为数据科学和机器学习的进入语言,部分感谢开源ML库Pytorch. Pytorch的功能强大的深度神经网络建筑工具和 ...
PyTorch 学习笔记（四）：权值初始化的十种方法

加入极市专业CV交流群,与6000+来自腾讯,华为,百度,北大,清华,中科院等名企名校视觉开发者互动交流!更有机会与李开复老师等大牛群内互动! 同时提供每月大咖直播分享.真实项目需求对接.干货资讯汇总 ...
小白学PyTorch | 4 构建模型三要素与权重初始化

文章目录: 1 模型三要素 2 参数初始化 3 完整运行代码 4 尺寸计算与参数计算这篇文章内容不多,比较基础,里面的代码块可以复制到本地进行实践,以加深理解. 喜欢的话,可以给公众号加一个星标,点 ...
pytorch torch.nn.functional实现插值和上采样

interpolate torch.nn.functional.interpolate(input, size=None, scale_factor=None, mode='nearest', ali ...
FAI飞亚摩托车电喷系统改装及初始化图示操作教程

有的摩友喜欢把化油器车改装成电喷车,以体验改装的乐趣,下面,就以图文的形式为大家梳理一下改装过程和初始化步骤. FAI飞亚电喷,采用独特的直线式脉冲电磁泵技术,泵-喷嘴高度集成为一个喷射单元,不需要在 ...
torch.sigmoid() 与 torch.nn.Sigmoid() 对比 python

torch.sigmoid() 与 torch.nn.Sigmoid() 对比 python
torch.sigmoid、torch.nn.Sigmoid和torch.nn.functional.sigmoid的区别

review代码的时候发现我使用的是torch.sigmoid,pycharm标黄cannot find reference 'sigmoid' in '__init__.py'于是产生了这样的疑 ...
周末重温——TensorFlow之参数初始化

点击上方"机器学习爱好者社区" 选择"星标"公众号,重磅干货,第一时间送达 CNN中最重要的就是参数了,包括W和b.训练CNN的最终目的就是得到最好的参数,使得 ...
【阿里云课程】详解深度学习优化：参数初始化，激活函数，标准化，池化

大家好,继续更新有三AI与阿里天池联合推出的深度学习系列课程,本次更新内容为第6课中两节,介绍如下: 第1节:激活函数与参数初始化第1节课内容为:卷积神经网络的上篇,简单介绍卷积神经网络的生物学机制 ...
机器学习「Pytorch 」笔记六：初始化与 18 种损失函数的源码解析

机器学习「Pytorch 」笔记六：初始化与 18 种损失函数的源码解析
【Pytorch 】笔记六：初始化与 18 种损失函数的源码解析

❝ 阿泽推荐:这是 Miracle 同学 Pytorch 系列的第六篇,共有十篇. 1.写在前面疫情在家的这段时间,想系统的学习一遍 Pytorch 基础知识,因为我发现虽然直接 Pytorch 实 ...
【Pytorch 】nn 模块中的网络层介绍

❞ 1.写在前面疫情在家的这段时间,想系统的学习一遍 Pytorch 基础知识,因为我发现虽然直接 Pytorch 实战上手比较快,但是关于一些内部的原理知识其实并不是太懂,这样学习起来感觉很不踏实 ...

Pytorch - TORCH.NN.INIT 参数初始化的操作

相关推荐