当前位置: 首页 > news >正文

PyTorch构建神经网络

【图书推荐】《PyTorch深度学习与企业级项目实战》-CSDN博客

《PyTorch深度学习与企业级项目实战(人工智能技术丛书)》(宋立桓,宋立林)【摘要 书评 试读】- 京东图书 (jd.com)

训练一个神经网络通常需要提供大量的数据,我们称之为数据集。数据集一般被分为三类,即训练集(Training Set)、验证集(Validation Set)和测试集(Test Set)。

一个Epoch就等于使用训练集中的全部样本训练一次的过程。所谓训练一次,指的是进行一次正向传播(Forward Pass)和反向传播(Backward Pass),如图5-2所示。 

图5-2

当一个Epoch的样本(也就是训练集)数量太过庞大的时候,进行一次训练可能会消耗过多的时间,并且每次训练都使用训练集的全部数据是不必要的。因此,我们需要把整个训练集分成多个小块,也就是分成多个Batch来进行训练。一个Epoch由一个或多个Batch构成,Batch为训练集的一部分,每次训练的过程只使用一部分数据,即一个Batch。我们称训练一个Batch的过程为一个Iteration。

PyTorch提供了torch.nn库,它是用于构建神经网络的工具库。torch.nn库依赖于autograd库来定义和计算梯度。nn.Module包含神经网络的层以及返回输出的forward(input)方法。

以下是一个简单的神经网络的构建示例:

#######pytorch-nn-demo1.py###############
import torch
import torch.nn as nn
import torch.nn.functional as Fclass Net(nn.Module):def __init__(self):super(Net, self).__init__()# 输入图像channel:1,输出channel:6,5×5卷积核self.conv1 = nn.Conv2d(1, 6, 5)self.conv2 = nn.Conv2d(6, 16, 5)# 全连接层self.fc1 = nn.Linear(16 * 5 * 5, 120)self.fc2 = nn.Linear(120, 84)self.fc3 = nn.Linear(84, 10)def forward(self, x):# 使用2×2窗口进行最大池化x = F.max_pool2d(F.relu(self.conv1(x)), (2, 2))# 如果窗口是方的,只需要指定一个维度x = F.max_pool2d(F.relu(self.conv2(x)), 2)x = x.view(-1, self.num_flat_features(x))x = F.relu(self.fc1(x))x = F.relu(self.fc2(x))x = self.fc3(x)return xdef num_flat_features(self, x):size = x.size()[1:]  # 获取除batch维度外的其他维度num_features = 1for s in size:num_features *= sreturn num_featuresnet = Net()
print(net)

结果输出如下:

Net((conv1): Conv2d(1, 6, kernel_size=(5, 5), stride=(1, 1))(conv2): Conv2d(6, 16, kernel_size=(5, 5), stride=(1, 1))(fc1): Linear(in_features=400, out_features=120, bias=True)(fc2): Linear(in_features=120, out_features=84, bias=True)(fc3): Linear(in_features=84, out_features=10, bias=True)
)

以上就是一个简单的神经网络的构建方法。首先定义了一个Net类,这个类继承自nn.Module。然后在__init__方法中定义了网络的结构,在forward方法中定义了数据的流向。在网络的构建过程中,我们可以使用任何张量操作。需要注意的是,backward函数(用于计算梯度)会被autograd自动创建和实现。你只需要在nn.Module的子类中定义forward函数。PyTorch的一个重要功能就是autograd,它是为方便用户使用,而专门开发的一套自动求导引擎,能够根据输入和前向传播过程自动构建计算图,并执行反向传播。


http://www.mrgr.cn/news/12545.html

相关文章:

  • leetcode94:二叉树的中序遍历
  • 【pytorch深度学习——小样本学习策略】网格搜索和遗传算法混合优化支持向量机的小样本学习策略进行预测
  • Python的变量、关键字、命名规则、基本数据类型及类型转换
  • [每日一练]从表中创建DataFrame
  • PHP MySQL 插入多条数据
  • 【Google Maps JavaScript API】Right-to-Left Languages 实现指南
  • 10款免费电脑录屏软件盘点,2024年最新录屏工具排行榜
  • 23种设计模式详解-创建模式篇
  • 功能测试理论
  • Linux小项目 迷你服务端实现在线商城
  • LeetCode49. 字母异位词分组(2024秋季每日一题 4)
  • STM32学习记录-05 -1-TIM定时中断
  • 【Liunx入门】Liunx软件包管理器
  • 【Qt】容器类控件TabWidget
  • 2-74 基于matlab的图像k-means聚类GUI
  • Spring核心概念复习AOP
  • 硬件调试经验积累 关于RTC 时钟问题。
  • TypeScript为何需要定义比较复杂的泛型类型?
  • Dockerfile应用、私有仓库
  • C#WinFrom 中实现可自定义按钮和事件的消息提示框