当前位置: 首页 > news >正文

深度学习反向传播-过程举例

深度学习中,一般的参数更新方式都是梯度下降法,在使用梯度下降法时,涉及到梯度反向传播的过程,那么在反向传播过程中梯度到底是怎么传递的?结合自己最近的一点理解,下面举个例子简单说明!

一、下面首先是一个简单的神经网络图
在这里插入图片描述
二、神经网络图,说明如下:
在这里插入图片描述
更正上图中第4条:梯度下降法,是损失函数在负梯度方向下降最快,即损失函数在梯度方向的相反方向下降最快!

三、下面是梯度反向传播的推导过程:
在这里插入图片描述
上图中,左边的四组公式表示前向传播的传递过程,前向传播根据给定的输入和初始化的参数来计算出损失L并把中途的中间变量a1、a2、a3和z1、z2、z3、z4计算出来并保存。梯度的反向传播过程如图中红色箭头表示:最初是计算损失函数对z4的偏导数,然后以它为起始值依次计算损失函数对其它参数或中间变量的偏导数。图中红色箭头的方向便反应出了梯度反向传播的实现过程。


http://www.mrgr.cn/news/38692.html

相关文章:

  • 【网络安全】公钥基础设施
  • timedatectl命令:告别时间烦恼,一键同步系统时间
  • 第三节-类与对象(中)
  • 进制转换 总结
  • 深入理解 `strncat()` 函数:安全拼接字符串
  • 数据资产新范式,URP城市焕新平台东博会首发!
  • GB28181信令交互流程及Android端设备对接探讨
  • Linux 学习笔记(十六)—— 重定向与缓冲区
  • Java 注解的使用范围ElementType
  • CSS预处理器LESS
  • 手写代码,利用 mnist 数据集测试对比 kan 和 cnn/mlp 的效果
  • 实现Tiny-RAG:简化版的RAG模型
  • [Python学习日记-31] Python 中的函数
  • WPF MVVM入门系列教程(一、MVVM模式介绍)
  • python习题1
  • 在WPF中实现多语言切换的四种方式
  • 行为设计模式 -模板方法模式- JAVA
  • Hive命令及属性配置
  • 实验2 网络测试命令的使用及对等网组建
  • PostgreSQL 17:新特性与性能优化深度解析