【推导】神经网络梯度推导

基于网易云课堂龙良曲老师的《深度学习与pytorch》中对神经网络梯度推导过程,从易到难循序渐进;

目前只收录了感知机部分,后续待补充

1. 感知机梯度推导

单一感知机

其中损失函数表示为

$sigmoid$ 函数求导回顾

梯度求导过程

多输出感知机

其中损失函数表示为

梯度求导过程

2. 多层感知机推导

引入链式法则

多层感知机结构

为了方便运算,设置

以上数据都是可以直接求出

同样,将

设置为从J层到以后的信息

总结

For an output layer node $k \in K$

where

For a hidden layer node $j \in J$

where


【推导】神经网络梯度推导
http://achlier.github.io/2022/09/27/神经网络梯度推导/
Author
Hailey
Posted on
September 27, 2022
Licensed under