【推导】神经网络梯度推导
基于网易云课堂龙良曲老师的《深度学习与pytorch》中对神经网络梯度推导过程,从易到难循序渐进;
目前只收录了感知机部分,后续待补充
1. 感知机梯度推导
单一感知机
其中损失函数表示为
$sigmoid$ 函数求导回顾
梯度求导过程
多输出感知机
其中损失函数表示为
梯度求导过程
2. 多层感知机推导
引入链式法则
多层感知机结构
为了方便运算,设置
以上数据都是可以直接求出
同样,将
设置为从J层到以后的信息
总结
For an output layer node $k \in K$
where
For a hidden layer node $j \in J$
where
【推导】神经网络梯度推导
http://achlier.github.io/2022/09/27/神经网络梯度推导/