笔记:神经网络

模型

笔记:神经网络

转移方程

笔记:神经网络
记第 j j j层的第 i i i个unit为 a i ( j ) a_i^{(j)} ai(j)​。
activation function就是sigmoid function: g ( z ) = 1 1 + e − θ T z g(z)=\frac{1}{1+e^{-\theta^Tz}} g(z)=1+e−θTz1​。
转移方程: a ( j + 1 ) = g ( Θ ( j ) [ a 0 ( j ) a ( j ) ] ) a^{(j+1)}=g(\Theta^{(j)}\begin{bmatrix}a_0^{(j)}\\a^{(j)}\end{bmatrix}) a(j+1)=g(Θ(j)[a0(j)​a(j)​])。
其中 a 0 ( j ) = 1 a_0^{(j)}=1 a0(j)​=1为bias unit。

若第 j j j层有 s j s_j sj​个unit,则 Θ ( j ) \Theta^{(j)} Θ(j)是一个 s j + 1 × ( s j + 1 ) s_{j+1}\times (s_j+1) sj+1​×(sj​+1)的矩阵。

上一篇:线性代数学习笔记4——矩阵的逆


下一篇:bzoj4671 异或图(斯特林反演,线性基)