6.6 通过时间反向传播
定义模型
简单起见,考虑一个无偏差项的循环神经网络,且激活函数为恒等映射(\(\phi(x)=x\))。设时间步 \(t\) 的输入为单样本 \(\boldsymbol{x}_t \in \mathbb{R}^d\),标签为 \(y_t\),那么隐藏状态 \(\boldsymbol{h}_t \in \mathbb{R}^h\)的计算表达式为
\[ \boldsymbol{h}_t = \boldsymbol{W}_{hx} \boldsymbol{x}_t + \boldsymbol{W}_{hh} \boldsymbol{h}_{t-1}, \]