GRU

GRU是由Cho在2014年提出的,全称是Gated Recurrent Unit。它与LSTM最大的不同在于GRU将遗忘门和输入门合成了一个“更新门”,同时网络不再额外给出记忆状态CtC_t,而是将输出结果hth_t作为记忆状态不断向后循环传递,网络的输入和输出都变得特别简单。具体的计算过程如下图所示:循环神经网络:GRU在本质上,GRU和LSTM是相同的,将上一时刻t1t-1输出ht1h_{t-1}和当前tt时刻的输入xtx_t结合起来计算各种衰减系数,略微不同的地方是,线性变换没有使用偏置,由于记忆状态也是ht1h_{t-1},所以直接对它进行更新就可以了,最后输出网络的结果hth_t,这个结果也是网络的记忆状态。