GRU
GRU是由Cho在2014年提出的,全称是Gated Recurrent Unit。它与LSTM最大的不同在于GRU将遗忘门和输入门合成了一个“更新门”,同时网络不再额外给出记忆状态,而是将输出结果作为记忆状态不断向后循环传递,网络的输入和输出都变得特别简单。具体的计算过程如下图所示:在本质上,GRU和LSTM是相同的,将上一时刻输出和当前时刻的输入结合起来计算各种衰减系数,略微不同的地方是,线性变换没有使用偏置,由于记忆状态也是,所以直接对它进行更新就可以了,最后输出网络的结果,这个结果也是网络的记忆状态。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:循环神经网络:GRU - Python技术站