weight sharing-用一个线性层处理单词(共享)解决参数量过大的问题
Consistent memory-解决语义相关性问题
需要用全局的视角来处理语义信息,来解决语义相关性问题
Gradient-可导
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:深度学习2.0-37.循环神经网络层 - Python技术站
需要用全局的视角来处理语义信息,来解决语义相关性问题
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:深度学习2.0-37.循环神经网络层 - Python技术站