交通预见未来(1)：循环神经网络之LSTM，不只有七秒钟的记忆

2023年4月8日上午4:06 • 循环神经网络

文章名称：《Long short-term memory neural network for traffic speed prediction using remote microwave sensor data》

交通预见未来(1)：循环神经网络之LSTM，不只有七秒钟的记忆

这是北航马晓磊教授和华盛顿大学王印海教授于15年发在Part C上的一篇文章（运输科技2区，IF:3.968）,短短4年时间，创造了近年来Part C 单篇最高引用量，高达300多次。

01 背景

循环神经网络RNN之所以能够在自然语言处理NLP领域大火，很大程度上得益于长短期记忆网络LSTM的提出。LSTM能有效解决传统RNN在处理时间序列长期依赖中的梯度消失和梯度爆炸的问题，这和很多交通领域的预测问题很相似，如何利用过去的交通状态数据预测未来的交通状态？在预测过程中哪些信息应该被保留下来，哪些信息应该被舍弃？过去很长时间的数据是否对预测当前状态有用？LSTM能帮你很好的处理这些问题。

交通预见未来(1)：循环神经网络之LSTM，不只有七秒钟的记忆

post一张自己画的RNN图，哈哈哈

02 创新点

这篇文章之所以能得到很高的引用量，很大程度上在于这是第一篇将LSTM应用到交通领域的文章，这在科研领域大大体现了“人无我有，人有我精，人精我转”的魅力！这篇文章的主体内容其实不多，但文章将该领域的研究现状和文献综述描述的很是详细了，11页的文章，文献综述占了4页，这也一定程度上体现了文章作者的用心。

03 主体内容

文章主要是借助道路交通的传感器数据（包括速度数据，客流量数据和道路占有率数据）来预测未来的道路交通速度。首先，讲述了LSTM的作用原理，其次，利用文章所使用的神经网络结构（一层输入，一层LSTM，一层输出），以历史道路速度数据为输入，来预测未来的交通速度，并与其他多种预测方法诸如Elman 神经网络，支持向量机SVM，卡尔曼滤波器Kalman filter等进行对比。然后又以道路速度和交通流量作为输入，来预测未来的交通速度，以验证是否输入较多的信息，会有更准确的结果。

交通预见未来(1)：循环神经网络之LSTM，不只有七秒钟的记忆

文章中的LSTM示意图

04 疑问

文章一直在强调其中的一个创新点是：LSTM can automatically calculate the optimal time lags, and thus no predetermined time window size is needed. 即LSTM能自动确定最优的time lag, 因此在预测过程中不需要提前设置时间窗口，和几个小同行讨论过这个问题，大家在用这个算法过程中都会设置一个时间窗口，所以至今我也没搞明白作者在技术上是如何做到的，有做相关领域的大神还望指点一二~

05 展望

文章中给出的展望不像很多文章中列的是一些目前根本无法解决的问题，而是给出了很中肯的建议。例如探索将相邻传感器的数据作为输入、不同时间粒度下的预测效果对比、多层深度网络的使用。有此类数据的科研工作者不妨一试。

06 Writing Tips from This Paper

（1）Although traditional RNN exhibits a superior capability of modeling nonlinear time series problems in an effective fashion, there are still several issues to be addressed. 介绍既有研究的不足用。

（2）To the best of our knowledge, there is no application of LSTM NN in the domain of transportation.引出自己的创新点用。

就这些啦，很喜欢的一篇文章分享给大家，五一快乐！下周见！

交通预见未来(1)：循环神经网络之LSTM，不只有七秒钟的记忆