门控循环单元(gated recurrent unit, GRU)是一种有代表性的深度神经网络,它在众多序列学习任务中达到了国际领先的水平.然而,在门控循环单元的每个时间步之间,输入信息与隐含状态信息缺乏交互,这对更好地挖掘上下文语义信息带来了挑战...门控循环单元(gated recurrent unit, GRU)是一种有代表性的深度神经网络,它在众多序列学习任务中达到了国际领先的水平.然而,在门控循环单元的每个时间步之间,输入信息与隐含状态信息缺乏交互,这对更好地挖掘上下文语义信息带来了挑战.针对这个问题,本文提出了一个新颖的序列学习通用的语义特征提取模型:交互门控循环单元(interactive gated recurrent unit, InterGRU),可以让输入与隐含状态向量在各时间步间进行多轮充分的交互.并且,在到达时间估计(estimated time of arrival, ETA)这个有代表性、有挑战的时空序列预测任务上,本文提出了一套基于交互门控循环单元的深度学习框架(InterGRU-ETA).本文在来自滴滴出行平台真实场景下的海量数据集上充分地实验验证了InterGRU-ETA.结果表明,我们的框架在预测准确率上优于目前国际上最先进的方法.这反映了交互门控循环单元在捕获序列语义信息上的性能优势和广阔前景.展开更多
文摘门控循环单元(gated recurrent unit, GRU)是一种有代表性的深度神经网络,它在众多序列学习任务中达到了国际领先的水平.然而,在门控循环单元的每个时间步之间,输入信息与隐含状态信息缺乏交互,这对更好地挖掘上下文语义信息带来了挑战.针对这个问题,本文提出了一个新颖的序列学习通用的语义特征提取模型:交互门控循环单元(interactive gated recurrent unit, InterGRU),可以让输入与隐含状态向量在各时间步间进行多轮充分的交互.并且,在到达时间估计(estimated time of arrival, ETA)这个有代表性、有挑战的时空序列预测任务上,本文提出了一套基于交互门控循环单元的深度学习框架(InterGRU-ETA).本文在来自滴滴出行平台真实场景下的海量数据集上充分地实验验证了InterGRU-ETA.结果表明,我们的框架在预测准确率上优于目前国际上最先进的方法.这反映了交互门控循环单元在捕获序列语义信息上的性能优势和广阔前景.