社交网络中,消息的爆发预测属于社交网络流行动态分析的范畴,是社会计算领域的研究热点之一.通过利用基于深度循环神经网络对社交消息的传播过程进行建模,提出了SMOP(social messages outbreak prediction model based on recurrent neu...社交网络中,消息的爆发预测属于社交网络流行动态分析的范畴,是社会计算领域的研究热点之一.通过利用基于深度循环神经网络对社交消息的传播过程进行建模,提出了SMOP(social messages outbreak prediction model based on recurrent neural network)模型.与传统的基于机器学习的模型相比,SMOP直接对消息转发的到达过程进行建模,避免了传统方法中繁琐的特征工程;与基于点随机过程的模型相比,SMOP可以自动学习消息传播过程的速率函数,不需要手动定义消息传播速率的特征函数,具有较强的数据场景适应性.另外,SMOP采用了时间向量和用户向量的输入表示方法,将时间的周期性和用户的兴趣偏好建模到传播过程之中,提升了SMOP的预测效果.在Twitter和新浪微博数据集上的实验结果均表明,SMOP具有优良的数据适应能力,可以在消息传播的早期(0.5h),以较高的F1值预测某条社交消息是否爆发,验证了模型的有效性.展开更多
随着位置社交媒体的流行,用户移动行为数据得到极大丰富,推动了用户轨迹识别问题相关研究.该问题着眼于判定目标轨迹所属用户,有助于理解用户移动模式,促进个性化推荐等下游应用.目前已有方法通常尝试采用多分类方法解决该问题.然而,这...随着位置社交媒体的流行,用户移动行为数据得到极大丰富,推动了用户轨迹识别问题相关研究.该问题着眼于判定目标轨迹所属用户,有助于理解用户移动模式,促进个性化推荐等下游应用.目前已有方法通常尝试采用多分类方法解决该问题.然而,这些研究仍然面临着两个亟待解决的挑战:用户轨迹稀疏和类别数量庞大.其中,前者产生的原因在于用户常常只在社交媒体中发布部分访问地点信息,并且用户兴趣地点分布具有局部性;后者则是因为多分类方法下每个类别即代表一个用户,而用户数量庞大.为应对上述挑战,本文致力于有效利用轨迹时间戳序列和用户社交关系这两类被相关研究忽略的信息.一方面时间戳信息能够缓解轨迹稀疏性,另一方面社交关系可以通过刻画用户(类别)之间相关性帮助用户表示学习.为此,本文提出了融合神经时间点过程与图神经网络的新模型NTPP-GNN(Neural Temporal Point Process with Graph Neural Network),包含空间、时间、社交关系三个模块.空间模块中,双向循环神经网络用来刻画地点间序列性;时间模块中,本文提出双向神经时间点过程从正反两个方向捕捉时间连续性,并以此促进轨迹的时间表征;社交关系模块中,图神经网络用于传播和学习用户表示.NTPP-GNN采用端到端方式学习上述三个模块,以确保模块之间彼此适配.为验证NTPP-GNN的有效性,本文在三组数据集(Foursquare、Gowalla和Brightkite)上进行实验.结果表明:(1)NTPP-GNN性能比最好的基准方法在ACC@1上平均提高7.0%;(2)NTPP-GNN的各个模块对于性能均有贡献;(3)所提出的双向神经时间点过程相比于只考虑先后顺序的传统神经点过程方法能够带来额外提升.展开更多
文摘社交网络中,消息的爆发预测属于社交网络流行动态分析的范畴,是社会计算领域的研究热点之一.通过利用基于深度循环神经网络对社交消息的传播过程进行建模,提出了SMOP(social messages outbreak prediction model based on recurrent neural network)模型.与传统的基于机器学习的模型相比,SMOP直接对消息转发的到达过程进行建模,避免了传统方法中繁琐的特征工程;与基于点随机过程的模型相比,SMOP可以自动学习消息传播过程的速率函数,不需要手动定义消息传播速率的特征函数,具有较强的数据场景适应性.另外,SMOP采用了时间向量和用户向量的输入表示方法,将时间的周期性和用户的兴趣偏好建模到传播过程之中,提升了SMOP的预测效果.在Twitter和新浪微博数据集上的实验结果均表明,SMOP具有优良的数据适应能力,可以在消息传播的早期(0.5h),以较高的F1值预测某条社交消息是否爆发,验证了模型的有效性.
文摘随着位置社交媒体的流行,用户移动行为数据得到极大丰富,推动了用户轨迹识别问题相关研究.该问题着眼于判定目标轨迹所属用户,有助于理解用户移动模式,促进个性化推荐等下游应用.目前已有方法通常尝试采用多分类方法解决该问题.然而,这些研究仍然面临着两个亟待解决的挑战:用户轨迹稀疏和类别数量庞大.其中,前者产生的原因在于用户常常只在社交媒体中发布部分访问地点信息,并且用户兴趣地点分布具有局部性;后者则是因为多分类方法下每个类别即代表一个用户,而用户数量庞大.为应对上述挑战,本文致力于有效利用轨迹时间戳序列和用户社交关系这两类被相关研究忽略的信息.一方面时间戳信息能够缓解轨迹稀疏性,另一方面社交关系可以通过刻画用户(类别)之间相关性帮助用户表示学习.为此,本文提出了融合神经时间点过程与图神经网络的新模型NTPP-GNN(Neural Temporal Point Process with Graph Neural Network),包含空间、时间、社交关系三个模块.空间模块中,双向循环神经网络用来刻画地点间序列性;时间模块中,本文提出双向神经时间点过程从正反两个方向捕捉时间连续性,并以此促进轨迹的时间表征;社交关系模块中,图神经网络用于传播和学习用户表示.NTPP-GNN采用端到端方式学习上述三个模块,以确保模块之间彼此适配.为验证NTPP-GNN的有效性,本文在三组数据集(Foursquare、Gowalla和Brightkite)上进行实验.结果表明:(1)NTPP-GNN性能比最好的基准方法在ACC@1上平均提高7.0%;(2)NTPP-GNN的各个模块对于性能均有贡献;(3)所提出的双向神经时间点过程相比于只考虑先后顺序的传统神经点过程方法能够带来额外提升.