-
题名面向海量公交刷卡数据的站点客流分析方法
被引量:4
- 1
-
-
作者
曹娅琪
丁维龙
-
机构
北方工业大学数据工程研究院
大规模流数据集成与分析技术北京市重点实验室
-
出处
《计算机与数字工程》
2017年第2期247-253,共7页
-
基金
北京市教育委员会科技计划面上项目(编号:KM2015_10009007)
北京市优秀人才培养资助青年骨干个人项目(编号:2014000020124G011)资助
-
文摘
公交行业的发展,产生了海量多元的公交IC卡刷卡数据,为行业应用提供快速、准确的站点客流量统计一直是智能公交建设的重点。以往对客流量的研究只是进行了简单的数据统计,准确度不高,提出的并行算法在海量数据规模下不具备水平扩展能力。针对此问题,论文通过分析海量多元数据的特征,面向公交刷卡数据提出了一种刷卡时间的聚类方法,不仅可在分钟级完成一周数据的计算,并根据换乘的时间差和距离规则约束提高了计算的准确性。论文工作在Hadoop MapReduce上进行了实现,分时客流量的计算方面随数据规模增大具有可扩展性,单位数据规模的计算执行时间保持相对稳定,并且分析结果具有较高的准确性。
-
关键词
公交数据
海量数据
站点上下车客流量
站点换乘客流量
-
Keywords
bus card data
massive data
passenger flow include get on/off bus in bus station
transfer passenger flow in bus station
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-