基于Spark/HBase的交通流数据存储及索引模型探讨被引量：6

Discussion on the Data Storage and Index Model of Traffic Flow Based on Spark/HBase

下载PDF

导出

摘要为了对海量增长的交通流数据进行处理和管理,需要基于大数据框架设计更加高效的数据存储及索引模型,以满足智能交通应用的需求。该文设计了基于Spark/HBase的系统架构以及基于混合时空编码行键和动态扩展属性列族的交通流数据存储及索引模型,并在此模型基础上,通过语义解析、时空行键索引查询、并行属性条件过滤实现交通流大数据高效语义查询。对比实验证明,该文设计的交通流大数据并行处理框架在清洗、索引和存储数据时运算高效,构建的混合时空编码行键索引时空权重均衡,能够实现更加高效的交通流大数据访存管理,可为智能交通应用提供技术基础。 In order to process and manage traffic flow data with massive growth,it is necessary to design an efficient data storage and index model based on big data framework to meet the needs of intelligent transportation applications.This paper designs a system framework based on Spark/HBase,and a traffic flow data storage and index model based on mixed spatial-time RowKey and dynamically extended attribute column family.On the basis of this model,efficient semantic query of traffic flow big data is realized through semantic analysis,spatial-time RowKey index query and parallel attribute condition filtering.The comparison experiment proves that the traffic flow big data parallel processing framework designed in this paper is efficient in cleaning,indexing and storing data.The spatial-time weight of mixed spatial-time RowKey index is balanced.This method can achieve more efficient traffic flow data access and storage management,and can establish the technical foundation for the intelligent transportation application.

作者李欣 LI Xin(Collaborative Innovation Center of Three-Aspect Coordination of Central Plain Economic Region,Henan University of Economics and Law,Zhengzhou 450046;College of Resource and Environment, Henan University of Economics and Law,Zhengzhou 450046,China)

机构地区河南财经政法大学中原经济区"三化"协调发展河南省协同创新中心河南财经政法大学资源与环境学院

出处《地理与地理信息科学》 CSCD 北大核心 2019年第4期1-8,共8页 Geography and Geo-Information Science

基金国家自然科学基金项目(41771445、41871159) 河南财经政法大学博士科研基金项目(800257)

关键词 SPARK HBASE 交通流时空编码行键语义查询 Spark HBase traffic flow spatial-time RowKey semantic query

分类号 P208 [天文地球—地图制图学与地理信息工程] TP311.13 [天文地球—测绘科学与技术]

引文网络
相关文献

参考文献19

1龚俊,柯胜男,朱庆,张叶廷.一种集成R树、哈希表和B^*树的高效轨迹数据索引方法[J].测绘学报,2015,44(5):570-577. 被引量：19
2邓清清..交通诱导系统的流量预测和路径优化并行算法研究[D].大连理工大学,2008:
3李德仁.展望大数据时代的地球空间信息学[J].测绘学报,2016,45(4):379-384. 被引量：181
4赵卓峰,丁维龙,张帅.海量车牌识别数据集上基于时空划分的旅行时间计算方法[J].电子学报,2016,44(5):1227-1233. 被引量：7
5罗乐,刘轶,钱德沛.内存计算技术研究综述[J].软件学报,2016,27(8):2147-2167. 被引量：32
6李冬,房俊.基于HBase的交通数据区域查询方法[J].计算机与数字工程,2017,45(2):230-234. 被引量：4
7孙艳华,王丽娜.一种面向流数据的分布式实时存储方法[J].电脑知识与技术,2015,0(7):5-6. 被引量：1
8陆锋,周成虎.一种基于Hilbert排列码的GIS空间索引方法[J].计算机辅助设计与图形学学报,2001,13(5):424-429. 被引量：27
9李德仁,马军,邵振峰.论时空大数据及其应用[J].卫星应用,2015,0(9):7-11. 被引量：72
10金安,程承旗,宋树华,陈波.基于Geohash的面数据区域查询[J].地理与地理信息科学,2013,29(5):31-35. 被引量：57

二级参考文献298

1金澈清,钱卫宁,周傲英.流数据分析与管理综述[J].软件学报,2004,15(8):1172-1181. 被引量：161
2肖伟器,吴恒山,冯玉才.空间对象管理系统结构与模型[J].计算机科学,1993,20(3):46-49. 被引量：4
3陈军.多维动态地理空间框架数据的构建[J].地球信息科学,2002,4(1):7-13. 被引量：32
4耿彦斌,于雷,赵慧.ITS数据质量控制技术及应用研究[J].中国安全科学学报,2005,15(1):82-87. 被引量：22
5张敬磊,王晓原.交通事件检测算法研究进展[J].武汉理工大学学报（交通科学与工程版）,2005,29(2):215-218. 被引量：56
6李德仁,沈欣.论智能化对地观测系统[J].测绘科学,2005,30(4):9-11. 被引量：55
7尹章才,李霖.基于快照-增量的时空索引机制研究[J].测绘学报,2005,34(3):257-261. 被引量：27
8李霖.复合目标的赋值──聚合操作[J].武汉测绘科技大学学报,1995,20(3):214-218. 被引量：4
9张冬冬,李建中,王伟平,郭龙江.数据流历史数据的存储与聚集查询处理算法[J].软件学报,2005,16(12):2089-2098. 被引量：17
10王晓原,刘海红.基于投影寻踪自回归的短时交通流预测[J].系统工程,2006,24(3):20-24. 被引量：18

共引文献556

1张明剑,冷盛峰,饶丹,徐向东,郑孝强.大数据道路监测管理平台的应用研究[J].运输经理世界,2021(23):81-83. 被引量：2
2杜鑫,钟若飞,李清扬,杨灿坤.遥感图像星上智能处理地面仿真模拟系统设计与实现[J].遥感技术与应用,2022,37(5):1198-1208.
3张嘉,白晓飞,陶超,张小桐.大规模空间矢量数据分布式存储与计算优化[J].计算机系统应用,2020,29(12):251-256. 被引量：6
4张勇,杨春,鲍思宇,贾旭,石伟嘉,赵玉宏.乌海及周边地区矿山地质环境空天地一体化监测技术方法研究[J].西部资源,2023(5):128-129. 被引量：1
5王立娜,唐川,徐婧.未来芯片技术发展态势分析[J].世界科技研究与发展,2020,42(1):47-56. 被引量：5
6薛冰,李京忠,肖骁,谢潇,庞敏,姜璐,逯承鹏,任婉侠.基于大数据的城市人地关系分析与应用计算平台——2018年中国地理学会地理大数据计算环境“优秀实用案例”[J].全球变化数据学报（中英文）,2018(3):290-294. 被引量：5
7宋冰,龙毅,张翎,阮陵,葛军莲.旅游时空大数据:概念、分类与应用[J].现代测绘,2020,43(6):14-18. 被引量：1
8刘一流.一种面向智能交通场景的HBase时空索引设计[J].电脑知识与技术,2020,0(4):163-165. 被引量：1
9王岩.加快信息化建设发挥大数据作用让城市在重大公共卫生事件中获得更多“免疫力”[J].产业科技创新,2020,2(31):102-103. 被引量：1
10涂伟,夏吉喆,汪驰升,陆旻,乐阳.面向智慧城市的空间计算与分析类课程教学模式探索与实践[J].测绘地理信息,2022,47(S01):14-17.

同被引文献43

1张明波,陆锋,申排伟,程昌秀.R树家族的演变和发展[J].计算机学报,2005,28(3):289-300. 被引量：95
2赵园春,李成名,赵春宇.基于R树的分布式并行空间索引机制研究[J].地理与地理信息科学,2007,23(6):38-41. 被引量：11
3田兰,金石声,李波,卜英竹,李珏.基于XML和正则表达式的气象数据处理系统[J].计算机科学,2013,40(11A):432-435. 被引量：4
4唐海东,武延军.分布式同步系统Zookeeper的优化[J].计算机工程,2014,40(4):53-56. 被引量：15
5李峰,秦世广,周薇,徐鸣一,张乐坚,周青,夏元彩,曹婷婷,梁海河.综合气象观测运行监控业务及系统升级设计[J].气象科技,2014,42(4):539-544. 被引量：42
6钱峥,曹艳艳,赵科科,许皓皓.私有云在市级气象业务平台的实现与应用[J].气象科技,2014,42(4):641-646. 被引量：27
7陆婷,房俊,乔彦克.基于HBase的交通流数据实时存储系统[J].计算机应用,2015,35(1):103-107. 被引量：26
8梁其洋,吴保国,赵春江,郝星耀,潘瑜春.分布式空间数据服务两级检索方法研究[J].地理与地理信息科学,2017,33(2):7-11. 被引量：7
9张栗粽,崔园,罗光春,陈爱国,卢国明,王晓雪.面向大数据分布式存储的动态负载均衡算法[J].计算机科学,2017,44(5):178-183. 被引量：25
10李莉,王小刚.基于Spark的并行K-means气象数据挖掘研究[J].信息技术,2017,41(9):26-30. 被引量：7

引证文献6

1柳倩倩.现代计算机常用数据结构和算法分析[J].花炮科技与市场,2019,0(4):10-11. 被引量：2
2施炤.基于Spark Streaming的实时数据处理系统设计与实现[J].现代信息科技,2020,4(20):10-12. 被引量：6
3孙乐乐,金宝轩.基于NoSQL的分布式R*树索引构建与应用研究[J].地理与地理信息科学,2021,37(5):9-15. 被引量：2
4曾熠,刘丽华,杜溢墨,李鸿飞,黄宏斌.面向海量存储的高效元数据均衡研究[J].现代科学仪器,2022,39(3):205-208.
5马彬,李玉涛,许琪.基于Spark Streaming的气象自动站实时流处理与存储系统[J].计算机技术与发展,2023,33(3):207-214. 被引量：1
6李悦艺,张丰,杜震洪,刘仁义.基于LSM-OCTree的时空流分布式调度和存储方案[J].浙江大学学报（理学版）,2023,50(2):204-212.

二级引证文献10

1沈子祺.C++语言在数据结构中的运用分析[J].信息与电脑,2020,32(13):34-36.
2赵杨,杨彬,董姝仪,王森.多源大数据驱动的移动图书馆个性化推荐系统设计与实现[J].图书馆学研究,2021(11):20-31. 被引量：28
3武文斌.基于NoSQL数据库的铁路通信数字工程存储研究[J].铁路技术创新,2022(1):41-46. 被引量：1
4马海昕.基于Spark的遥感数据索引系统的设计[J].信息记录材料,2022,23(8):192-194.
5李程文.基于Spark的设备状态数据实时处理系统设计[J].无线互联科技,2022,19(24):68-70. 被引量：1
6马彬,李玉涛,许琪.基于Spark Streaming的气象自动站实时流处理与存储系统[J].计算机技术与发展,2023,33(3):207-214. 被引量：1
7吕熹.基于气候智能预测的计算机软件应用设计[J].信息与电脑,2023,35(6):165-168.
8张俊丽.基于大数据的设备能耗异常分析模型研究[J].自动化与仪器仪表,2023(6):31-34.
9王沙沙.实时数据处理轻量化应用程序的设计与实现[J].漯河职业技术学院学报,2023,22(4):28-32. 被引量：1
10李洁,王英明,许青,张露露.面向岗位能力匹配的多关键词编码MPB-Tree索引技术[J].信息工程大学学报,2023,24(5):567-571.

1关勇,张明昭,黄舰,肖欣然,高威,孙鹏,赵涵.浅谈物联网技术在智能交通中的应用[J].市场周刊·理论版,2019(16):166-167.
2王川,曾国荪,丁春玲,覃如符.基于Hbase的海底监测视频大数据存储方法[J].计算机科学与应用,2019,9(7):1453-1464.
3党伟滔.基于VISSIM仿真的交通组织优化研究[J].青海交通科技,2019,31(2):27-30. 被引量：3
4苗佳,赵永来.轿车流线型曲面缺陷的图像识别与检测方法研究[J].现代电子技术,2017,40(20):95-97. 被引量：2
5余鉴文,刘强.基于AIS数据的辽东浅滩船舶通航情况分析[J].广州航海学院学报,2019,27(2):29-32.
6宋楠,阮彬,叶显严.四相位信号交叉口的自适应控制研究[J].青海交通科技,2019,31(2):16-20. 被引量：1
7邹宇平,符愉欣,吕海燕.基于大数据平台比价策略的旅游价格选择设计优化研究[J].数码设计,2018,7(19):10-11. 被引量：1
8邓晶,张倩.基于数据挖掘技术的交通流预测模型[J].计算机系统应用,2019,28(7):114-120. 被引量：4

地理与地理信息科学

2019年第4期

浏览历史

内容加载中请稍等...

基于Spark/HBase的交通流数据存储及索引模型探讨被引量：6

参考文献19

二级参考文献298

共引文献556

同被引文献43

引证文献6

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于Spark/HBase的交通流数据存储及索引模型探讨 被引量：6

参考文献19

二级参考文献298

共引文献556

同被引文献43

引证文献6

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于Spark/HBase的交通流数据存储及索引模型探讨被引量：6