长时间序列格点数据管理平台的设计与实践

Design and Practice of Long-Term Sequential Grid Data Management Platform

下载PDF

导出

摘要随着数值模式时空分辨率的提升,数据量急剧增加,长序列数据很难直接通过文件拷贝或者网络传输方式为用户提供数据服务。为此,笔者设计实现了一种分布式管理平台,该平台根据用户定制的数据需求,运用预报要素、空间范围、时间尺度等约束条件,抽取或根据区域参数裁剪指定气象要素,生成精简数据进行用户服务。该平台集成了搜索引擎、格点数据解码、内存数据库技术以及分布式框架,实现跨操作系统的统一接口调用和数据快速获取,有效解决用户访问长时间序列历史资料的难题。实验测试显示,该平台在格点数据管理规模和访问效率方面均表现出色。特别是在北京2022年冬季奥运会和冬残奥会气象保障服务中,该平台发挥了重要作用,展现了其实际应用的价值和潜力。 With the rapid development of numerical weather prediction services,the resolution and forecasting lead time of meteorological models have significantly improved,leading to an exponential growth in the volume of forecast data output.As a national meteorological model research and operational centre,CMA Earth System Modeling and Prediction Center(CEMC)currently produces daily gridded data outputs of 0.76 TB,with an annual output reaching 155.12 TB.Given the enormous data volumes,researchers’preferences for data access are evolving.Wagemann predicts that future scientific users increasingly prefer cloud platforms or other interfaces for data access rather than solely relying on downloads.To address these issues,this paper proposes a lightweight distributed parallel processing framework for gridded data management,aiming to streamline data management processes and enhance data access speed.The core design philosophy revolves around leveraging search engine technology for rapid metadata retrieval and gridded data decoding techniques for efficient data acquisition.To mitigate performance penalties from repetitive decoding,the framework decodes gridded data files once and supports multiple retrievals and extractions,significantly accelerating data access.Additionally,it supports cross-platform data access,facilitating easier data acquisition for researchers.The framework adopts a three-tier architecture:the data layer stores data,the algorithm layer implements core search and cataloguing algorithms,and the business layer interfaces directly with user needs.The framework implements crucial functions such as gridded data cataloguing,extraction,and clipping.During cataloguing,users invoke the cataloguing interface and input parameters(e.g.,original data file paths,index names,index types),and the system automatically parses file metadata and generates indexes.For data extraction,users call the retrieval interface with specific parameters to obtain designated data.Moreover,the framework supports precise extraction of spe

作者贾晓振胡江凯王大鹏梁晨 JIA Xiaozhen;HU Jiangkai;WANG Dapeng;LIANG Chen(CMA Earth System Modeling And Prediction Center,Beijing 100080)

机构地区中国气象局地球系统数值预报中心

出处《气象科技》 2024年第6期797-806,共10页 Meteorological Science and Technology

关键词分布式架构搜索引擎数值预报业务内存数据库数据检索跨平台 distributed architecture search engine numerical prediction business in-memory database data retrieval cross-platform

分类号 P409 [天文地球—大气科学及气象学]

引文网络
相关文献

参考文献31

1沈学顺,王建捷,李泽椿,陈德辉,龚建东.中国数值天气预报的自主创新发展[J].气象学报,2020,78(3):451-476. 被引量：71
2赵宗慈,罗勇,黄建斌.从检验CMIP5气候模式看CMIP6地球系统模式的发展[J].气候变化研究进展,2018,14(6):643-648. 被引量：28
3袁林旺,闾国年,谢志仁,董华军,俞肇元,孙健.地球系统科学数据共享网的气候-海面变化数据集建设[J].地球信息科学,2008,10(1):1-6. 被引量：4
4Julia Wagemann,Oliver Clements,Ramiro Marco Figuera,Angelo Pio Rossi,Simone Mantovani.Geospatial web services pave new ways for server-based on-demand access and processing of Big Earth Data[J].International Journal of Digital Earth,2018,11(1):7-25. 被引量：3
5王兵,李杰.基于通用模型的GRIB格式数据读取技术[J].航空计算技术,2018,48(6):96-101. 被引量：4
6肖华东,孙婧,张玺,卞晓丰.MARS软件在数值预报模式产品数据管理中的应用[J].应用气象学报,2015,26(2):247-256. 被引量：8
7李永生,李高洁,陈逸智,张光宇.高频精细化气象格点数据实时处理系统设计与实现[J].气象科技,2022,50(6):776-782. 被引量：4
8吴秀芸,王海江,梁寒冬.轻量级空间数据引擎的应用研究[J].地理空间信息,2017,15(12):48-50. 被引量：2
9何险峰,马力,罗永康.分布式气象内容管理系统设计[J].气象科技,2013,41(6):1036-1042. 被引量：12
10王甫棣,王帅,赵希鹏.基于ElasticSearch的异构数据迁移方法[J].气象科技,2022,50(1):45-50. 被引量：8

二级参考文献330

1白云霄,钱峰,刘俊磊,鲍威,时侠圣.一种与初始态无关的分布式电力调度算法[J].中国电机工程学报,2019,39(S01):30-35. 被引量：7
2胡洋.基于深度学习的SDN虚拟蜜网路由优化[J].计算机系统应用,2020(10):274-279. 被引量：3
3梁强升.城市轨道交通线网运营管理指挥中心建设与管理方案研究[J].都市快轨交通,2020,33(1):127-133. 被引量：18
4陈辉,王守忠,杜成林,赵洪升,张艳春,王黎晖.基于B/S架构的气象科技管理信息系统[J].气象科技,2005,33(S1):165-168. 被引量：15
5查石祥.NetCDF数据的编程式访问[J].气象科技,2004,32(z1):40-43. 被引量：24
6乔云亭,谢逸.GRIB数据及其在GrADS中的使用[J].广东气象,2001,23(3):25-27. 被引量：8
7刘小珠,孙莎,曾承,彭智勇.基于缓存的倒排索引机制研究[J].计算机研究与发展,2007,44(z3):153-158. 被引量：8
8WANG Bin, WAN Hui, Jl Zhongzhen, ZHANG Xin, YU Rucong, YU Yongqiang & LIU HongtaoState Key Laboratory of Numerical Modeling for Atmospheric Sciences and Geophysical Fluid Dynamics, Institute of Atmospheric Physics, Chinese Academy of Sciences, Beijing 100029, China,Department of Computational Mathematics, Academy of Mathematics and System Sciences, Peking University, Beijing 100871, China.Design of a new dynamical core for global atmospheric models based on some efficient numerical methods[J].Science China Mathematics,2004,47(z1):4-21. 被引量：93
9张铭,王富章,李平.城市轨道交通网络化运营辅助决策与应急平台[J].中国铁道科学,2012,33(1):113-120. 被引量：26
10纪立人.数值天气预报发展进程中若干亮点的回顾及其启迪[J].气象科技进展,2011,1(1):40-43. 被引量：8

共引文献943

1樊浩,王伟,王金成,韩威.面向同化应用的红外高光谱探测资料局地综合通道选择方案及在FY-3D/HIRAS中的初步应用[J].热带气象学报,2022,38(5):715-730. 被引量：2
2甄廷忠,江龙,段燕楠,王菲.基于昆明市精细化GIS的天气雷达标准格式基数据应用[J].气象科技,2020,0(1):59-67. 被引量：10
3史小康,胡艳冰,王攀峰,张文军,刘博.平流层准零风层的研究进展[J].地球科学进展,2023,38(9):916-930.
4侯贵法,罗颖.基于SOA的数字气田应用集成[J].安阳工学院学报,2007,6(4):54-56. 被引量：1
5贺新闻.基于可复用构件MIS开发模式探讨[J].中国管理信息化（综合版）,2006,9(10):14-16. 被引量：3
6崔晓东,王莉萍,王国宁,冯天卿.基于VB的电视天气预报等值线绘制分析软件开发[J].气象科技,2008,36(5):670-672. 被引量：4
7岳昆,刘惟一,李维华,姚宇.基于马尔可夫覆盖的Web服务发现[J].计算机研究与发展,2007,44(z3):40-44.
8刘苒苒.基于移动Agent的Web服务安全访问机制研究[J].装备维修技术,2007(4):14-18.
9刘子栋,郭忠文,管旭.面向海洋观测与模式数据的客户端软件设计与实现[J].中国海洋大学学报（自然科学版）,2012,42(S1):199-203. 被引量：1
10王有刚.基于语义Web服务发现和组合的研究[J].宁夏工程技术,2013,12(4):310-314. 被引量：1

1陈静,李晓莉,邓国,高丽,李红祺.全球/区域集合预报关键技术研发与业务应用[J].科技成果管理与研究,2023(5):66-67.
2张智,赵玉广,焦亚音,李二杰.基于随机森林算法的石家庄市首要污染物分类预报技术研究[J].环境科学与管理,2023,48(8):94-98.
3罗布坚参,吉律,边玛拉珍,央吉次仁,次仁白玛,衡志炜.2017—2021年西藏高原SWC-WARMS模式降水预报产品的检验与评估[J].气象与环境学报,2024,40(4):46-53.
4孙博.通信技术与网络传输方式的分析[J].中国科技经济新闻数据库教育,2016(12):291-291.
5杨建兴,费科锋,潘贤,叶见青.综合医院网络两地三中心传输方案设计[J].网络安全和信息化,2024(9):94-95.
6温占卿,毛伊敏,彭喆.基于CPBOA的并行DCNN优化算法[J].计算机工程与设计,2024,45(11):3296-3303.
7陆天舒,孙鑫,陈昊明,李普曦,朱峰,霍庆,周佰铨,杨琳韵.区域高分辨率数值预报检验评估系统[J].气象科技进展,2024,14(1):32-37.
8黄颖茜,李芳.基于凸优化的无人船避障路径优化研究[J].中阿科技论坛（中英文）,2024(11):88-92.
9游超,钟继祥,张菡,王翔,李奇穗.现代杂交水稻制种气象保障服务体系构建[J].安徽农学通报,2024,30(21):99-103.
10郭馨.医院数据存储平台关键技术研究[J].软件,2023,44(12):104-106.

气象科技

2024年第6期

浏览历史

内容加载中请稍等...

长时间序列格点数据管理平台的设计与实践

参考文献31

二级参考文献330

共引文献943

相关作者

相关机构

相关主题

浏览历史