摘要
针对医疗热点问题,以新冠肺炎为例,详细刻画了数据从爬取到处理,再到分析的整个过程。首先,基于大数据思想,利用Python技术爬取数据;其次,提出将数据保存至云平台,实现低成本的数据保存和处理;最后,进行相关模型的数据分析,并进行可视化展示,通过实例分析对模型的有效性和可靠性进行验证。
In view of hot medical issues,this paper,by taking COVID-19 as an example,describes in detail the whole process of data from crawling to processing and then to analysis:firstly,Python technology is used to crawl data based on the idea of big data;secondly,the data is saved to the cloud platform to achieve low-cost data storage and processing;finally,the effectiveness and reliability of the model is verified through the example followed by visually displaying and analyzing the relevant data of the model.
作者
王诗莹
于亮
李伦彬
Wang Shiying;Yu Liang;Li Lunbin(School of Computer and Information Engineering,Heihe University,Heihe 164300,China;School of Management,Harbin University of Commerce,Harbin 150028,China)
出处
《黑河学院学报》
2023年第3期177-181,共5页
Journal of Heihe University
基金
黑龙江省科研业务费“基于云计算和区块链的医疗数据处理与保护关键技术研究”(2020-kyywf-0896)
黑龙江省普通本科高等学校青年创新人才培养计划“大数据背景下突发公共卫生事件应急体系构建——以新冠肺炎疫情为例”(UNPYSCT-2020081)
黑龙江省自然科学基金项目“大数据背景下自然灾害多源异构信息提取与知识发现研究”(YQ2019G004)。
关键词
云计算
医疗数据
新冠肺炎
数据爬取
cloud computing
healthcare data
covid-19
data crawling