基于网络爬虫的青花瓷文物图像数据集设计与构建

Design and Construction of Blue-and-White Porcelain Image Dataset Based on Web Crawler

下载PDF

导出

摘要深度学习模型结构复杂,利用其进行图像分类需要庞大的数据量,图像数据集的规模和质量直接影响模型的效果,同时人工获取文物图像时,存在诸多不便。该文利用网络爬虫技术在故宫博物院官网批量获取不同年代的青花瓷文物图像,大大提高工作效率,然后对获取的文物图像进行全方位的分析和处理,为用户之后进行不同年代的青花瓷图像分类提供数据源。 The structure of deep learning model is complex.Using it for image classification requires a huge amount of data.The scale and quality of image data set directly affect the effect of the model.At the same time,there are many inconveniences when manually obtaining cultural relic images.Through web crawler,we obtained images of blue-and-white porcelain from various dynasties in batch from Palace Museum official website,which greatly improves efficiency.We conduct an all-around analysis and processing of these images,thereby provide a data source for any users when classifying blue-and-white porcelain images from different dynasties.

作者郭丽胡志恒赵恒谦张瑞彬吴瑞翔高振肖珂珂 GUO Li;HU Zhiheng;ZHAO Hengqian;ZHANG Ruibin;WU Ruixiang;GAO Zhen;XIAO Keke(College of Geoscience and Surveying Engineering,China University of Mining&Technology(Beijing),Beijing,100083 China)

机构地区中国矿业大学(北京)地球科学与测绘工程学院

出处《科技资讯》 2021年第22期15-18,共4页 Science & Technology Information

基金国家自然科学基金项目(项目编号:41701488) 国家大学生创新训练项目(项目编号:C202002169) 中央高校基本科研业务费专项资金(项目编号:2021YJSDC16)。

关键词网络爬虫青花瓷文物数据裁剪数据增强数据集构建 Web crawler Blue-and-white porcelain Data clipping Data augmentation Dataset construction

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1曾铭杰.基于深度学习的陶瓷类目识别[J].电脑知识与技术,2021,17(13):174-175. 被引量：1
2张楠.Python语言及其应用领域研究[J].科技创新导报,2019,16(17):122-123. 被引量：5
3吴道君.大数据背景python在网络爬虫框架中的应用[J].科学技术创新,2021(21):97-99. 被引量：4
4陶卫卫.Python爬虫的Cookie反爬应对策略研究[J].信息与电脑,2021,33(8):189-192. 被引量：1
5赵涵原.基于Python爬虫的书籍数据可视化分析[J].电子技术与软件工程,2021(14):178-179. 被引量：2

二级参考文献21

1张瑞兴,张翠梅.Cookie和Session机制的初步探讨[J].考试周刊,2008,0(36):170-171. 被引量：3
2姜晗,任翠池,王磊.基于Cookie和Session的身份认证机制的研究与实现[J].中国教育技术装备,2014(4):36-37. 被引量：4
3官思发,孟玺,李宗洁,刘扬.大数据分析研究现状、问题与对策[J].情报杂志,2015,34(5):98-104. 被引量：73
4邹科文,李达,邓婷敏,李嘉振,陈义明.网络爬虫针对“反爬”网站的爬取策略研究[J].电脑知识与技术,2016,0(3):61-63. 被引量：15
5万丽华.在PHP中浅谈Cookie与Session[J].现代工业经济和信息化,2016,6(23):83-84. 被引量：3
6苏国新,苏聿.基于Python的可配置网络爬虫[J].宁德师范学院学报（自然科学版）,2018,30(4):364-368. 被引量：12
7陈欢,黄勃,刘文竹,高永彬,姜晓燕.基于Python的网络新闻爬虫与检索[J].软件导刊,2019,18(5):168-171. 被引量：10
8李培.基于Python的网络爬虫与反爬虫技术研究[J].计算机与数字工程,2019,47(6):1415-1420. 被引量：51
9蔡振海,张静.基于python的网络爬虫系统的设计与实现[J].电脑知识与技术,2019,15(8Z):36-37. 被引量：9
10孙建言,马雨欣,武文杰.基于Python的网络爬虫系统[J].电脑知识与技术,2019,15(9Z):61-63. 被引量：2

共引文献7

1白昌盛.Python编程特点及优势研究[J].电子测试,2020,31(18):125-126. 被引量：5
2王照.Python语言编程特点及应用[J].电脑编程技巧与维护,2021(3):19-20. 被引量：11
3何燕翡,梁鉴如.基于电感及红外传感器的硬币辅助回收系统设计[J].磁性材料及器件,2021,52(4):78-82.
4高雅婷,刘雅举.基于Python的网上购物数据爬取[J].现代信息科技,2021,5(16):26-31. 被引量：1
5于学斗,柏晓钰.基于Python的城市天气数据爬虫程序分析[J].办公自动化,2022,27(7):10-13. 被引量：10
6陈红阳,孙宝刚,何盈盈,邱红艳.“Python 程序设计”课程思政元素探析与应用[J].电脑与信息技术,2022,30(6):114-118. 被引量：4
7江琴.Python语言在大数据分析中的应用设计[J].信息记录材料,2023,24(11):88-90.

1崔晓晖,陈民,陈志泊,许福,王新阳.基于注意力机制的林木物候期识别方法[J].中南林业科技大学学报,2021,41(7):11-19. 被引量：5

科技资讯

2021年第22期

浏览历史

内容加载中请稍等...

基于网络爬虫的青花瓷文物图像数据集设计与构建

参考文献5

二级参考文献21

共引文献7

相关作者

相关机构

相关主题

浏览历史