摘要
深度学习模型结构复杂,利用其进行图像分类需要庞大的数据量,图像数据集的规模和质量直接影响模型的效果,同时人工获取文物图像时,存在诸多不便。该文利用网络爬虫技术在故宫博物院官网批量获取不同年代的青花瓷文物图像,大大提高工作效率,然后对获取的文物图像进行全方位的分析和处理,为用户之后进行不同年代的青花瓷图像分类提供数据源。
The structure of deep learning model is complex.Using it for image classification requires a huge amount of data.The scale and quality of image data set directly affect the effect of the model.At the same time,there are many inconveniences when manually obtaining cultural relic images.Through web crawler,we obtained images of blue-and-white porcelain from various dynasties in batch from Palace Museum official website,which greatly improves efficiency.We conduct an all-around analysis and processing of these images,thereby provide a data source for any users when classifying blue-and-white porcelain images from different dynasties.
作者
郭丽
胡志恒
赵恒谦
张瑞彬
吴瑞翔
高振
肖珂珂
GUO Li;HU Zhiheng;ZHAO Hengqian;ZHANG Ruibin;WU Ruixiang;GAO Zhen;XIAO Keke(College of Geoscience and Surveying Engineering,China University of Mining&Technology(Beijing),Beijing,100083 China)
出处
《科技资讯》
2021年第22期15-18,共4页
Science & Technology Information
基金
国家自然科学基金项目(项目编号:41701488)
国家大学生创新训练项目(项目编号:C202002169)
中央高校基本科研业务费专项资金(项目编号:2021YJSDC16)。
关键词
网络爬虫
青花瓷文物
数据裁剪
数据增强
数据集构建
Web crawler
Blue-and-white porcelain
Data clipping
Data augmentation
Dataset construction