摘要
网络爬虫是一种按照一定的规则,自动地抓取网页信息的程序或者脚本,因此编写特定的网络爬虫可以用来对网页进行自动化处理,从而达到提升工作效率的目的。文章针对同一个任务清单系统,分别使用BeautifulSoup+requests和selenium两种不同的爬虫方法实现了网页自动化处理功能。并且通过对两种方法的实现原理和运行结果进行分析,对两种爬虫方法进行对比。
Web crawler is a program or script that automatically grabs web page information according to certain rules.Therefore,a specific web crawler can be written to process web pages automatically,which provides efficiency improvement.The paper uses two different crawler methods:BeautifulSoup+requests and selenium to implement webpage automatic processing function for the same task list system.By analyzing the implementation principle and operation results of the two methods,the two crawler methods are compared.
作者
李晨昊
LI Chenhao(Wuhan Branch of China Mobile Hubei Co.,Ltd.,Wuhan 430000,China)
出处
《现代信息科技》
2021年第16期10-12,18,共4页
Modern Information Technology