基于Python对豆瓣电影数据爬虫的设计与实现
被引量:10
摘要
本文基于Python实现了网络爬虫豆瓣电影模块的数据信息,可以根据爬虫得到的信息进行相关的市场分析,具有一定的商业价值。
出处
《电子技术与软件工程》
2019年第13期176-177,共2页
ELECTRONIC TECHNOLOGY & SOFTWARE ENGINEERING
二级参考文献32
-
1EHRIG M, MAEDCHE A. Ontology-focused crawling of Web documents[A]. Proceedings of the 2003 ACM symposium on Applied computing[C], March 2003. 被引量:1
-
2GUO Q, GUO H, ZHANG ZQ, et al. Schema Driven Topic Specific Web Crawling[A]. DASFAA[C], 2005. 被引量:1
-
3GRAUPMANN J, BIWER M, ZIMMER C, et al. COMPASS: A Concept-based Web Search Engine for HTML, XML, and Deep Web Data[A]. Proceedings of the 30th VLDB Conference[C],2004. 被引量:1
-
4QIN JL, ZHOU YL, CHAU M. Building domain-specific web collections for scientific digital libraries: a meta-search enhanced focused crawling method[A]. Proceedings of the 4th ACM/IEEE-CS joint conference on Digital libraries[C], June 2004. 被引量:1
-
5CHO J , GARCIA - MOLINA H , PAGE L . Efficient crawling through URL ordering[A]. Proceedings of the seventh international conference on World Wide Web 7[C], April 1998. 被引量:1
-
6FLORESCU D, LEVY AY, MENDELZON AO. Database techniques for the world-wide web: A survey[J]. SIGMOD Record, 1998,27(3) :59 -74. 被引量:1
-
7LAWRENCE S, GILES CL. Searching the World Wide Web[J].Science, 1998,280(5360):98. 被引量:1
-
8CHAKRABARTI S, VAN DEN BERG M, DOM B. Focused crawling: A new approach to topicspecific web resource discovery[A].Proceedings of the Eighth International World-Wide Web Conference[C], 1999. 被引量:1
-
9DAVULCU H, KODURI S, NAGARAJAN S. Datarover: a taxonomy based crawler for automated data extraction from data-intensive websites[A]. Proceedings of the 5th ACM international workshop on Web information and data management[C], November 2003. 被引量:1
-
10AGGARWAL CC. Collaborative Crawling: Aggarwal C. Collaborative crawling: mining user experiences for topical resource discovery [A]. Proceedings of the eighth ACM SIGKDD international conference on Knowledge discovery and data mining[C], July 2002. 被引量:1
共引文献253
-
1沈承放,莫达隆,黄文韬.网页数据采集算法及在住户调查中的应用[J].统计与决策,2021(7):52-56. 被引量:5
-
2齐虎春.高职化工院校网络化工数据采集课程实践研究[J].内蒙古石油化工,2020,46(10):88-90. 被引量:1
-
3谈帅,唐天琪,高雅.网络众源地理信息获取与整合方法研究[J].现代测绘,2021(2):53-58.
-
4梁晶,陈中元,张永宏,唐明灯.基于Python语言的“网络攻防技术”课程教学改革探索[J].中国多媒体与网络教学学报(电子版),2020(14):48-50. 被引量:3
-
5项博良,唐淳淳,钱前,曹健东.基于网络爬虫的就业数据分析[J].智能计算机与应用,2020,10(1):223-226. 被引量:4
-
6杨学明,刘柏嵩.主题爬虫在数字图书馆中的应用[J].图书馆杂志,2007,26(8):47-50. 被引量:3
-
7张丽莎,张贵,龙朝夕,张盛.林业专题动态信息的搜索与集成[J].中南林业科技大学学报,2013,33(5):47-51. 被引量:3
-
8胡宏涛,常佳.基于网络的信息获取技术浅析[J].福建电脑,2006,22(4):60-61. 被引量:4
-
9李刚,周立柱,郭奇,林玲.领域相关的Web网站抓取方法[J].计算机科学,2007,34(2):137-140. 被引量:5
-
10孙素芬,罗长寿,张峻峰,于峰,张树亮.农业信息资源整合系统研究与应用[J].安徽农业科学,2007,35(22):6993-6994. 被引量:3
同被引文献44
-
1路雪珂.基于文本挖掘方法的微博谣言传播情绪框架研究[J].新闻传播,2020(23):9-10. 被引量:1
-
2陈方,谭爱平,成亚玲,文益民.主题爬虫技术研究综述[J].湖南工业职业技术学院学报,2008,8(5):13-16. 被引量:6
-
3于娟,刘强.主题网络爬虫研究综述[J].计算机工程与科学,2015,37(2):231-237. 被引量:103
-
4陆敏.纪录片艺术性的受众解读初探——基于张以庆纪录片“豆瓣影评”的分析[J].现代传播(中国传媒大学学报),2016,38(6):103-106. 被引量:3
-
5花君林.基于Selenium的Python网络爬虫的实现[J].电脑编程技巧与维护,2017(15):30-31. 被引量:17
-
6姜霖,张麒麟.基于评论情感分析的个性化推荐策略研究——以豆瓣影评为例[J].情报理论与实践,2017,40(8):99-104. 被引量:36
-
7田帅.基于python抓取豆瓣电影TOP250的数据及进行分析[J].通讯世界,2018,0(10):261-262. 被引量:1
-
8杨国志,江业峰.基于python的聚焦网络爬虫数据采集系统设计与实现[J].科学技术创新,2018(27):73-74. 被引量:16
-
9董日壮,郭曙超.网络爬虫的设计与实现[J].电脑知识与技术(过刊),2014,20(6X):3986-3988. 被引量:10
-
10陈乐.基于Python的网络爬虫技术[J].电子世界,2018,0(16):163-163. 被引量:14
引证文献10
-
1成文莹,李秀敏.基于Python的电影数据爬取与数据可视化分析研究[J].电脑知识与技术,2019,15(11):8-10. 被引量:14
-
2侯洁茹,吕继续.基于Python的天猫商品爬虫技术[J].科技资讯,2019,17(32):10-10. 被引量:4
-
3史媛.针对空气质量指数爬虫的设计与实现[J].信息记录材料,2020,21(4):165-166. 被引量:1
-
4张荑阳,毛红霞.基于python的豆瓣电影数据采集与分析可视化[J].电子制作,2021,29(16):47-49. 被引量:4
-
5胡庆伟.基于Python的网络数据定时自动采集工具的设计[J].电子技术与软件工程,2021(21):147-148. 被引量:2
-
6冯晓磊.基于Python的拉勾网网络爬虫设计与实现[J].现代信息科技,2023,7(6):85-87. 被引量:4
-
7闫语.基于网络爬虫的观影大数据采集和分析[J].电子技术与软件工程,2023(6):238-241. 被引量:2
-
8古志敏,吴明珠.基于Python网络爬虫设计与实现[J].电脑编程技巧与维护,2023(9):163-166. 被引量:9
-
9蓝梓钰.基于Python技术的电影《白蛇传·情》豆瓣短评文本挖掘与可视化分析[J].文化创新比较研究,2024,8(10):52-56.
-
10裴丽丽.基于Python实现影评数据采集与可视化分析[J].山西电子技术,2024(4):92-94.
二级引证文献39
-
1王慧敏.基于Python的河流界桩图表数据批处理方法研究[J].西部资源,2023(6):83-87.
-
2曾诚.基于Python的网络爬虫及数据可视化和预测分析[J].信息与电脑,2020,32(9):167-169. 被引量:6
-
3管小卫.网络爬虫探讨及应用[J].科技创新与应用,2020(27):178-179. 被引量:3
-
4闵磊.基于网络爬虫机制的文献资源可用性监测技术[J].科技资讯,2020,18(27):5-7.
-
5王艳,蒋凌迪.基于Python个性化礼物推荐系统的设计与实现[J].信息与电脑,2020,32(22):97-99. 被引量:3
-
6刘玉玲,郑力新.新冠肺炎疫情数据的抓取及可视化研究[J].电子设计工程,2021,29(7):40-44. 被引量:4
-
7孙佩杰,吕国.利用python对新冠肺炎数据进行收集和分析[J].河北建筑工程学院学报,2020,38(4):155-160.
-
8高雨菲,毛红霞.基于Python的豆瓣影视短评的数据采集与分析[J].现代信息科技,2020,4(24):10-12. 被引量:5
-
9李轩宇,李御龙.基于Python的人机对话自然语言处理[J].科学技术创新,2021(24):83-85. 被引量:1
-
10孙文杰,张素莉,许骏,郑国勋,张维轩.长白山旅游数据爬取及可视化分析[J].吉林大学学报(信息科学版),2021,39(4):416-420. 被引量:3