基于Python的新浪微博爬虫程序设计与实现被引量：6

Design and Lmplementation of Sina Weibo Crawler Program Based on Python

下载PDF

导出

摘要在互联网时代,各类新媒体平台出现使得信息数据得到广泛传播。为加强对新浪微博内容的监管和分析,应对舆情分析的需求,该文主要研究采用Python语言设计新浪微博爬虫程序,在对网络爬虫基本概念和原理研究的基础上,设计了具有配置、爬取、存储、分析这4个功能模块的应用程序,为媒体内容监管和数据分析提供了技术支持。 In the Internet era, the emergence of various new media platforms makes information and data widely disseminated. In order to strengthen the management of Sina Weibo information and meet the needs of public opinion analysis, this paper focuses on the design of Sina Weibo crawler program in Python language. Based on the research on the basic concept and principle of web crawler, an application program with four functional modules of configuration, crawling, storage and analysis is designed. It provides technical support for media content management and data analysis.

作者孙握瑜 SUN Woyu(School of Information and Artificial Intelligence,Anhui Business College of Vocational Technology,Wuhu,Anhui Province,241000 China)

机构地区安徽商贸职业技术学院信息与人工智能学院

出处《科技资讯》 2022年第12期34-37,共4页 Science & Technology Information

基金安徽商贸职业技术学院“双高计划”建设项目(项目编号:2020sgxm08-4) 安徽商贸职业技术学院三平台两基地项目(项目编号:2019ZDX01)。

关键词 PYTHON 新浪微博网络爬虫舆情分析 Python Sina Weibo Web crawler Public opinion analysis

分类号 TP393.092 [自动化与计算机技术—计算机应用技术] TP391.1 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献6

1张柳..社交网络舆情用户主题图谱构建及舆情引导策略研究[D].吉林大学,2021:
2孟宝灿.Python网络爬虫应用探讨[J].广播电视信息,2022,29(3):108-110. 被引量：5
3毕志杰,李静.基于Python的新浪微博爬虫程序设计与研究[J].信息与电脑,2020,32(4):150-152. 被引量：3
4杜晓旭,贾小云.基于Python的新浪微博爬虫分析[J].软件,2019,40(4):182-185. 被引量：14
5于学斗,柏晓钰.基于Python的城市天气数据爬虫程序分析[J].办公自动化,2022,27(7):10-13. 被引量：10
6黄秀丽,陈志.基于JSON的异构Web平台的设计与实现[J].计算机技术与发展,2021,31(3):120-125. 被引量：22

二级参考文献27

1高静,段会川.JSON数据传输效率研究[J].计算机工程与设计,2011,32(7):2267-2270. 被引量：172
2孙光明,王硕.基于JSON的Ajax数据通信快速算法[J].计算机应用与软件,2015,32(1):263-266. 被引量：25
3何高奇,杨凯林,金祎,陈琪,李海杰,潘志庚.基于Unity3D的能源站交互展示技术研究[J].系统仿真学报,2016,28(10):2626-2631. 被引量：9
4卢少军,过丹婷,刘守印.HTTP协议与JSON格式在ZStack中的实现与应用[J].电子测量技术,2016,39(11):100-104. 被引量：8
5陈政伊,袁云静,贺月锦,武瑞轩.基于Python的微博爬虫系统研究[J].大众科技,2017,19(8):8-11. 被引量：9
6穆鑫鑫,蒋同海,程力,马玉鹏.基于JSON的离线数据同步策略及应用[J].计算机系统应用,2017,26(12):257-261. 被引量：10
7罗咪.基于Python的新浪微博用户数据获取技术[J].电子世界,2018,0(5):138-139. 被引量：10
8张小璞,左小清.在ArcGIS下基于Python的路网数据批处理方法[J].软件,2018,39(7):130-133. 被引量：11
9许皓皓,姚日升,沃伟峰.标准化气象数据服务接口设计与实现[J].气象科技,2018,46(4):685-691. 被引量：19
10杜翔,蔡燕,兰小机.基于Python的新浪微博位置数据获取方法研究[J].江西理工大学学报,2018,39(5):90-96. 被引量：2

共引文献49

1邱明月,崔年冬.涉黑涉恶类警情的特征分析方法研究[J].法制与社会（旬刊）,2020(18):202-203.
2李博,练傲,于海鹏.基于STM32的家庭厨房有毒气体监控系统设计[J].智能计算机与应用,2022,12(2):91-98. 被引量：2
3郭小磊.医药商品评论的情感分析[J].智能计算机与应用,2021,11(11):128-130. 被引量：1
4张宜志,蔡丽明.应用文本挖掘的网店营销策略分析[J].福建电脑,2019,35(11):72-73. 被引量：1
5毕志杰,李静.基于Python的新浪微博爬虫程序设计与研究[J].信息与电脑,2020,32(4):150-152. 被引量：3
6方奇洲,程友清.基于Docker容器的分布式爬虫的设计与实现[J].电子设计工程,2020,28(8):61-65. 被引量：5
7刘明洁,李珅,梁毅.基于网络爬虫的法律文本纠错词库构建[J].软件,2020,41(5):57-60. 被引量：1
8王煜炜.基于Python聚焦网络爬虫的用户在线评论内容分析[J].科学与信息化,2020(20):68-69. 被引量：1
9孙美凤,宋晨,王颖.基于PHP的百度贴吧数据爬取[J].软件,2020,41(11):23-26. 被引量：3
10杨声浩,覃林,黄江,杨蕾,郭强强.增材制造软件框架的研究与设计[J].电子技术与软件工程,2021(9):53-56.

同被引文献31

1孙海荣,赵志豪.赋能与负能:新闻聚合平台数字爬虫技术的伦理危机与治理路径[J].传媒论坛,2022,5(24):45-50. 被引量：2
2李鑫欣,关菁华.基于Python的豆瓣读书网站用户信息采集[J].电脑知识与技术,2019,15(3Z):4-6. 被引量：1
3裴丽丽.基于Python对豆瓣电影数据爬虫的设计与实现[J].电子技术与软件工程,2019(13):176-177. 被引量：10
4李杰秦.基于Python语言下网络爬虫的技术特点及应用设计[J].数字通信世界,2020,0(1):209-210. 被引量：8
5侯洁茹,吕继续.基于Python的天猫商品爬虫技术[J].科技资讯,2019,17(32):10-10. 被引量：4
6谢钢.基于Scrapy的信息采集与分析[J].现代信息科技,2020,4(14):96-98. 被引量：4
7董少林,李钟慎.采用Scrapy分布式爬虫技术的微博热点舆情信息获取与分析[J].电脑与信息技术,2020,28(5):23-26. 被引量：3
8简悦,汪心瀛,杨明昕.基于Python的豆瓣网站数据爬取与分析[J].电脑知识与技术,2020,16(32):51-53. 被引量：6
9冯振.新媒体时代新闻作品的版权保护分析——以“今日头条案”为例[J].新闻研究导刊,2020,11(23):67-68. 被引量：4
10李传科.基于Python的网页数据爬虫设计分析[J].信息与电脑,2020,32(24):130-132. 被引量：6

引证文献6

1冯晓磊.基于Python的拉勾网网络爬虫设计与实现[J].现代信息科技,2023,7(6):85-87. 被引量：4
2袁顺科.爬虫技术在新媒体中的发展前景与应用趋势探析[J].新潮电子,2023(6):25-27.
3古志敏,吴明珠.基于Python网络爬虫设计与实现[J].电脑编程技巧与维护,2023(9):163-166. 被引量：9
4黄志高.微博数据爬虫的检测方法研究[J].现代计算机,2023,29(16):64-68.
5朱烨行,赵宝莹,张明杰,魏笑笑,卫昆.基于Scrapy框架的微博用户信息采集系统设计与实现[J].现代信息科技,2023,7(24):41-44. 被引量：2
6吕新超.Scrapy框架辅助下的Python爬虫系统研究[J].电脑知识与技术,2024,20(7):49-52.

二级引证文献14

1古志敏,吴明珠.基于Python网络爬虫设计与实现[J].电脑编程技巧与维护,2023(9):163-166. 被引量：9
2杨冰倩.基于Python爬虫的影评情感分析与可视化系统设计[J].无线互联科技,2023,20(20):43-45. 被引量：1
3刘秀丽.基于Python语言的职工信息管理系统设计与实现[J].现代信息科技,2023,7(23):35-41. 被引量：1
4王姣姣,姚华平.基于数据挖掘技术的数据类岗位招聘信息分析与研究[J].现代信息科技,2024,8(2):13-16.
5郭瑾.基于Python的招聘数据爬取与数据可视化分析研究[J].轻工科技,2024,40(2):94-96. 被引量：3
6刘沛鹏.网络爬虫技术在继续教育平台系统中的应用研究[J].科技资讯,2024,22(4):198-201.
7宋宇.基于Swing的HTML解析器的实现与应用[J].科技资讯,2024,22(14):43-45.
8彭健.基于Python的抖音“高职教育教学”舆情数据抓取与分析[J].科技资讯,2024,22(15):253-256. 被引量：1
9郭晨灏,柳箐,姜澳,赵美娇,徐子薇,王博.基于Python的全国旅游信息统计网站数据抓取研究[J].电脑与信息技术,2024,32(5):71-74.
10吴任翔.基于万维网爬行器的计量信息系统数据管理程序设计[J].铁道技术监督,2024,52(9):23-27.

1杜国柱,朱佩江,沈阳,赵翮.区块链在广播电视行业中的应用展望[J].广播与电视技术,2020,47(4):12-15. 被引量：3
2周灵,卢锋.互联网时代媒介素养教育的范式重构[J].中国电化教育,2021(7):81-88. 被引量：9
3杜国柱,朱佩江,沈阳,赵翮.区块链在广播电视行业中的应用展望[J].广电时评,2020(21):31-35. 被引量：1
4梁丹丹.大学生新媒体阅读及其碎片化——基于全国七所师范院校学生数据[J].山东青年政治学院学报,2020,36(2):52-58. 被引量：5
5黎小花.基于Python语言的大数据智能分析系统设计[J].信息与电脑,2022,34(5):169-171. 被引量：3
6崔陇鹏,李旭东,景若岩.中国古代“声景观”及其声学原理研究[J].古建园林技术,2022,24(3):51-54. 被引量：1
7查雯浩,祝佳伊,彭昳佳,黄周瑶,卢诗琦.企业决策仿真系统平台及其原理研究[J].上海建桥学院学报,2022(2):19-23. 被引量：1
8应金琴,袁恩,张金莲,张普照.乌梢蛇酒炙矫臭原理研究[J].中药材,2021,44(8):1856-1863. 被引量：5
9吴虹娇,吕立江,吕智桢,黄玉波.吕立江应用杠杆定位手法治疗腰椎间盘突出症经验探析[J].浙江中医杂志,2022,57(6):406-408. 被引量：5
10赵永红.煤矿井下供电系统电能质量在线检测系统设计[J].煤炭工程,2022,54(5):14-18. 被引量：10

科技资讯

2022年第12期

浏览历史

内容加载中请稍等...

基于Python的新浪微博爬虫程序设计与实现被引量：6

参考文献6

二级参考文献27

共引文献49

同被引文献31

引证文献6

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

基于Python的新浪微博爬虫程序设计与实现 被引量：6

参考文献6

二级参考文献27

共引文献49

同被引文献31

引证文献6

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

基于Python的新浪微博爬虫程序设计与实现被引量：6