期刊文献+

基于Python爬虫和聚类的热映电影数据抓取与可视化设计

下载PDF
导出
摘要 本文使用Python网络爬虫技术对热映电影的影评数据进行爬取,包括伪装网络请求、导入网页链接、重复抓取过滤等,完成了对电影《新蝙蝠侠》在国、内外不同平台影评数据的获取。通过数据可视化技术对获取的影评文本制作了词云,并对评论数变化、评论所在城市分布进行了展示。根据手肘法和TF-IDF矩阵,通过K-means聚类,得到几个分类的主题词,清晰地呈现观众的情感倾向,直观地展示了电影上映后观众对电影的关注程度和观影感受,并能够进一步剖析各个平台评论的特性和内涵及其产生原因。
作者 马宇洁
出处 《电子技术与软件工程》 2023年第3期229-232,共4页 ELECTRONIC TECHNOLOGY & SOFTWARE ENGINEERING
  • 相关文献

参考文献6

二级参考文献21

共引文献41

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部