摘要
本文使用Python网络爬虫技术对热映电影的影评数据进行爬取,包括伪装网络请求、导入网页链接、重复抓取过滤等,完成了对电影《新蝙蝠侠》在国、内外不同平台影评数据的获取。通过数据可视化技术对获取的影评文本制作了词云,并对评论数变化、评论所在城市分布进行了展示。根据手肘法和TF-IDF矩阵,通过K-means聚类,得到几个分类的主题词,清晰地呈现观众的情感倾向,直观地展示了电影上映后观众对电影的关注程度和观影感受,并能够进一步剖析各个平台评论的特性和内涵及其产生原因。
出处
《电子技术与软件工程》
2023年第3期229-232,共4页
ELECTRONIC TECHNOLOGY & SOFTWARE ENGINEERING