摘要
在大数据时代中,网络平台的弹幕与评论与我们生活息息相关。为了及时反馈观众对bilibili 网站的生活娱乐需求,本文采用Python 语言,首先采集网络爬虫爬取bilibili 的视频弹幕文本内容,从 Beautiful Soup库解析出需要提取的待分析的数据并清洗过后保存到数据库中,接着对需要分析的弹幕长句数据通过Jieba 库进行中文分词处理,筛选出高频词汇。为了使乏味的文本数据散发活力,深入分析数据,以词云图展示数据分析的结果,增加数据可视化。
作者
庄礼金
戴泽鑫
ZHUANG Li-jin;DAI Ze-xin
出处
《信息技术与信息化》
2020年第12期47-49,共3页
Information Technology and Informatization