期刊文献+

网络爬虫的设计与实现 被引量:4

下载PDF
导出
摘要 在大数据时代中,网络平台的弹幕与评论与我们生活息息相关。为了及时反馈观众对bilibili 网站的生活娱乐需求,本文采用Python 语言,首先采集网络爬虫爬取bilibili 的视频弹幕文本内容,从 Beautiful Soup库解析出需要提取的待分析的数据并清洗过后保存到数据库中,接着对需要分析的弹幕长句数据通过Jieba 库进行中文分词处理,筛选出高频词汇。为了使乏味的文本数据散发活力,深入分析数据,以词云图展示数据分析的结果,增加数据可视化。
作者 庄礼金 戴泽鑫 ZHUANG Li-jin;DAI Ze-xin
机构地区 广东理工学院 不详
出处 《信息技术与信息化》 2020年第12期47-49,共3页 Information Technology and Informatization
  • 相关文献

参考文献7

二级参考文献19

共引文献171

同被引文献24

引证文献4

二级引证文献11

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部