基于语境分类与遗传算法的微博情感分析方法被引量：1

A Method of Weibo Sentiment Analysis Based on Context Classification and Genetic Algorithm

下载PDF

导出

摘要针对当前基于LDA模型扩展的文本情感分析方法未能考虑同一词语在不同语境下其情感极性的差异及非特征情感词对微博文本情感极性的影响这两个问题,提出一种基于语境分类和遗传算法的微博情感分析方法。该方法首先利用LDA模型构造微博主题集及微博主题词集,然后用微博标签数据逐一对各微博主题词集应用遗传算法自动迭代计算得出词集中词语的情感值,最后利用词集词语的情感值计算微博文本情感极性。实验结果表明,该方法精确度比LDA提升3.12%,召回率达87.32%,F1达73.79%,能够从语境和非特征情感词获取微博情感信息,有效提高情感分类准确率。 In view of the fact that the current text sentiment analysis methods based on LDA model extension fail to consider the differ⁃ences of emotional polarity of the same word in different contexts and the influence of non characteristic emotional words on the emo⁃tional polarity of Weibo text,this paper proposes a method of Weibo sentiment analysis based on context classification and genetic algo⁃rithm.Firstly,Weibo topic sets and Weibo subject word sets have been constructed by using LDA model.Then based on the Weibo tag data,genetic algorithm is applied to each Weibo subject word set one by one,and the emotional value of the words in the word set is calculated automatically.Finally,the emotion value of the word sets are used to calculate the emotional polarity of Weibo.Experimen⁃tal results show that compared with other methods,the accuracy is 3.12%higher than LDA,the recall rate is 87.32%,and F1 is 73.79%.This method can obtain emotional information from context and non-featured emotional words in Weibo,and thus it effective⁃ly improves the accuracy of sentimental classification.

作者邓凯凯陆向艳阮开栋许欣刘峻 DENG Kai-kai;LU Xiang-yan;RUAN Kai-dong;XU Xin;LIU Jun(School of Computer and Electronic Information,Guangxi University,Nanning 530004,China)

机构地区广西大学计算机与电子信息学院

出处《软件导刊》 2021年第1期178-184,共7页 Software Guide

基金广西软科学研究计划项目(桂科AB17205002,2019ZL0046) 广西高校科研项目(KY2015YB008) 广西大学科研基金项目(XJZ130355) 广西研究生教育创新计划项目(JGY2015004)。

关键词微博情感分析语境 LDA 非特征情感词遗传算法 sentiment analysis of Weibo context LDA non-emotional feature words genetic algorithm

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献11

1周福星,陈秀真,马进,李生红.一种融合标签语义的微博热点话题挖掘方法[J].计算机工程,2019,45(10):283-287. 被引量：3
2王科,夏睿.情感词典自动构建方法综述[J].自动化学报,2016,42(4):495-511. 被引量：72
3梅莉莉,黄河燕,周新宇,毛先领.情感词典构建综述[J].中文信息学报,2016,30(5):19-27. 被引量：23
4关鹏飞,李宝安,吕学强,周建设.注意力增强的双向LSTM情感分析[J].中文信息学报,2019,33(2):105-111. 被引量：44
5刘思叶,田原,冯雨宁,庄育龙.游客微博主题情感分析方法比较研究[J].北京大学学报（自然科学版）,2018,54(4):687-692. 被引量：12
6李勇敢,周学广,孙艳,张焕国.中文微博情感分析研究与实现[J].软件学报,2017,28(12):3183-3205. 被引量：29
7欧阳继红,刘燕辉,李熙铭,周晓堂.基于LDA的多粒度主题情感混合模型[J].电子学报,2015,43(9):1875-1880. 被引量：23
8孙艳,周学广,付伟.基于主题情感混合模型的无监督文本情感分析[J].北京大学学报（自然科学版）,2013,49(1):102-108. 被引量：54
9苏莹,张勇,胡珀,涂新辉.基于朴素贝叶斯与潜在狄利克雷分布相结合的情感分析[J].计算机应用,2016,36(6):1613-1618. 被引量：22
10黄发良,冯时,王大玲,于戈.基于多特征融合的微博主题情感挖掘[J].计算机学报,2017,40(4):872-888. 被引量：63

二级参考文献176

1张珊,于留宝,胡长军.基于表情图片与情感词的中文微博情感分析[J].计算机科学,2012,39(S3):146-148. 被引量：55
2朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：327
3张俊林,黄瑞红,孙乐.亚洲语言信息检索评测会议NTCIR介绍[J].数字图书馆论坛,2006(9):20-25. 被引量：2
4王灿辉,张敏,马少平.自然语言处理在信息检索中的应用综述[J].中文信息学报,2007,21(2):35-45. 被引量：50
5Liu B, Zhang L. A survey on opinion mining and sentiment analysis // Mining text data. New York: Springer, 2012:415-463. 被引量：1
6Taboada M, Brooke J, Tofiloski M, et al. Lexicon-based methods for sentiment analysis. Computational Linguistics, 2011, 37(2): 267-307. 被引量：1
7Blei D M, Ng A Y, Jordan M I. Latent dirichlet allocation. Journal of Machine Leanming Research, 2003(3): 993-1022. 被引量：1
8Titov I, McDonald R. Modeling online reviews with multi-grain topic models // Proceeding of WWW'08. New York: ACM, 2008:111-120. 被引量：1
9Titov I, McDonald R. A joint model of text and aspect ratings for sentiment summarization//Proceedings of ACL-08: HLT. Stroudsburg: ACL, 2008:308-316. 被引量：1
10Zhao X, Jiang J, Yan H F, et al. Jointly modeling aspects and opinions with a MaxEnt-LDA hybrid // Proceedings of the 2010 Conference on Empirical Methods in Natural Language Processing. Strouds- burg: ACL, 2010:56-65. 被引量：1

共引文献317

1孙星恺,王晓,陆浩.面向活动的网络媒体监测与建模分析:IVFC案例解析[J].智能科学与技术学报,2019,1(4):352-368. 被引量：1
2丁美荣,冯伟森,黄荣翔,罗嘉俊.基于预训练模型和基础词典扩展的酒店评论情感分析[J].计算机系统应用,2022,31(11):296-308. 被引量：5
3包乾辉,李佳利,石淑珍,戴引,刘雪.基于DSLML的鸡蛋消费在线评论情感分析[J].农业机械学报,2021,52(S01):496-503. 被引量：5
4李玉强,黄瑜,孙念,李琳,刘爱华.基于性格情绪特征的改进主题情感模型[J].中文信息学报,2020(7):96-104. 被引量：1
5刘栋,张彩环.情境特征及其在情感分类模型中的应用[J].计算机应用研究,2020,37(1):144-147.
6丁学君,甘甜,田勇.基于文本分析法的高校主观教学评价研究[J].创新创业理论研究与实践,2024(9):10-16.
7王勇,马钰,徐胜华,王艳东,罗安,刘万增,狄琳.兴趣点推荐方法研究进展与展望[J].测绘科学,2023,48(12):217-224. 被引量：1
8李蕾,谢旸,蒋亚飞,刘咏彬.一种用于图卷积网络的社交关系方向门控算法[J].北京邮电大学学报,2020(5):77-83. 被引量：1
9童丽萍,李明.风荷载作用下玻璃幕墙结构的受力分析与计算[J].工业建筑,2000,30(4):27-30. 被引量：13
10党宏社,郭楚佳,张娜.信息融合技术在情绪识别领域的研究展望[J].计算机应用研究,2013,30(12):3536-3539. 被引量：6

同被引文献7

1彭兰.智媒化：未来媒体浪潮--新媒体发展趋势报告(2016)[J].国际新闻界,2016,38(11):6-24. 被引量：352
2彭兰.未来传媒生态:消失的边界与重构的版图[J].现代传播（中国传媒大学学报）,2017,39(1):8-14. 被引量：169
3许向东,郭萌萌.智媒时代的新闻生产:自动化新闻的实践与思考[J].国际新闻界,2017,39(5):29-41. 被引量：66
4傅丕毅,商艳青,张宁宁.“媒体大脑”的智媒演变:万物为媒人机共生[J].传媒,2019(4):16-18. 被引量：9
5聂黎生.基于KPCA-粒子群随机森林算法的舆情趋势预测研究[J].现代电子技术,2019,42(15):79-82. 被引量：9
6韩楠,乔少杰,黄萍,彭京,周凯.基于群体智能的跨语言网络舆情文本聚类模型[J].重庆理工大学学报（自然科学）,2019,33(9):99-108. 被引量：4
7张思龙,王兰成,娄国哲.基于情报感知的网络舆情研判与预警系统研究[J].情报理论与实践,2020,43(12):149-155. 被引量：23

引证文献1

1陈瑞涵,王紫祥,敖永春.智媒时代高校网络舆情工作机制研究[J].新闻研究导刊,2022,13(19):87-89. 被引量：5

二级引证文献5

1姜杰,车程逸.智媒时代高校意识形态风险应对策略[J].鞍山师范学院学报,2023,25(5):84-87.
2缐宇峰.大学生思想政治引导及应对策略研究--以高校网络舆情为例[J].品位·经典,2023(2):164-166.
3韩雨蒙.基于大思政背景下高校网络舆情引导研究[J].办公室业务,2023(16):113-115.
4翟梦杰,王雪.高校网络舆情应对联动机制及分级处置探索[J].新闻研究导刊,2023,14(15):137-139. 被引量：1
5杨语桐,陈媛媛,李姝妤,余飞飞,王思绪,陈嘉欣.高校突发事件中大学生“围观”行为的引导策略[J].湖北经济学院学报（人文社会科学版）,2024,21(9):117-119.

1陈千,车苗苗,郭鑫,王素格.一种循环卷积注意力模型的文本情感分类方法[J].计算机科学,2021,48(2):245-249. 被引量：7
2代丽,樊粤湘,陈思.基于卷积神经网络的短文本情感分类[J].计算机系统应用,2021,30(1):214-220. 被引量：4
3周霈.挣值管理改进项目成本预测及建议[J].中国集体经济,2021(3):43-44. 被引量：1
4蔡之兵.经济体系循环与乡村振兴战略的本质透视——基于马克思空间异质再生产模型[J].学术论坛,2020,43(5):69-77.

软件导刊

2021年第1期

浏览历史

内容加载中请稍等...

基于语境分类与遗传算法的微博情感分析方法被引量：1

参考文献11

二级参考文献176

共引文献317

同被引文献7

引证文献1

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于语境分类与遗传算法的微博情感分析方法 被引量：1

参考文献11

二级参考文献176

共引文献317

同被引文献7

引证文献1

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于语境分类与遗传算法的微博情感分析方法被引量：1