-
题名基于SVM的中文微博观点倾向性识别
被引量:21
- 1
-
-
作者
丁晟春
吴靓婵媛
李红梅
-
机构
南京理工大学信息管理系
江苏省社会公共安全科技协同创新中心
-
出处
《情报学报》
CSSCI
北大核心
2016年第12期1235-1243,共9页
-
基金
国家社会科学基金项目"基于社会网络分析的网络舆情主题发现研究"(编号:15BTQ063)
国家自然科学基金项目"基于情感倾向性分析的网络舆情意见领袖识别与对策研究"(编号:71303111)
-
文摘
通过识别海量中文微博文本观点句的情感倾向,能挖掘用户对某事件或产品持有的个人立场。为了找到更适合观点句倾向性识别的特征与模型,本文在分析微博观点句特征基础上,使用句式特征、句内特征以及隐性特征三类特征,借助于SVM模型对微博进行主客观识别;然后以主观句作为语料,从情感特征、词性特征、句式特征与句间特征四个角度来表示微博,最后利用SVM模型进行观点句的褒义、贬义、褒义贬义混合的情感倾向性分析。该方法在COAE2015 Task2"微博观点句识别"评测结果中取得较好的效果,微平均评估上,准确率达到了74.01%,召回率达到了71.61%,F值为72.79%,综合排名第二,测评结果验证了本文提出的方法有效且具有可行性。
-
关键词
主客观分类
情感倾向性分析
支持向量机
特征选择
-
Keywords
subjective and objective classification, emotional orientation analysis, support vector machine, feature selection
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于关键词共现和社区发现的微博热点主题识别研究
被引量:15
- 2
-
-
作者
丁晟春
王楠
吴靓婵媛
-
机构
南京理工大学经济管理学院
-
出处
《现代情报》
CSSCI
2018年第3期10-18,共9页
-
基金
国家社会科学基金项目"基于社会网络分析的网络舆情主题发现研究"(项目编号:15BTQ063)
国家社会科学基金重大项目"面向知识创新服务的数据科学理论与方法研究"(项目编号:16ZDA224)
-
文摘
[目的]从海量微博舆情信息中准确、高效地发现和挖掘当下的热点主题,以期为政府和企业监控和管理舆情动态提供有价值的参考。[方法]研究首先从维度、特征和度量三方面综合考虑构建"帖子—主题"二模网络模型,其次选择词频、主题权重和词频增长率3个特征来抽取模型所需的有效关键词,然后选取社会网络分析法中的社区发现方法进行基于关键词的主题社区发现,最后综合考虑用户影响力和传播影响力两个属性,通过热度分析确立主题热度,识别热点主题。[结果]实验表明,该方法能有效挖掘网络舆情中的热点主题,检测出的主题结果均正确,验证了本文方法的可行性和有效性。在此基础上,研究还选取实例进一步对主题的热度迁移和情感倾向进行了分析,具备一定的预警作用。
-
关键词
微博
热点主题
关键词
社会网络分析法
社区发现
热度迁徙
情感倾向
-
Keywords
weibo
hot topic
keyword
community discovery
heat migration
emotional inclination
-
分类号
C912.6
[经济管理]
-