期刊文献+
共找到30篇文章
< 1 2 >
每页显示 20 50 100
大规模情感词典的构建及其在情感分类中的应用 被引量:51
1
作者 赵妍妍 秦兵 +1 位作者 石秋慧 刘挺 《中文信息学报》 CSCD 北大核心 2017年第2期187-193,共7页
以微博为代表的社会媒体的飞速发展为情感分析方向带来巨大的资源,同时也对情感分析算法的性能提出了更大的挑战。其中,现有的情感词典尤其是中文情感词典规模不足是影响情感分析性能的一个重要因素。为此,该文基于海量的微博数据,使用... 以微博为代表的社会媒体的飞速发展为情感分析方向带来巨大的资源,同时也对情感分析算法的性能提出了更大的挑战。其中,现有的情感词典尤其是中文情感词典规模不足是影响情感分析性能的一个重要因素。为此,该文基于海量的微博数据,使用简单的文本统计算法,构建了一个十万词语/词组的大规模情感词典。我们以情感分析的基础任务——情感分类为例,将大规模情感词典作为特征用于该任务上,实验结果表明大规模词典有助于情感分类性能的提高。 展开更多
关键词 情感词典 情感分析 情感分类 微博
下载PDF
中文微博情感分析研究与实现 被引量:28
2
作者 李勇敢 周学广 +1 位作者 孙艳 张焕国 《软件学报》 EI CSCD 北大核心 2017年第12期3183-3205,共23页
中文微博的大数据、指数传播和跨媒体等特性,决定了依托人工方式监控和处理中文微博是不现实的,迫切需要依托计算机开展中文微博情感自动分析研究.该项研究可分为3个任务:中文微博观点句识别、情感倾向性分类和情感要素抽取.为完成上述... 中文微博的大数据、指数传播和跨媒体等特性,决定了依托人工方式监控和处理中文微博是不现实的,迫切需要依托计算机开展中文微博情感自动分析研究.该项研究可分为3个任务:中文微博观点句识别、情感倾向性分类和情感要素抽取.为完成上述任务,研制了一个评测系统:通过构建多级词库、制定成词规则、开展串频统计等给出一种基于规则和统计的新词识别方法,在情感词和评价对象的依存模式的基础上给出基于词语特征的观点句识别算法;以词序流表示文本的LDA-Collocation模型,采用吉布斯抽样法推导了算法,实现中文微博情感倾向性自动分类;针对中文微博情感要素抽取召回率较低的问题,利用依存关系分析理论,按主语类和宾语类把依存模式分为两类,建立了6个优先级的评价对象和情感词汇的依存模式,通过评价对象归并算法实现计算机自动抽取情感要素.实验包括两个部分:一是参加NLP&CC2012的公开评测,所提方法在微博观点句识别任务中的准确率为第2,在中文微博情感要素抽取任务中的准确率和F值均为第2,验证了该算法的实用性;二是在分析公开评测结果的基础上,分别比较了参加公开评测的各类算法在处理中文微博情感分析时的效率,给出了相关结论. 展开更多
关键词 中文微博 情感分析 依存分析 情感倾向性分类 情感要素抽取 无监督主题情感模型
下载PDF
多策略中文微博细粒度情绪分析研究 被引量:23
3
作者 欧阳纯萍 阳小华 +3 位作者 雷龙艳 徐强 余颖 刘志明 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第1期67-72,共6页
针对中文微博用户的情绪分析问题,提出一种基于多策略融合的细粒度情绪分析方法。首先采用朴素贝叶斯算法对微博的有无情绪分类问题进行研究,然后构建有情绪微博的21维特征向量,最后采用SVM和KNN算法对微博进行细粒度情绪分析。以新浪... 针对中文微博用户的情绪分析问题,提出一种基于多策略融合的细粒度情绪分析方法。首先采用朴素贝叶斯算法对微博的有无情绪分类问题进行研究,然后构建有情绪微博的21维特征向量,最后采用SVM和KNN算法对微博进行细粒度情绪分析。以新浪微博作为实验对象,结果表明多策略集成方法好于单一分类算法。在多策略集成方法中,"NB+SVM"方法略优于"NB+KNN"方法。 展开更多
关键词 细粒度情绪分析 中文微博 朴素贝叶斯 SVM KNN
下载PDF
基于长短期记忆多维主题情感倾向性分析模型 被引量:21
4
作者 滕飞 郑超美 李文 《计算机应用》 CSCD 北大核心 2016年第8期2252-2256,共5页
针对中文微博全局性情感倾向分类的准确性不高的问题,提出基于长短期记忆模型的多维主题模型(MT-LSTM)。该模型是一个多层多维序列计算模型,由多维长短期记忆(LSTM)细胞网络组成,适用于处理向量、数组以及更高维度的数据。该模型首先将... 针对中文微博全局性情感倾向分类的准确性不高的问题,提出基于长短期记忆模型的多维主题模型(MT-LSTM)。该模型是一个多层多维序列计算模型,由多维长短期记忆(LSTM)细胞网络组成,适用于处理向量、数组以及更高维度的数据。该模型首先将微博语句分为多个层次进行分析,纵向以三维长短期记忆模型(3D-LSTM)处理词语及义群的情感倾向,横向以多维长短期记忆模型(MD-LSTM)多次处理整条微博的情感倾向;然后根据主题标签的高斯分布判断情感倾向;最后将几次判断结果进行加权得到最终的分类结果。实验结果表明,该算法平均查准率达91%,最高可达96.5%;中性微博查全率高达50%以上。与递归神经网络(RNN)模型相比,该算法F-测量值提升40%以上;与无主题划分的方法相比,细致的主题划分可将F-测量值提升11.9%。所提算法具有较好的综合性能,能够有效提升中文微博情感倾向分析的准确性,同时减少训练数据量,降低匹配计算的复杂度。 展开更多
关键词 中文微博 情感倾向分析 长短期记忆 多层多维模型 主题标签
下载PDF
基于隐主题分析的中文微博话题发现 被引量:19
5
作者 史剑虹 陈兴蜀 王文贤 《计算机应用研究》 CSCD 北大核心 2014年第3期700-704,共5页
针对高维、稀疏的中文微博数据,提出一种多步骤的新闻话题发现方法。首先结合微博的传播特点,选取出不同时间窗口中具有较高新闻价值的微博文本;再利用隐主题模型挖掘微博内容中隐含的主题信息,并在此基础上进行文本聚类;最后使用频繁... 针对高维、稀疏的中文微博数据,提出一种多步骤的新闻话题发现方法。首先结合微博的传播特点,选取出不同时间窗口中具有较高新闻价值的微博文本;再利用隐主题模型挖掘微博内容中隐含的主题信息,并在此基础上进行文本聚类;最后使用频繁项集挖掘技术获取话题关键词集合。该算法能够较好地实现对中文微博数据的降维与话题发现。真实的微博数据集实验结果验证了该方法的有效性。 展开更多
关键词 中文微博 话题发现 隐主题模型 文本聚类 频繁项集挖掘
下载PDF
中文微博情感词提取:N-Gram为特征的分类方法 被引量:13
6
作者 刘德喜 聂建云 +3 位作者 张晶 刘晓华 万常选 廖国琼 《中文信息学报》 CSCD 北大核心 2016年第4期193-205,212,共14页
情感词典是文本情感分析的基础资源,但采用手工方式构建工作量大,且覆盖有限。一种可行的途径是从新情感词传播的重要媒介-微博数据-中自动抽取情感词。该文以COAE 2014评测任务3提供的中文微博数据为统计对象,发现传统的基于共现的方法... 情感词典是文本情感分析的基础资源,但采用手工方式构建工作量大,且覆盖有限。一种可行的途径是从新情感词传播的重要媒介-微博数据-中自动抽取情感词。该文以COAE 2014评测任务3提供的中文微博数据为统计对象,发现传统的基于共现的方法,如点互信息等,对中文微博数据中的新情感词发现是无效的。为此,设计一组基于上下文词汇的分类特征,即N-Gram特征,以刻画情感词的用词环境和用词模式,并以已知情感词为训练数据训练分类器,对候选情感词进行分类。实验结果表明,该方法较传统基于共现的方法要好。实验还发现,与英语不同的是,中文情感词通常会以名词词性出现,而基于共现的方法无法有效地区分该类情感词,这是造成其失效的主要原因,而该文提出的分类特征能解决这一问题。 展开更多
关键词 情感词提取 中文微博 分类方法 N-Gram特征
下载PDF
基于卷积神经网络的中文微博观点分类 被引量:12
7
作者 廖祥文 张丽瑶 +2 位作者 宋志刚 程学旗 陈国龙 《模式识别与人工智能》 EI CSCD 北大核心 2016年第12期1075-1082,共8页
针对现有中文微博观点分类方法对上下文利用不足、数据表示稀疏和特征依赖于人工设计等问题,提出基于卷积神经网络的中文微博观点分类方法.首先利用交互上下文扩充不同主题下的微博内容,使用低维密集向量初始化微博文本.然后构造卷积神... 针对现有中文微博观点分类方法对上下文利用不足、数据表示稀疏和特征依赖于人工设计等问题,提出基于卷积神经网络的中文微博观点分类方法.首先利用交互上下文扩充不同主题下的微博内容,使用低维密集向量初始化微博文本.然后构造卷积神经网络模型,实现特征抽取和组合.最后基于softmax分类函数估计中文微博观点类别.实验表明,相比基准方法,文中方法在精确度和F1值上的效果更好. 展开更多
关键词 中文微博 观点分类 卷积神经网络
下载PDF
基于主题标签和CRF的中文微博命名实体识别 被引量:12
8
作者 朱颢东 杨立志 +1 位作者 丁温雪 冯嘉美 《华中师范大学学报(自然科学版)》 CAS 北大核心 2018年第3期316-321,共6页
近年来,网络媒体微博的迅速发展,为命名实体的识别研究提供了一种全新的载体.针对中文微博文本短、表达不清、网络化严重等特点,论文提出了一种规则与统计相结合的中文微博命名实体识别方法.该方法首先利用中文微博的主题标签对处理后... 近年来,网络媒体微博的迅速发展,为命名实体的识别研究提供了一种全新的载体.针对中文微博文本短、表达不清、网络化严重等特点,论文提出了一种规则与统计相结合的中文微博命名实体识别方法.该方法首先利用中文微博的主题标签对处理后的数据进行筛选,然后再选取合适的特征模板,并利用条件随机场模型(Conditional random fields,CRF)进行实体识别.为了满足实验要求,该文将传统网页爬虫方法与API接口采集方法相结合进行微博数据采集.实验结果表明,该方法能够有效提高中文微博命名实体的识别效果. 展开更多
关键词 命名实体 中文微博 主题标签 条件随机场
下载PDF
面向中文微博的观点句识别研究 被引量:11
9
作者 丁晟春 孟美任 李霄 《情报学报》 CSSCI 北大核心 2014年第2期175-182,共8页
中文微博包含了用户对热点话题的观点,对其进行观点挖掘可以实现突发事件预警、舆情监控等。目前,微博研究多数基于英文语料,中文微博观点句的挖掘大多混淆在情感挖掘中少量提及,由于中文微博特殊的语体特征,导致传统中文文本观点... 中文微博包含了用户对热点话题的观点,对其进行观点挖掘可以实现突发事件预警、舆情监控等。目前,微博研究多数基于英文语料,中文微博观点句的挖掘大多混淆在情感挖掘中少量提及,由于中文微博特殊的语体特征,导致传统中文文本观点挖掘模型无法取得理想效果。区别于已有的情感挖掘工作,本文依据中文微博的语体特征分析结果选取特征,除了选取情感特征外,还加入主张性动词、语气词、程度副词以及固定词性结构等观点句特征,采用CRFs模型进行观点句识别研究。实验结果表明,仅选取情感特征准确率较高,但召回率仅为32.1%。而加入其他观点句特征后,召回率显著提高到61.8%。该方法应用于2012年中国计算机学会(CCF)组织的“观点句识别”测评任务中,取得了很好的效果。 展开更多
关键词 中文微博 观点挖掘 CRFs模型 观点句识别 语体特征
下载PDF
基于平滑SO-PMI算法的微博情感词典构建方法研究 被引量:10
10
作者 杜锐 朱艳辉 +2 位作者 田海龙 刘璟 马进 《湖南工业大学学报》 2015年第5期77-81,共5页
对现有情感词典在微博情感分类中的适用性进行了分析,针对现有情感词典在微博中情感词覆盖度低的问题,整合现有情感词典资源,构建了一个微博基础情感词典,同时提出了一种基于拉普拉斯平滑的SO-PMI算法对微博基础情感词典中没有收录的情... 对现有情感词典在微博情感分类中的适用性进行了分析,针对现有情感词典在微博中情感词覆盖度低的问题,整合现有情感词典资源,构建了一个微博基础情感词典,同时提出了一种基于拉普拉斯平滑的SO-PMI算法对微博基础情感词典中没有收录的情感词倾向性进行判断,最后利用微博情感词典与拉普拉斯平滑的SO-PMI算法对微博情感词典进行了构建,并对所构建微博情感词典的分类性能进行了实验。实验结果表明,该方法所构建的情感词典在微博情感分类中能达到较好的分类效果。 展开更多
关键词 中文微博 情感词典 情感分类 平滑
下载PDF
基于SVM的中文微博情绪分析研究 被引量:10
11
作者 丁晟春 王颖 李霄 《情报资料工作》 CSSCI 北大核心 2016年第3期28-33,共6页
文章以中文微博为研究对象,结合心理学和自然语言处理,将微博情绪划分为乐、怒、哀、恶、惧五大类。然后在类别划分的基础上,使用情感特征、句式特征、句间特征来表示微博情绪,并借助于SVM模型形成了微博情绪分类模型。最后借助NLP&... 文章以中文微博为研究对象,结合心理学和自然语言处理,将微博情绪划分为乐、怒、哀、恶、惧五大类。然后在类别划分的基础上,使用情感特征、句式特征、句间特征来表示微博情绪,并借助于SVM模型形成了微博情绪分类模型。最后借助NLP&CC 2013的公开评测数据对提出的模型进行了验证,实验结果表明本文所提的方法是有效的。 展开更多
关键词 情绪类别 情绪分析 特征选择 SVM 中文微博
原文传递
基于话题自适应的中文微博情感分析 被引量:10
12
作者 任远 巢文涵 +1 位作者 周庆 李舟军 《计算机科学》 CSCD 北大核心 2013年第11期231-235,270,共6页
近年来,随着社会网络的迅速兴起,面向社会网络的情感分析技术逐渐成为数据挖掘领域新的研究热点。中文微博以其语言简短、文法灵活的特点,给情感分析的研究工作带来了新的挑战。对数据预处理、情感词典构造、话题元素引入等中文微博情... 近年来,随着社会网络的迅速兴起,面向社会网络的情感分析技术逐渐成为数据挖掘领域新的研究热点。中文微博以其语言简短、文法灵活的特点,给情感分析的研究工作带来了新的挑战。对数据预处理、情感词典构造、话题元素引入等中文微博情感分析技术进行了系统的研究,提出了给情感词分级的方法以提升情感分析的准确度;同时提出了面向话题的自适应方法以更准确地识别情感词;最后实验结果验证了以上方法的有效性。 展开更多
关键词 中文微博 情感分析 情感词 话题自适应
下载PDF
基于信息融合的中文微博可信度评估方法 被引量:9
13
作者 高明霞 陈福荣 《计算机应用》 CSCD 北大核心 2016年第8期2071-2075,2081,共6页
针对中文微博信息的特点及这些特点的可测量性和实际任务,系统地梳理了中文微博信息可信度测量指标,并将其进行了谱系化分析,提出一个基于信息融合的中文微博可信度评估框架CCM-IF。首先,为本质不同的三个异构特征:文本内容、信息作者... 针对中文微博信息的特点及这些特点的可测量性和实际任务,系统地梳理了中文微博信息可信度测量指标,并将其进行了谱系化分析,提出一个基于信息融合的中文微博可信度评估框架CCM-IF。首先,为本质不同的三个异构特征:文本内容、信息作者与信息传播使用了不同的度量方式;其次,基于决策层可信度的模糊认知特点,采用了多维证据理论进行特征融合;最后,收集了新浪微博两个真实数据集进行了一系列实验。实验结果表明,与传统信息检索排序方法平滑语言模型(LMJM)相比,CCM-IF符合用户需求的信息占比提高了10%~20%。因此,作为一个静态质量评估指标,CCM-IF可直接用于微博检索排序、垃圾微博过滤等实际任务。 展开更多
关键词 中文微博 可信度 信息融合 四象限法则 证据理论
下载PDF
基于词向量聚类的中文微博产品命名实体识别 被引量:8
14
作者 王洪亮 《兰州理工大学学报》 CAS 北大核心 2017年第1期104-110,共7页
随着微博等社交平台的兴起,如何针对微博数据进行产品命名实体识别成为了自然语言处理领域研究的热点之一,也是实现舆情监督和商业智能的基础.传统的命名实体识别技术没有考虑中文微博口语化、不规范等特点,且忽略了深层语义对命名实体... 随着微博等社交平台的兴起,如何针对微博数据进行产品命名实体识别成为了自然语言处理领域研究的热点之一,也是实现舆情监督和商业智能的基础.传统的命名实体识别技术没有考虑中文微博口语化、不规范等特点,且忽略了深层语义对命名实体识别的重要作用.因此,考虑中文微博的特殊性,提出一种融合全局上下文信息的词向量特征选择方法,分别采用主题模型和神经网络词向量聚类两种方法获取深层语义信息,并结合层叠条件随机场进行中文微博的命名实体识别.实验结果表明,基于词向量聚类的中文微博产品命名实体识别方法取得了较好的效果. 展开更多
关键词 中文微博 命名实体 主题模型 神经网络 词向量
下载PDF
基于卷积树核的中文微博情感要素识别 被引量:7
15
作者 陈锋 巢文涵 +1 位作者 周庆 李舟军 《计算机科学》 CSCD 北大核心 2014年第12期133-137,142,共6页
情感要素识别是情感分析的关键子任务之一,其目的是识别出文本情感所作用的情感对象。文本情感要素识别属于最细粒度的情感分析,吸引了大量研究者的关注。中文微博由于其语言简短灵活、文本不规范、噪声较大等特点,给中文微博情感分析... 情感要素识别是情感分析的关键子任务之一,其目的是识别出文本情感所作用的情感对象。文本情感要素识别属于最细粒度的情感分析,吸引了大量研究者的关注。中文微博由于其语言简短灵活、文本不规范、噪声较大等特点,给中文微博情感分析研究工作带来了新的挑战。目前大部分情感要素识别方法都是基于规则的方法或者基于扁平化特征的统计学习方法,区分噪声的能力不强,性能提升有限。针对中文微博的特点,提出一种基于卷积树核的情感要素识别算法,即首先对句子进行词性标注与依存关系分析,将句子中的名词作为候选情感要素;然后基于两种不同的修剪策略对依存树进行修剪,以获取每个候选情感要素的结构化信息;最后采用卷积树核计算依存树的相似度,并在此基础上识别句子中的情感要素。NLP&CC2012和NLP&CC2013中文微博情感分析评测任务中的实验验证了该方法的性能,其准确率相比于传统方法有显著提升。 展开更多
关键词 情感要素识别 中文微博 卷积树核 依存树修剪
下载PDF
多策略中文微博实体词消歧及实体链接 被引量:4
16
作者 向宇 郭云龙 +2 位作者 徐潇 曾维刚 李莉 《计算机应用与软件》 CSCD 2016年第8期12-17,61,共7页
在社交网络迅猛发展的今天,如何对有歧义的微博实体进行消歧和如何将微博实体连接到知识库已成为当今研究热点。对实体消歧和实体链接提出了多种策略方案。首先利用ICTCLAS对微博文本进行分词处理,利用百度百科、实体专家库对实体进行... 在社交网络迅猛发展的今天,如何对有歧义的微博实体进行消歧和如何将微博实体连接到知识库已成为当今研究热点。对实体消歧和实体链接提出了多种策略方案。首先利用ICTCLAS对微博文本进行分词处理,利用百度百科、实体专家库对实体进行规范化处理。然后利用由爬虫爬取的百度百科信息、微博数据、网络词语构建了消歧文本数据库,再结合TF-IDF算法和FastNewman聚类算法对实体进行消歧和链接。使用第二届自然语言处理与中文计算会议(NLP&CC 2013)中的中文微博实体链接任务给的数据进行测试,测评中准确率为84.99%,继续改进模型后准确率达91.40%。 展开更多
关键词 中文微博 实体消歧 TF-IDF Fast-Newman聚类
下载PDF
基于海量信息过滤的微博热词抽取方法 被引量:4
17
作者 汪洋 帅建梅 陈志刚 《计算机系统应用》 2012年第11期131-136,共6页
针对海量微博信息,提出一种多步骤的热词抽取方法.首先,选择用户行为特性、微博信息的文本特征构建用户行为模型,并在此基础上提出一种基于规则的话题树生成过滤算法,筛除了微博中大量无关信息,进而对生成的话题树修剪优化;然后,根据话... 针对海量微博信息,提出一种多步骤的热词抽取方法.首先,选择用户行为特性、微博信息的文本特征构建用户行为模型,并在此基础上提出一种基于规则的话题树生成过滤算法,筛除了微博中大量无关信息,进而对生成的话题树修剪优化;然后,根据话题树的节点内容,使用词频及其波动特性设计热词抽取算法,获取微博的热词信息.实验数据表明,该方法能大大减小输入的数据规模,同时较好的保留重要信息,有效实现热词抽取. 展开更多
关键词 中文微博 用户行为模型 海量信息过滤 热词抽取 幂律分布
下载PDF
基于众包标注的中文微博命名实体识别 被引量:3
18
作者 房辉 汤文兵 +1 位作者 桂海霞 张顺香 《计算机应用与软件》 北大核心 2019年第3期255-259,270,共6页
中文微博命名实体的有效识别对使用微博进行社会舆论监测具有重要意义。鉴于微博更新速度快、语言不规范、噪声多,使得命名实体识别成本高、识别效率低。针对这些问题,提出基于众包标注的中文微博命名实体识别的方法。对众包工作者的能... 中文微博命名实体的有效识别对使用微博进行社会舆论监测具有重要意义。鉴于微博更新速度快、语言不规范、噪声多,使得命名实体识别成本高、识别效率低。针对这些问题,提出基于众包标注的中文微博命名实体识别的方法。对众包工作者的能力进行评估,使用最大期望算法(EM算法)对评估后的能力值进行分析学习,过滤掉每个标注者的噪声并对众包标注的结果进行优化,从而确定最后的命名实体。实验结果表明,该方法能够有效地提高中文微博中命名实体识别的准确率。 展开更多
关键词 舆论监测 众包标注 EM算法 中文微博 命名实体识别
下载PDF
基于cw2vec与CNN-BiLSTM注意力模型的中文微博情感分类 被引量:3
19
作者 卢昱波 刘德润 +3 位作者 蔡奕超 杨庆雨 陈伟 刘太安 《软件导刊》 2021年第3期51-56,共6页
为改善中文微博领域现有中文分词不准确且微博文本不规范问题,提出将cw2vec和CNN-BiLSTM注意力相结合的混合深度学习模型方法进行中文微博情感分类。首先使用cw2vec进行中文词向量训练,转换为相应的向量作为分类模型输入,然后利用CNN提... 为改善中文微博领域现有中文分词不准确且微博文本不规范问题,提出将cw2vec和CNN-BiLSTM注意力相结合的混合深度学习模型方法进行中文微博情感分类。首先使用cw2vec进行中文词向量训练,转换为相应的向量作为分类模型输入,然后利用CNN提取局部特征,采用BiLSTM提取上下文特征进行深度学习,最后增加注意力模型获取重要特征,并使用Softmax函数进行分类。实验结果表明,使用cw2vec模型训练中文微博词时,准确率达到88.72%,使用cw2vec和CNN-BiLSTM注意力混合深度学习模型的精确率、召回率和F1值比单一深度学习模型分别提升1.88%、3.56%和2.72%,证明cw2vec和CNN-BiLSTM注意力混合深度学习模型结合方法在中文微博情感分类任务中的有效性。 展开更多
关键词 情感分类 中文微博 cw2vec CNN-BiLSTM 注意力机制
下载PDF
中文微博热点事件情感分布的原因分析 被引量:3
20
作者 李泽魁 李雪婷 赵妍妍 《中文信息学报》 CSCD 北大核心 2018年第1期131-138,共8页
微博作为新兴的社交媒体平台,越来越多的网民选择在微博上获取与分享自己感兴趣的信息。在微博日均千万级的大数据面前,分析网民对某一事件的观点与态度是一件非常有意义的工作。调研中发现,大众对单个事件的不同话题存在不同的情感分... 微博作为新兴的社交媒体平台,越来越多的网民选择在微博上获取与分享自己感兴趣的信息。在微博日均千万级的大数据面前,分析网民对某一事件的观点与态度是一件非常有意义的工作。调研中发现,大众对单个事件的不同话题存在不同的情感分布。针对这一现象,该文提出了使用无监督学习的层次聚类排序方法和半监督学习的微博话题纠正算法两种方法,进行事件话题及其相关微博的挖掘。最后利用情感分析的相关技术,达到对相关微博进行情感分布统计及其原因分析的目的。通过在人工构建的数据集上测试,结果表明该方法能够准确分析事件情感分布的原因。 展开更多
关键词 情感原因分析 话题聚类 话题纠正 中文微博
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部