期刊文献+
共找到50篇文章
< 1 2 3 >
每页显示 20 50 100
基于词典与机器学习的中文微博情感分析研究 被引量:50
1
作者 孙建旺 吕学强 张雷瀚 《计算机应用与软件》 CSCD 北大核心 2014年第7期177-181,共5页
随着Web2.0时代的兴起,与微博相关的研究得到学术界和工业界的广泛关注。选取微博文本中的动词和形容词作为特征;提出基于层次结构的特征降维方法;采用设计的基于表情符号的方法计算特征极性值;在此基础上,提出基于特征极性值的位置权... 随着Web2.0时代的兴起,与微博相关的研究得到学术界和工业界的广泛关注。选取微博文本中的动词和形容词作为特征;提出基于层次结构的特征降维方法;采用设计的基于表情符号的方法计算特征极性值;在此基础上,提出基于特征极性值的位置权重计算方法,借助SVM作为机器学习模型将微博文本分为正面、负面和中性三类。实验结果表明,提出的方法能够比较有效地对中文微博文本进行情感分类。 展开更多
关键词 微博 表情符号 极性值 位置权重 情感分类
下载PDF
基于改进卡方统计的微博特征提取方法 被引量:14
2
作者 徐明 高翔 +1 位作者 许志刚 刘磊 《计算机工程与应用》 CSCD 2014年第19期113-117,142,共6页
通过对微博文本特征信息的分析与研究,提出一种基于改进卡方统计的微博特征提取方法。扩充微博信息分类特征,在传统的卡方统计量的基础上,引入了频度等因素,改进特征选择方法;在传统的特征项权值计算的基础上,提出了新的改进卡方统计量... 通过对微博文本特征信息的分析与研究,提出一种基于改进卡方统计的微博特征提取方法。扩充微博信息分类特征,在传统的卡方统计量的基础上,引入了频度等因素,改进特征选择方法;在传统的特征项权值计算的基础上,提出了新的改进卡方统计量的方法,改进权重计算效果。对上述方法利用经典KNN和SVM算法进行了测试,实验结果表明该方法提高了微博信息分类的准确率。 展开更多
关键词 微博分类 卡方统计量 特征选择 权值计算
下载PDF
基于用户聚类的热门微博分类研究 被引量:10
3
作者 张士豪 顾益军 张俊豪 《信息网络安全》 2015年第7期84-89,共6页
文章在已有的微博分类研究的基础上,提出一种基于热门微博下转发用户聚类的微博分类方法,使得分类结果能够在公安工作中有更大的利用价值。文章所使用的聚类算法采用了现如今比较成熟的K-means聚类算法以及对其进行改进之后的X-means聚... 文章在已有的微博分类研究的基础上,提出一种基于热门微博下转发用户聚类的微博分类方法,使得分类结果能够在公安工作中有更大的利用价值。文章所使用的聚类算法采用了现如今比较成熟的K-means聚类算法以及对其进行改进之后的X-means聚类算法,X-means算法使用了更加科学的BIC准则作为类别之间的相似性度量,而且用户在使用X-means算法时无需再指定聚类个数,只需要划定聚类范围就可以了,通过这样的机制,X-means算法提高了聚类的准确性和科学性。经过对实验结果的对比分析,发现X-means算法得出的聚类结果拟合性更好。因此,在微博分类研究中将会使用X-means算法进行用户聚类。另外,文章还列举了不同种类的微博下的用户聚集情况,并为网络安全主管部门提出了针对不同种类微博的应对策略。 展开更多
关键词 用户聚类 热门微博 分类
下载PDF
基于时间序列网络的谣言检测研究 被引量:5
4
作者 任文静 秦兵 刘挺 《智能计算机与应用》 2019年第3期300-303,共4页
本文主要研究了GRU,LSTM等深度学习模型在谣言检测上的应用,判断微博文本是否为谣言类信息。考虑到新浪微博平台的图结构,一条微博文本对应着多条评论信息,评论中可能包含对该条文本的态度,例如赞成、反对、怀疑等。因此,本文在判断微... 本文主要研究了GRU,LSTM等深度学习模型在谣言检测上的应用,判断微博文本是否为谣言类信息。考虑到新浪微博平台的图结构,一条微博文本对应着多条评论信息,评论中可能包含对该条文本的态度,例如赞成、反对、怀疑等。因此,本文在判断微博文本是否为谣言时,融合了评论信息,将评论看作一条时间线上的各个时刻,按照时间节点展开,作为时间序列模型每个时刻的输入,并且利用注意力机制衡量每个时间节点对最终语义表示的重要程度。实验结果表明,在加入评论信息及attention机制后,实验结果具有明显提升,最后达到92.66%的识别准确率。 展开更多
关键词 谣言检测 深度学习 新浪微博 分类
下载PDF
中文微博情感分析研究综述 被引量:80
5
作者 周胜臣 瞿文婷 +2 位作者 石英子 施询之 孙韵辰 《计算机应用与软件》 CSCD 北大核心 2013年第3期161-164,181,共5页
随着微博的风靡,与之相关的研究得到学术界和工商界的广泛关注。针对中文微博情感分析的研究进行综述。将中文微博文本情感分析分为三类任务:文本预处理、情感信息抽取和情感分类,对各自的研究方法和进展进行总结。其中情感信息抽取分... 随着微博的风靡,与之相关的研究得到学术界和工商界的广泛关注。针对中文微博情感分析的研究进行综述。将中文微博文本情感分析分为三类任务:文本预处理、情感信息抽取和情感分类,对各自的研究方法和进展进行总结。其中情感信息抽取分为情感词、主题和关系的抽取,将微博主观文本情感分类方法归结为基于语义词典的情感计算和基于机器学习的情感分类。此外,从微博网站数据构成的角度出发,对情感分析做了延伸分析。最后总结微博情感分析的研究现状,并提出今后的研究方向。 展开更多
关键词 中文微博 情感分析 情感信息抽取 情感分类
下载PDF
基于极性词典的中文微博客情感分类 被引量:27
6
作者 王勇 吕学强 +1 位作者 姬连春 肖诗斌 《计算机应用与软件》 CSCD 北大核心 2014年第1期34-37,126,共5页
微博客是近年来自然语言处理领域研究的热点。主要针对中文微博客中的情感分类展开研究。结合网络新词和基础情感词,同时考虑了情感词的极性情感强弱,构建四个词典,分别是基础情感词典、表情符号词典、否定词词典和双重否定词词典;在情... 微博客是近年来自然语言处理领域研究的热点。主要针对中文微博客中的情感分类展开研究。结合网络新词和基础情感词,同时考虑了情感词的极性情感强弱,构建四个词典,分别是基础情感词典、表情符号词典、否定词词典和双重否定词词典;在情感词典的基础上,融合汉语语言学特征和微博情感表达特征,提出一种新的基于极性词典的情感分类方法。实验准确率达到82.2%。实验结果表明,提出的方法可以对中文微博进行较好的情感分类,有一定的应用价值。 展开更多
关键词 微博客 情感分类 词典 语言学特征
下载PDF
基于复合分类模型的社交网络恶意用户识别方法 被引量:12
7
作者 谈磊 连一峰 陈恺 《计算机应用与软件》 CSCD 北大核心 2012年第12期1-5,17,共6页
社交网络近年发展迅速,微博类社交网络的用户数目及规模急剧增大的同时也带来了诸多安全问题,为了保护用户的隐私和个人、集体的利益,需要针对这些恶意行为进行识别并对恶意用户进行处理。提出一种采用复合分类模型对用户进行分类的方法... 社交网络近年发展迅速,微博类社交网络的用户数目及规模急剧增大的同时也带来了诸多安全问题,为了保护用户的隐私和个人、集体的利益,需要针对这些恶意行为进行识别并对恶意用户进行处理。提出一种采用复合分类模型对用户进行分类的方法,并开发了一个对微博类社交网络用户进行分类的系统。通过研究用户的属性和行为特点,比较属性间的相关性,从两方面兼顾了分类的准确性和效率。 展开更多
关键词 新浪微博 社交网络 自动分类特征选择 恶意用户
下载PDF
基于移动群智数据的城市热点事件感知方法 被引量:5
8
作者 张佳凡 郭斌 +2 位作者 路新江 於志文 周兴社 《计算机科学》 CSCD 北大核心 2015年第S1期5-9 37,37,共6页
以新浪微博为研究对象,研究了基于移动群智数据的城市热点事件感知方法,对热点事件进行发现与分类。面向不同的应用需求,可将发现的热点事件分为物理事件与虚拟事件两大类。采用的方法首先根据热词的词频变化特征对新浪微博中的热词进... 以新浪微博为研究对象,研究了基于移动群智数据的城市热点事件感知方法,对热点事件进行发现与分类。面向不同的应用需求,可将发现的热点事件分为物理事件与虚拟事件两大类。采用的方法首先根据热词的词频变化特征对新浪微博中的热词进行有效挖掘,然后根据热词的上下文语境进行层次聚类以得到热点事件描述。此外,通过分析信息量特征、时序特征及原创微博数目特征,采用不同方法进行事件分类。实验结果表明,不同的分类方法均可达到较高的准确率。 展开更多
关键词 微博 热点事件发现 微博事件分类 移动群智感知
下载PDF
基于Hadoop的朴素贝叶斯算法在中文微博情感分类中的研究与应用 被引量:4
9
作者 蒋婉婷 孙蕾 钱江 《计算机应用与软件》 CSCD 2015年第7期60-62,142,共4页
通过对文本情感分类的研究,考虑微博文本信息的篇幅短小、情感符号丰富及大量网络词汇的特点,提出一种适用于中文微博情感分类的基于Map/Reduce的分布式朴素贝叶斯算法。算法通过构建适用于微博文本的情感词典来完成情感特征属性的提取... 通过对文本情感分类的研究,考虑微博文本信息的篇幅短小、情感符号丰富及大量网络词汇的特点,提出一种适用于中文微博情感分类的基于Map/Reduce的分布式朴素贝叶斯算法。算法通过构建适用于微博文本的情感词典来完成情感特征属性的提取,以期达到较为理想的分类效果。实验结果表明,这种方法能够很好地适用于微博情感分类,达到较理想的分类效果,满足针对海量的微博文本数据处理的可行性与高效性的需求。 展开更多
关键词 微博 情感分类 HADOOP MAP/REDUCE 朴素贝叶斯
下载PDF
基于监督学习的微博情感分类方法 被引量:3
10
作者 朱晓光 聂培尧 林培光 《计算机应用与软件》 CSCD 2015年第8期238-242,共5页
随着在线社交网络的快速发展,微博平台上聚集了大量的包含情感的主观句。微博情感可影响受众的观点形成,作用于商务智能、政策制定,甚至是股票市场。微博情感分类是指如何从微博中自动抽取出情感极性和不同的情感分类,如喜爱、愤怒、惊... 随着在线社交网络的快速发展,微博平台上聚集了大量的包含情感的主观句。微博情感可影响受众的观点形成,作用于商务智能、政策制定,甚至是股票市场。微博情感分类是指如何从微博中自动抽取出情感极性和不同的情感分类,如喜爱、愤怒、惊奇等。结合情感词汇本体和同义词词林,从微博中抽取不同类别的特征,运用监督学习方法进行情感分类,在学习过程中优化不同的模型,并分别进行误差和拟合分析,比较不同模型的性能。分类算法在NLP&CC 2013的评测任务中取得了具有竞争性的结果。 展开更多
关键词 微博 情感分类 监督学习 情感词汇本体 同义词词林
下载PDF
基于局部特征选择的微博中文文本分类研究
11
作者 单世超 栾翠菊 《现代计算机(中旬刊)》 2017年第8期11-16,共6页
微博文本内容短小、用词不规范等缺点,使得微博文本的研究区别于通常的文本研究。目前微博研究很多,但缺少合适的带有标签的微博语料库。分析微博数据获取方案给出合适的带有分类标签的微博语料库,然后通过传统分类算法进行分类评估验证... 微博文本内容短小、用词不规范等缺点,使得微博文本的研究区别于通常的文本研究。目前微博研究很多,但缺少合适的带有标签的微博语料库。分析微博数据获取方案给出合适的带有分类标签的微博语料库,然后通过传统分类算法进行分类评估验证;由于微博短文本维度高存在严重的特征稀疏问题,全局特征选择算法容易忽略对某个类别重要但对语料集关联度小的特征,并采用局部特征选择方案。实验结果证明局部特征选择方法可以获得更高的分类效果。 展开更多
关键词 微博 中文文本分类 全局特征选择 局部特征选择 WEKA
下载PDF
网络新媒体信息披露的经济后果研究——基于股价同步性的视角 被引量:80
12
作者 何贤杰 王孝钰 +1 位作者 孙淑伟 朱红军 《管理科学学报》 CSSCI CSCD 北大核心 2018年第6期43-59,共17页
近年来,微博等网络新媒体的出现对公众信息的传播方式和及时性产生了重大的影响.尤其在资本市场中,这些网络新媒体丰富了上市公司发布信息的内容,增加了投资者获取信息的渠道,在一定程度上促进了证券市场的定价效率.文章通过手工搜集并... 近年来,微博等网络新媒体的出现对公众信息的传播方式和及时性产生了重大的影响.尤其在资本市场中,这些网络新媒体丰富了上市公司发布信息的内容,增加了投资者获取信息的渠道,在一定程度上促进了证券市场的定价效率.文章通过手工搜集并逐条阅读上市公司在新浪微博上发布的信息,从股价同步性的视角对上市公司披露的微博信息内容的经济后果进行了考察.研究结果显示,微博信息中经营活动及策略类信息占比越高的公司的股价同步性越低,并且这个结果在考虑内生性影响后依旧存在.文章还发现,聘请十大会计师事务所、信息透明度越高以及分析师跟踪人数越多的公司,其微博有用信息降低股价同步性的作用更强.这些结果说明,投资者并非接收所有微博信息并做出反应,只有当公司透明度较高、发布信息质量较高,并且微博信息内容具有价值的情况下,公司层面信息才能通过微博有效地传递给投资者,从而影响资本市场. 展开更多
关键词 微博 信息披露 信息内容 股价同步性
下载PDF
基于多文本特征融合的中文微博的立场检测 被引量:23
13
作者 奠雨洁 金琴 吴慧敏 《计算机工程与应用》 CSCD 北大核心 2017年第21期77-84,共8页
微博立场检测是判断微博作者对某一个话题的态度是支持、反对或中立。在基于监督学习的分类框架上,扩展并提出基于多文本特征融合的中文微博的立场检测方法。首先探究了基于词频统计的特征(词袋特征(Bag-ofWords,Bo W)、基于同义词典的... 微博立场检测是判断微博作者对某一个话题的态度是支持、反对或中立。在基于监督学习的分类框架上,扩展并提出基于多文本特征融合的中文微博的立场检测方法。首先探究了基于词频统计的特征(词袋特征(Bag-ofWords,Bo W)、基于同义词典的词袋特征、考虑词与立场标签共现关系的特征)和文本深度特征(词向量、字向量)。之后使用支持向量机,随机森林和梯度提升决策树对上述特征进行立场分类。最后,结合所有特征分类器进行后期融合。实验表明,文中提出的特征对于不同话题下的微博立场检测的结果都有提升,且文本深度特征和基于词频统计的特征能够捕捉到文本的不同信息,在立场检测中是互补的。基于本文方法的微博立场检测系统在2016年自然语言处理与中文计算会议(NLPCC2016)的中文微博立场检测评测任务中取得了最好的结果。 展开更多
关键词 立场检测 情感分析 文本特征表示 微博 文本分类
下载PDF
基于OCC模型和LSTM模型的财经微博文本情感分类研究 被引量:22
14
作者 吴鹏 李婷 +1 位作者 仝冲 沈思 《情报学报》 CSSCI CSCD 北大核心 2020年第1期81-89,共9页
为了解决财经微博文本中网民情感状态转移的时序数据分析问题,本文提出一个基于认知情感评价模型(Ortony,Clore&Collins,OCC)和长短期记忆模型(long short term memory,LSTM)的财经微博文本情感分类模型(OCC-LSTM)。基于OCC模型从... 为了解决财经微博文本中网民情感状态转移的时序数据分析问题,本文提出一个基于认知情感评价模型(Ortony,Clore&Collins,OCC)和长短期记忆模型(long short term memory,LSTM)的财经微博文本情感分类模型(OCC-LSTM)。基于OCC模型从网民认知角度建立情感规则,对财经微博文本进行情感标注,并作为LSTM模型进行深度学习的训练集;基于LSTM模型,使用深度学习中的TensorFlow框架和Keras模块建立相应的实验模型,进行海量微博数据情感分类,并结合13家上市公司3年的微博文本数据进行实证研究和模型验证对比。实证研究结果发现本文提出的模型取得了89.45%的准确率,高于采用传统的机器学习方式的支持向量机方法 (support vector machine,SVM)和基于深度学习的半监督RAE方法 (semi-supervised recursive auto encoder)。 展开更多
关键词 长短期记忆模型 OCC模型 财经微博 情感分类
下载PDF
中文微博情感词提取:N-Gram为特征的分类方法 被引量:13
15
作者 刘德喜 聂建云 +3 位作者 张晶 刘晓华 万常选 廖国琼 《中文信息学报》 CSCD 北大核心 2016年第4期193-205,212,共14页
情感词典是文本情感分析的基础资源,但采用手工方式构建工作量大,且覆盖有限。一种可行的途径是从新情感词传播的重要媒介-微博数据-中自动抽取情感词。该文以COAE 2014评测任务3提供的中文微博数据为统计对象,发现传统的基于共现的方法... 情感词典是文本情感分析的基础资源,但采用手工方式构建工作量大,且覆盖有限。一种可行的途径是从新情感词传播的重要媒介-微博数据-中自动抽取情感词。该文以COAE 2014评测任务3提供的中文微博数据为统计对象,发现传统的基于共现的方法,如点互信息等,对中文微博数据中的新情感词发现是无效的。为此,设计一组基于上下文词汇的分类特征,即N-Gram特征,以刻画情感词的用词环境和用词模式,并以已知情感词为训练数据训练分类器,对候选情感词进行分类。实验结果表明,该方法较传统基于共现的方法要好。实验还发现,与英语不同的是,中文情感词通常会以名词词性出现,而基于共现的方法无法有效地区分该类情感词,这是造成其失效的主要原因,而该文提出的分类特征能解决这一问题。 展开更多
关键词 情感词提取 中文微博 分类方法 N-Gram特征
下载PDF
基于卷积神经网络的中文微博观点分类 被引量:12
16
作者 廖祥文 张丽瑶 +2 位作者 宋志刚 程学旗 陈国龙 《模式识别与人工智能》 EI CSCD 北大核心 2016年第12期1075-1082,共8页
针对现有中文微博观点分类方法对上下文利用不足、数据表示稀疏和特征依赖于人工设计等问题,提出基于卷积神经网络的中文微博观点分类方法.首先利用交互上下文扩充不同主题下的微博内容,使用低维密集向量初始化微博文本.然后构造卷积神... 针对现有中文微博观点分类方法对上下文利用不足、数据表示稀疏和特征依赖于人工设计等问题,提出基于卷积神经网络的中文微博观点分类方法.首先利用交互上下文扩充不同主题下的微博内容,使用低维密集向量初始化微博文本.然后构造卷积神经网络模型,实现特征抽取和组合.最后基于softmax分类函数估计中文微博观点类别.实验表明,相比基准方法,文中方法在精确度和F1值上的效果更好. 展开更多
关键词 中文微博 观点分类 卷积神经网络
下载PDF
基于平滑SO-PMI算法的微博情感词典构建方法研究 被引量:10
17
作者 杜锐 朱艳辉 +2 位作者 田海龙 刘璟 马进 《湖南工业大学学报》 2015年第5期77-81,共5页
对现有情感词典在微博情感分类中的适用性进行了分析,针对现有情感词典在微博中情感词覆盖度低的问题,整合现有情感词典资源,构建了一个微博基础情感词典,同时提出了一种基于拉普拉斯平滑的SO-PMI算法对微博基础情感词典中没有收录的情... 对现有情感词典在微博情感分类中的适用性进行了分析,针对现有情感词典在微博中情感词覆盖度低的问题,整合现有情感词典资源,构建了一个微博基础情感词典,同时提出了一种基于拉普拉斯平滑的SO-PMI算法对微博基础情感词典中没有收录的情感词倾向性进行判断,最后利用微博情感词典与拉普拉斯平滑的SO-PMI算法对微博情感词典进行了构建,并对所构建微博情感词典的分类性能进行了实验。实验结果表明,该方法所构建的情感词典在微博情感分类中能达到较好的分类效果。 展开更多
关键词 中文微博 情感词典 情感分类 平滑
下载PDF
基于深度融合特征的政务微博转发规模预测模型 被引量:6
18
作者 徐月梅 刘韫文 蔡连侨 《数据分析与知识发现》 CSSCI CSCD 北大核心 2020年第2期18-28,共11页
【目的】预测政务微博的转发规模,研究及评估影响政府微博传播规模的重要特征,把握政务微博的信息舆论走向。【方法】针对政务微博的特点,提出一种深度融合特征的政务微博转发预测方案,引入卷积神经网络(CNN)和梯度提升决策树(GBDT)将... 【目的】预测政务微博的转发规模,研究及评估影响政府微博传播规模的重要特征,把握政务微博的信息舆论走向。【方法】针对政务微博的特点,提出一种深度融合特征的政务微博转发预测方案,引入卷积神经网络(CNN)和梯度提升决策树(GBDT)将发布者特征、时间特征及内容特征深度融合,预测政务微博的转发规模并对影响转发规模的特征进行重要性排序,找出影响政务微博转发规模的最重要特征。【结果】引入文本语义特征显著提升了转发规模的预测准确率,所提模型将政务微博转发规模的预测准确率提升至0.933。特征重要性实验结果表明,文本语义特征在影响政务微博转发规模的所有特征中最为重要。【局限】未考虑间接转发对整体转发规模的影响。【结论】深度融合发布者特征、时间特征及内容特征的CNN+GBDT模型能够显著提高政务微博转发规模预测的准确率。 展开更多
关键词 政务微博 转发规模预测 卷积神经网络 文本分类
原文传递
基于卷积神经网络和用户信息的微博话题追踪模型 被引量:6
19
作者 付鹏 林政 +3 位作者 袁凤程 林海伦 王伟平 孟丹 《模式识别与人工智能》 EI CSCD 北大核心 2017年第1期73-80,共8页
为了解决微博文本特征抽取及特征稀疏问题,提出基于卷积神经网络的微博话题追踪模型(CNN-TTM).基于微博用户信息,又提出融合微博用户信息及卷积神经网络的微博话题追踪模型(CNN-User TTM),利用微博用户信息提高话题追踪准确率.实验表明... 为了解决微博文本特征抽取及特征稀疏问题,提出基于卷积神经网络的微博话题追踪模型(CNN-TTM).基于微博用户信息,又提出融合微博用户信息及卷积神经网络的微博话题追踪模型(CNN-User TTM),利用微博用户信息提高话题追踪准确率.实验表明,在新浪微博数据集上,CNN-TTM和CNN-User TTM分别获得较高的微博话题追踪准确率. 展开更多
关键词 话题追踪 卷积神经网络 词向量 微博分类 用户画像
下载PDF
民生话题下政务微博评论Emotion-Cause Pair抽取方法研究
20
作者 王昊 虞为 +1 位作者 孟镇 张卫 《情报科学》 北大核心 2023年第12期136-146,共11页
【目的/意义】微博已成为政府部门与公众间互动的一个重要途径,针对政务微博进行细粒度的情感和原因分析有利于提高政府部门舆情治理能力,为此本文提出一套政务微博评论Emotion-Cause Pair抽取架构。【方法/过程】本文在定义Emotion&... 【目的/意义】微博已成为政府部门与公众间互动的一个重要途径,针对政务微博进行细粒度的情感和原因分析有利于提高政府部门舆情治理能力,为此本文提出一套政务微博评论Emotion-Cause Pair抽取架构。【方法/过程】本文在定义Emotion&Cause共现句侦测任务的基础上,基于文本分类模型识别出E&C共现句,构建GATECPE模型抽取Emotion-Cause Pair,并通过模型迁移和微调手段减少数据标注。【结果/结论】经过多个数据集验证,Emotion&Cause共现句侦测阶段识别P值在70%以上,Emotion-Cause Pair抽取阶段识别F1值在60%以上。通过模型微调可以有效缓解模型直接迁移产生的效果下降,本文提出的情感原因抽取流程可以有效抽取出政务微博评论的情感原因。【创新/局限】实验数据来源受限,Emotion&Cause共现句侦测和Emotion-Cause Pair抽取两阶段存在误差传播。 展开更多
关键词 政务微博 文本分类 Emotion-Cause Pair Extraction BERT 情感分析
原文传递
上一页 1 2 3 下一页 到第
使用帮助 返回顶部