-
题名基于关键词和关键句抽取的用户评论情感分析
被引量:10
- 1
-
-
作者
喻影
陈珂
寿黎但
陈刚
吴晓凡
-
机构
浙江大学计算机科学与技术学院
浙江省大数据智能计算重点实验室(浙江大学)
网易(杭州)网络有限公司
-
出处
《计算机科学》
CSCD
北大核心
2019年第10期19-26,共8页
-
基金
国家重点研发项目(2017YFB1201001)
国家自然科学基金项目(61672455)
浙江省自然科学基金(LY18F020005)资助
-
文摘
情感分析的一项主要研究任务是根据文档内容对其情感极性(即正类和负类)进行判断。在判断文档的情感极性时,不同的词语和句子具有不同的情感贡献度,因此如何从整个文档中准确地提取与情感分类更相关的词语和句子,从而提升分类性能,成为了一个重要问题。在有监督实验中,基于依存句法关系分析句子的逻辑结构,提取出了与表达情感更相关的词语进行加权,提高了分类性能。在半监督实验中,使用基于中文评论的关键句抽取和分类器融合算法,对整篇文档中包含更多情感词和总结意味的关键句进行了抽取,充分考虑了句子的情感词属性、位置属性、标点符号属性和关键词属性,并且使用分类器融合算法,让置信度最高的子分类器决定分类效果。在大众点评网和头条新闻的数据集上将所提算法与已有的经典算法进行对比,发现所提方法的性能更高,从而证明了基于依存句法分析的关键词抽取和基于特征的中文关键句抽取算法的有效性。
-
关键词
情感分析
依存分析
关键句抽取
半监督学习
协同训练
-
Keywords
Sentiment analysis
Dependency parsing
key sentence extraction
Semi-supervised learning
Co-training method
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于改进TextRank的关键句提取方法
被引量:2
- 2
-
-
作者
陈梦彤
谷晓燕
刘甜甜
-
机构
北京信息科技大学信息管理学院
-
出处
《郑州大学学报(理学版)》
CAS
北大核心
2023年第1期15-20,共6页
-
基金
国家自然科学基金项目(71701020)
国家重点研发计划项目(2019YFB1405003)
北京市社科项目(19YJB015)。
-
文摘
在进行文本挖掘时,通常根据关键词分析文本,这种方式容易忽略词语之间的关联性,影响文本挖掘的准确性。TextRank算法是提取关键词或者摘要的主要方法,该算法基于网络图考虑了句子间相似性,但是忽略了词语的特征。基于此,提出了一种改进TextRank算法,将相似语句合并后,考虑多种词特征进行关键句选取。首先,计算语句相似度,并且去除文中相似性较高的语句;然后,根据词频、词义、词位置对词语打分,构建有向图;最后,计算语句平均得分进行排序,选出关键句。实验结果表明,改进后的算法准确性优于其他算法,算法的时间复杂度降低,并且解决了关键词对文本描述片面和摘要烦琐的问题。
-
关键词
关键句提取
改进TextRank算法
相似句合并
词特征
-
Keywords
key sentence extraction
improved TextRank algorithm
similar sentences merging
word feature
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名畜牧兽医基因组学领域技术空白中外对比研究
- 3
-
-
作者
吴蕾
李小杰
丁倩
孙巍
周正奎
-
机构
中国农业科学院农业信息研究所
农业农村部农业大数据重点实验室
中国农业科学院深圳农业基因组研究所
中国农业科学院北京畜牧兽医研究所
-
出处
《农业图书情报学报》
2023年第8期88-97,共10页
-
基金
国家社科基金青年项目“基于图模型的农业领域多源知识迁移研究”(18CTQ028)
国家重点研发计划项目“智能化情报分析软件工具研发”子课题“领域演化分析工具研发”(2022YFF0711904)。
-
文摘
[目的 /意义]为了挖掘中国在农业重点领域的技术空白,并预测空白点的未来发展趋势,为科技管理决策者提供有效的科技发展技术机会咨询建议。[方法 /过程]首先,使用关键句嵌入方法和句向量聚类方法,对论文和专利的摘要信息进行挖掘;然后进行主题聚类对比分析,发现技术空白;其次,构建语义相似性网络和分类相似性网络,发现容易与空白点形成交叉融合的主题方向。[结果 /结论]在畜牧兽医领域对基因组学技术进行了实证分析。结果表明,该方法能够发现技术空白,并结合专家分析,可以对畜牧兽医领域基因组学技术进行发展现状解读和未来趋势预测,并为中国畜牧兽医领域基因组学技术智库咨询提供方法和数据支撑。
-
关键词
技术空白发现
关键句抽取
句向量聚类
基因组学
知识产权
-
Keywords
technology gaps discovery
key sentence extraction
sentence embedding clus-tering
genomics
intellectual property
-
分类号
G255.51
[文化科学—图书馆学]
-
-
题名基于表情符分析的情感关键句提取方法
被引量:1
- 4
-
-
作者
冯勇
张勤
王嵘冰
徐红艳
-
机构
辽宁大学信息学院
-
出处
《辽宁大学学报(自然科学版)》
CAS
2018年第4期311-318,共8页
-
基金
国家自然科学基金项目(71771110)
中国博士后科学基金(2018M631814)
+1 种基金
教育部重点实验室资助项目(93K172018K01)
辽宁省社科规划基金(L18AGL007)
-
文摘
在情感计算中,提取情感关键句是简化分类过程、提高分类正确率的关键环节.近年来,人们的社交需求日趋旺盛,表情符相较于文字具有更为丰富的语义信息,在各交流系统中得以广泛应用.为提升情感关键句提取方法的性能,对表情符的情感极性进行深入分析,提出一种基于表情符分析的情感关键句提取方法.首先统计表情符的情感极性,再将其和纯文字句子情感极性进行对比分析,对于句子中词组的情感极性不一致的句子将采用类序列规则挖掘,得出句子的最终情感极性;然后再结合位置信息以及关键词等属性特征,作为衡量该句是否为情感关键句的重要依据;通过对比实验验证了所提方法相较于现有方法在正确率和召回率方面都有较大提高.
-
关键词
情感计算
情感极性
表情符
位置信息
关键句提取
-
Keywords
emotional calculation
emotional polarity
emoticons
position information
key sentence extraction
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于回复支持的关键评论提取方法
被引量:1
- 5
-
-
作者
郭楠
张勤
徐红艳
郭舒
刘志国
-
机构
沈阳广播电视大学科研处
辽宁大学信息学院
辽宁大学商学院
中国石油天然气股份有限公司华北化工销售分公司
-
出处
《吉林大学学报(信息科学版)》
CAS
2019年第6期671-676,共6页
-
基金
2018年辽宁省普通高等教育本科教学改革研究基金资助项目(201804)
文化和旅游部基金资助项目(xxhfzzx201804)
-
文摘
当前网络中充斥着大量的虚假评论,准确识别出代表用户真实感受的关键评论成为评论分析领域研究的热点问题。为此,提出一种基于回复支持的关键评论提取方法,该方法从用户对评论的反馈行为出发,重点考量评论点赞和评论回复两个指标,通过计算评论点赞率和回复率获取评论的回复支持情况,仅对回复支持度高的评论进行提取,从而剔除了大量虚假或无用的评论,提升了关键评论提取的准确性。最后,通过与现有主流方法进行实验对比,验证了该方法具有较高的正确率和召回率。
-
关键词
在线评论
回复支持
关键句提取
潜在狄利克雷分布
-
Keywords
online comment
reply support
key sentences extraction
latent Dirichlet allocation(LDA)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于无向图构建策略的主题句抽取
被引量:10
- 6
-
-
作者
葛斌
李芳芳
李阜
肖卫东
-
机构
国防科技大学C
-
出处
《计算机科学》
CSCD
北大核心
2011年第5期181-185,共5页
-
基金
国家自然科学基金项目(60903225
60172012)资助
-
文摘
基于文档句构建无向图,将主题句的抽取问题转换为无向图中节点的权重计算问题。首先利用滑窗方法抽取主题词,构建空间向量并生成无向图,然后基于向量空间模型计算边权重,最后利用文档句相似度矩阵的权重模型对文档句权重进行建模与计算,依据压缩比得到文档的主题句。实验表明,该方法在不同的压缩比下生成的摘要质量高,主题句抽取结果接近于人工摘要,召回率和准确率综合指数较高。
-
关键词
主题句抽取
无向图
文档句权重
自动文摘
-
Keywords
extraction algorithm
followed by the establishment of the undirected graph.The edge weights of the graph were modeled by the Vector Space Model(VSM) in turn.The node weights were computed finally by the weight model based on the similarity matrix
and the subject sentences were obtained on the ratio of compression.Experiments show that the proposed automatic summarization techniques improve the recall rate and accuracy effectively. key words Subject sentence extraction
Undirected graph
sentence weight
Automatic text summarization
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-