期刊文献+
共找到539篇文章
< 1 2 27 >
每页显示 20 50 100
大数据相关分析综述 被引量:244
1
作者 梁吉业 冯晨娇 宋鹏 《计算机学报》 EI CSCD 北大核心 2016年第1期1-18,共18页
大数据时代,相关分析因其具有可以快捷、高效地发现事物间内在关联的优势而受到广泛的关注,并有效地应用于推荐系统、商业分析、公共管理、医疗诊断等领域.面向非线性、高维性等大数据的复杂特征,结合现有相关分析方法的语义分析,文中... 大数据时代,相关分析因其具有可以快捷、高效地发现事物间内在关联的优势而受到广泛的关注,并有效地应用于推荐系统、商业分析、公共管理、医疗诊断等领域.面向非线性、高维性等大数据的复杂特征,结合现有相关分析方法的语义分析,文中从统计相关分析、互信息、矩阵计算、距离4个方面对大数据相关分析的现有研究成果进行了梳理.在对统计学中的经典相关分析理论进行归纳、总结的基础上,文中从大规模数据的通用性和均等性视角阐述了基于互信息的两个变量间非线性相关分析理论,从高维数据可计算的角度分析了基于矩阵计算的相关系数,从非线性、高维性数据的复杂结构方面解析了基于距离的相关系数.进一步地,该文在对已有相关分析方法进行分析与比较的基础上,围绕高维数据、多变量数据、大规模数据、增长性数据及其可计算方面探讨了大数据相关分析的研究挑战. 展开更多
关键词 大数据 相关分析 相关系数 信息熵
下载PDF
从人类智能到机器实现模型——粒计算理论与方法 被引量:62
2
作者 苗夺谦 张清华 +7 位作者 钱宇华 梁吉业 王国胤 吴伟志 高阳 商琳 顾沈明 张红云 《智能系统学报》 CSCD 北大核心 2016年第6期743-757,共15页
人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,是对人的意识、思维过程的模拟。粒计算是当前智能信息处理领域中一种新的概念和计算范式,是研究基于多层次粒结构的思维方式、复杂... 人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,是对人的意识、思维过程的模拟。粒计算是当前智能信息处理领域中一种新的概念和计算范式,是研究基于多层次粒结构的思维方式、复杂问题求解、信息处理模式及其相关理论、技术和工具的方法论。本文首先分析了人工智能模拟人脑智能的粒计算模式与方法,其次总结了粗糙集、商空间、模糊集、云模型、三支决策等几种典型的粒计算基本构架与数学模型,然后分析知识的多粒度解析表示与不确定性度量的研究现状,最后展望了粒计算求解模式在大数据时代所面临的机遇与挑战。 展开更多
关键词 人工智能 大数据 不确定性 粒计算 多粒度 粗糙集 商空间 模糊集 云模型 三支决策
下载PDF
信息系统中的信息粒与熵理论 被引量:51
3
作者 梁吉业 钱宇华 《中国科学(E辑)》 CSCD 北大核心 2008年第12期2048-2065,共18页
信息粒度与熵理论是两种有效进行信息系统中不确定性研究的重要工具,已有许多成功的应用范例.文中研究了不同二元关系下信息系统中信息粒的刻画和表示,给出了信息系统中信息粒度的公理化定义,证实了一些已有的信息粒度度量都是其特殊形... 信息粒度与熵理论是两种有效进行信息系统中不确定性研究的重要工具,已有许多成功的应用范例.文中研究了不同二元关系下信息系统中信息粒的刻画和表示,给出了信息系统中信息粒度的公理化定义,证实了一些已有的信息粒度度量都是其特殊形式.发展了信息系统中的熵理论,证明了这些熵度量的粒化单调性.同时,在信息系统意义下,建立了信息粒度与熵之间的互补关系.这些研究统一了完备信息系统与非完备信息系统中不确定性度量的相关结果. 展开更多
关键词 信息系统 信息粒 信息粒度 粗糙集
原文传递
基于框架语义分析的汉语句子相似度计算 被引量:47
4
作者 李茹 王智强 +2 位作者 李双红 梁吉业 Collin Baker 《计算机研究与发展》 EI CSCD 北大核心 2013年第8期1728-1736,共9页
句子相似度计算在自然语言处理的许多领域中发挥着重要作用.已有的汉语句子相似度计算方法由于考虑句子的语义不全面,使得相似度计算结果不够准确,为此提出一种新的汉语句子相似度计算方法.该方法基于汉语框架网语义资源,通过多框架语... 句子相似度计算在自然语言处理的许多领域中发挥着重要作用.已有的汉语句子相似度计算方法由于考虑句子的语义不全面,使得相似度计算结果不够准确,为此提出一种新的汉语句子相似度计算方法.该方法基于汉语框架网语义资源,通过多框架语义分析、框架的重要度度量、框架的相似匹配、框架间相似度计算等关键步骤来实现句子语义的相似度量.其中多框架语义分析是从框架角度对句子中的所有目标词进行识别、框架选择及框架元素标注,从而达到全面刻画句子语义的目的;在此基础上根据句子中框架的语义覆盖范围对不同框架的重要度进行区分,能够使得相似度结果更准确.在包含多目标词的句子集上的实验结果显示,基于多框架语义分析的句子相似度计算方法相对传统方法获得了更好的测试结果. 展开更多
关键词 汉语框架网 多框架语义分析 句子语义相似度 框架相似度 框架重要度
下载PDF
基于新的距离度量的K-Modes聚类算法 被引量:46
5
作者 梁吉业 白亮 曹付元 《计算机研究与发展》 EI CSCD 北大核心 2010年第10期1749-1755,共7页
传统的K-Modes聚类算法采用简单的0-1匹配差异方法来计算同一分类属性下两个属性值之间的距离,没有充分考虑其相似性.对此,基于粗糙集理论,提出了一种新的距离度量.该距离度量在度量同一分类属性下两个属性值之间的差异时,克服了简单0-... 传统的K-Modes聚类算法采用简单的0-1匹配差异方法来计算同一分类属性下两个属性值之间的距离,没有充分考虑其相似性.对此,基于粗糙集理论,提出了一种新的距离度量.该距离度量在度量同一分类属性下两个属性值之间的差异时,克服了简单0-1匹配差异法的不足,既考虑了它们本身的异同,又考虑了其他相关分类属性对它们的区分性.并将提出的距离度量应用于传统K-Modes聚类算法中.通过与基于其他距离度量的K-Modes聚类算法进行实验比较,结果表明新的距离度量是更加有效的. 展开更多
关键词 聚类算法 分类属性数据 粗糙集 粗糙隶属度 距离度量
下载PDF
一种基于信息熵的混合数据属性加权聚类算法 被引量:43
6
作者 赵兴旺 梁吉业 《计算机研究与发展》 EI CSCD 北大核心 2016年第5期1018-1028,共11页
同时兼具数值型和分类型属性的混合数据在实际应用中普通存在,混合数据的聚类分析越来越受到广泛的关注.为解决高维混合数据聚类中属性加权问题,提出了一种基于信息熵的混合数据属性加权聚类算法,以提升模式发现的效果.工作主要包括:首... 同时兼具数值型和分类型属性的混合数据在实际应用中普通存在,混合数据的聚类分析越来越受到广泛的关注.为解决高维混合数据聚类中属性加权问题,提出了一种基于信息熵的混合数据属性加权聚类算法,以提升模式发现的效果.工作主要包括:首先为了更加准确客观地度量对象与类之间的差异性,设计了针对混合数据的扩展欧氏距离;然后,在信息熵框架下利用类内信息熵和类间信息熵给出了聚类结果中类内抱团性及一个类与其余类分离度的统一度量机制,并基于此给出了一种属性重要性度量方法,进而设计了一种基于信息熵的属性加权混合数据聚类算法.在10个UCI数据集上的实验结果表明,提出的算法在4种聚类评价指标下优于传统的属性未加权聚类算法和已有的属性加权聚类算法,并通过统计显著性检验表明本文提出算法的聚类结果与已有算法聚类结果具有显著差异性. 展开更多
关键词 聚类分析 混合数据 属性加权 信息熵 相异性度量
下载PDF
融合社交网络信息的协同过滤推荐算法 被引量:40
7
作者 郭兰杰 梁吉业 赵兴旺 《模式识别与人工智能》 EI CSCD 北大核心 2016年第3期281-288,共8页
在推荐系统中,协同过滤推荐算法往往面临数据集的高度稀疏性和推荐精度有限的问题.为了解决上述问题,在基于物品的协同过滤推荐框架下,分别在物品相似度的计算和用户对物品的评分预测阶段,利用社交网络中朋友关系信息选择性地填充评分... 在推荐系统中,协同过滤推荐算法往往面临数据集的高度稀疏性和推荐精度有限的问题.为了解决上述问题,在基于物品的协同过滤推荐框架下,分别在物品相似度的计算和用户对物品的评分预测阶段,利用社交网络中朋友关系信息选择性地填充评分矩阵中的缺失值,最大化利用评分矩阵中的已有信息,提出融合社交网络信息的协同过滤推荐算法.最后,在Epinions数据集上的实验表明,文中算法在一定程度上缓解数据稀疏性问题,同时在评分误差和分类准确率两个指标上优于其它协同过滤算法. 展开更多
关键词 协同过滤 社交网络 缺失值填充 数据稀疏性
下载PDF
基于同义词的词汇情感倾向判别方法 被引量:36
8
作者 王素格 李德玉 +1 位作者 魏英杰 宋晓雷 《中文信息学报》 CSCD 北大核心 2009年第5期68-74,共7页
词汇的情感倾向直接影响短语、句子、段落、篇章等更高层次语言粒度的情感倾向。对于基准词选取问题,该文提出了基于类别区分能力与情感词词表相结合的方法。考虑到词汇与其同义词很大程度上具有相同的情感倾向,我们提出了基于同义词的... 词汇的情感倾向直接影响短语、句子、段落、篇章等更高层次语言粒度的情感倾向。对于基准词选取问题,该文提出了基于类别区分能力与情感词词表相结合的方法。考虑到词汇与其同义词很大程度上具有相同的情感倾向,我们提出了基于同义词的词汇情感倾向判别方法,这种方法一定程度上避免了数据稀疏问题。实验结果表明,基于同义词的词汇情感倾向判别方法优于仅采用目标词与基准词的词汇情感倾向判别方法。 展开更多
关键词 计算机应用 中文信息处理 词汇情感倾向 基准词 关联强度 同义词
下载PDF
面向特定领域的产品评价对象自动识别研究 被引量:34
9
作者 宋晓雷 王素格 李红霞 《中文信息学报》 CSCD 北大核心 2010年第1期89-93,共5页
产品评价对象的自动识别是文本观点信息抽取和倾向性分析中的重要研究课题之一。该文针对汽车评论,提出了一种不依赖外部资源的无指导评价对象自动识别方法。该方法首先综合使用词形模板和词性模板,采用模糊匹配方法和剪枝法抽取候选评... 产品评价对象的自动识别是文本观点信息抽取和倾向性分析中的重要研究课题之一。该文针对汽车评论,提出了一种不依赖外部资源的无指导评价对象自动识别方法。该方法首先综合使用词形模板和词性模板,采用模糊匹配方法和剪枝法抽取候选评价对象。然后,从候选对象集中,采用双向Bootstrapping方法识别出产品评价对象。最后,通过采用K均值聚类方法对产品评价对象进行聚类,实现从评价对象中自动抽取产品名称和产品属性。实验结果表明,该方法对产品评价对象识别的F值达到58.5%,产品名称识别的F值达到69.48%。 展开更多
关键词 计算机应用 中文信息处理 产品评价对象 产品名称 产品属性 模板 K均值聚类 双向Bootstrapping方法
下载PDF
形式概念分析对粗糙集理论的表示及扩展 被引量:27
10
作者 曲开社 翟岩慧 +1 位作者 梁吉业 李德玉 《软件学报》 EI CSCD 北大核心 2007年第9期2174-2182,共9页
侧重于建立形式概念分析与粗糙集之间融合的理论基础.利用形式概念分析中名义梯级背景(nominal scale)的概念,对信息系统进行平面梯级(plain scaling)得到了衍生的形式背景.证明了粗糙集理论中的划分、上下近似、独立、依赖、约简等核... 侧重于建立形式概念分析与粗糙集之间融合的理论基础.利用形式概念分析中名义梯级背景(nominal scale)的概念,对信息系统进行平面梯级(plain scaling)得到了衍生的形式背景.证明了粗糙集理论中的划分、上下近似、独立、依赖、约简等核心概念都可以在相应的衍生背景中进行表示.揭示了粗糙集理论在分析处理数据时的局限性,指出了利用梯级的方法可以扩展粗糙集理论. 展开更多
关键词 粗糙集 形式概念分析 名义梯级背号 平面梯级 概念格
下载PDF
一种基于社区专家信息的协同过滤推荐算法 被引量:28
11
作者 张凯涵 梁吉业 +1 位作者 赵兴旺 王智强 《计算机研究与发展》 EI CSCD 北大核心 2018年第5期968-976,共9页
协同过滤推荐算法由于不受特定领域知识限制、简单易实现等优点,得到了广泛的应用.但是,在实际应用中,该类算法往往面临着数据稀疏性、可扩展性、冷启动等问题.为了解决其中的用户冷启动问题,将用户社交信息和评分信息进行融合,提出了... 协同过滤推荐算法由于不受特定领域知识限制、简单易实现等优点,得到了广泛的应用.但是,在实际应用中,该类算法往往面临着数据稀疏性、可扩展性、冷启动等问题.为了解决其中的用户冷启动问题,将用户社交信息和评分信息进行融合,提出了一种基于社区专家信息的协同过滤推荐算法.首先,依据用户的社交关系将用户划分为不同的社区;其次,根据一定的准则确定各个社区的专家,并利用社交信息和评分信息对专家评分进行填充进而缓解稀疏性;最后,对冷启动用户根据其所属社区的专家信息进行预测评分.在数据集FilmTrust和Epinions上与已有协同过滤推荐算法进行了比较分析.实验结果表明,提出的算法可以有效缓解协同过滤推荐算法中的用户冷启动问题,并在平均绝对误差和均方根误差2个评价指标上优于已有算法. 展开更多
关键词 推荐系统 协同过滤 冷启动 社区 专家信息
下载PDF
基于神经网络的支持向量机学习方法研究 被引量:23
12
作者 郭虎升 王文剑 《计算机工程与应用》 CSCD 北大核心 2009年第2期51-54,共4页
针对支持向量机(Support Vector Machine,SVM)对大规模样本分类效率低下的问题,提出了基于自适应共振理论(Adaptive Resonance Theory,ART)神经网络与自组织特征映射(Self-Organizing feature Map,SOM)神经网络的SVM训练算法,分别称为AR... 针对支持向量机(Support Vector Machine,SVM)对大规模样本分类效率低下的问题,提出了基于自适应共振理论(Adaptive Resonance Theory,ART)神经网络与自组织特征映射(Self-Organizing feature Map,SOM)神经网络的SVM训练算法,分别称为ART-SVM算法与SOM-SVM算法。这两种算法通过聚类压缩数据集,使SVM训练的速度大大提高,同时可获得令人满意的泛化能力。 展开更多
关键词 支持向量机 ART-SVM算法 SOM-SVM算法 聚类
下载PDF
基于欠采样和代价敏感的不平衡数据分类算法 被引量:24
13
作者 王俊红 闫家荣 《计算机应用》 CSCD 北大核心 2021年第1期48-52,共5页
针对不平衡数据集中的少数类在传统分类器上预测精度低的问题,提出了一种基于欠采样和代价敏感的不平衡数据分类算法——USCBoost。首先在AdaBoost算法每次迭代训练基分类器之前对多数类样本按权重由大到小进行排序,根据样本权重选取与... 针对不平衡数据集中的少数类在传统分类器上预测精度低的问题,提出了一种基于欠采样和代价敏感的不平衡数据分类算法——USCBoost。首先在AdaBoost算法每次迭代训练基分类器之前对多数类样本按权重由大到小进行排序,根据样本权重选取与少数类样本数量相当的多数类样本;之后将采样后的多数类样本权重归一化并与少数类样本组成临时训练集训练基分类器;其次在权重更新阶段,赋予少数类更高的误分代价,使得少数类样本权重增加更快,并且多数类样本权重增加更慢。在10组UCI数据集上,将USCBoost与AdaBoost、AdaCost、RUSBoost进行对比实验。实验结果表明USCBoost在F1-measure和G-mean准则下分别在6组和9组数据集获得了最高的评价指标。可见所提算法在不平衡数据上具有更好的分类性能。 展开更多
关键词 不平衡数据 分类 代价敏感 ADABOOST算法 欠采样
下载PDF
一种小样本数据的特征选择方法 被引量:24
14
作者 许行 张凯 王文剑 《计算机研究与发展》 EI CSCD 北大核心 2018年第10期2321-2330,共10页
小样本数据由于其特征维数相对于样本数目较多,且常包含不相关或冗余特征,使得常用的机器学习算法处理小样本数据时无法得到好的效果,通过特征选择来降低数据维数是解决该问题的一种有效途径.针对小样本数据,提出一种基于互信息的过滤... 小样本数据由于其特征维数相对于样本数目较多,且常包含不相关或冗余特征,使得常用的机器学习算法处理小样本数据时无法得到好的效果,通过特征选择来降低数据维数是解决该问题的一种有效途径.针对小样本数据,提出一种基于互信息的过滤型特征选择方法,首先定义了基于互信息的特征分组标准,该标准同时考虑特征与类别的相关性和不同特征之间的冗余性,根据该标准对特征分组后,在各组内选出与类别相关性最大的特征构成候选特征子集,保证了算法具有较低的时间复杂度,之后采用Boruta算法,在候选特征子集中自动确定最佳特征子集,从而大幅度降低数据的维数.通过与5种经典的特征选择算法比较,在标准数据集上采用3种分类器的实验结果表明提出的方法选出的特征子集具有较好的运行效率和分类性能. 展开更多
关键词 小样本数据 特征选择 互信息 特征分组 过滤型算法
下载PDF
基于数据场的改进DBSCAN聚类算法 被引量:21
15
作者 杨静 高嘉伟 +1 位作者 梁吉业 刘杨磊 《计算机科学与探索》 CSCD 2012年第10期903-911,共9页
DBSCAN(density based spatial clustering of applications with noise)算法是一种典型的基于密度的聚类算法。该算法可以识别任意形状的类簇,但聚类结果依赖于参数Eps和MinPts的选择,而且对于一些密度差别较大的数据集,可能得不到具... DBSCAN(density based spatial clustering of applications with noise)算法是一种典型的基于密度的聚类算法。该算法可以识别任意形状的类簇,但聚类结果依赖于参数Eps和MinPts的选择,而且对于一些密度差别较大的数据集,可能得不到具有正确类簇个数的聚类结果,也可能将部分数据错分为噪声。为此,利用数据场能较好描述数据分布,反映数据关系的优势,提出了一种基于数据场的改进DBSCAN聚类算法。该算法引入平均势差的概念,在聚类过程中动态地确定每个类的Eps和平均势差,从而能够在一些密度相差较大的数据集上得到较好的聚类结果。实验表明,所提算法的性能优于DBSCAN算法。 展开更多
关键词 DBSCAN算法 数据场 聚类
下载PDF
一种不完备混合数据集成聚类算法 被引量:20
16
作者 史倩玉 梁吉业 赵兴旺 《计算机研究与发展》 EI CSCD 北大核心 2016年第9期1979-1989,共11页
集成聚类技术由于具有较好的泛化能力,目前引起了研究者的高度关注.已有研究主要关注数值型完备数据的集成聚类问题.然而,实际应用中面临的数据往往是兼具数值属性和分类属性共同描述的混合型数据,而且通常带有缺失值.为此,针对不完备... 集成聚类技术由于具有较好的泛化能力,目前引起了研究者的高度关注.已有研究主要关注数值型完备数据的集成聚类问题.然而,实际应用中面临的数据往往是兼具数值属性和分类属性共同描述的混合型数据,而且通常带有缺失值.为此,针对不完备混合数据提出了一种集成聚类算法,首先利用3种缺失值填充方法对不完备混合数据进行完备化处理;其次在3种填充后的不同完备数据集上分别多次执行K-Prototypes算法产生基聚类结果;最后对基聚类结果进行集成.在UCI真实数据集上与传统聚类算法通过实验进行了比较分析,实验结果表明提出的算法是有效的. 展开更多
关键词 集成聚类 不完备数据 混合数据 缺失值填充 K原型聚类算法
下载PDF
基于混合采样的非平衡数据分类算法 被引量:20
17
作者 吴艺凡 梁吉业 王俊红 《计算机科学与探索》 CSCD 北大核心 2019年第2期342-349,共8页
过采样和欠采样方法是处理非平衡数据集分类的常用方法,但使用单一的采样算法可能造成少数类样本过拟合或者丢失含有重要信息的样本。提出了基于分类超平面的混合采样算法SVM_HS(hybrid sampling algorithm based on support vector mac... 过采样和欠采样方法是处理非平衡数据集分类的常用方法,但使用单一的采样算法可能造成少数类样本过拟合或者丢失含有重要信息的样本。提出了基于分类超平面的混合采样算法SVM_HS(hybrid sampling algorithm based on support vector machine),旨在克服SVM算法在处理非平衡数据时分类超平面容易偏向少数类样本的问题。该算法首先利用SVM算法得到分类超平面。然后迭代进行混合采样,主要包括:(1)删除离分类超平面较远的一些多数类样本;(2)对靠近真实类边界的少数类样本用SMOTE(synthetic minority oversampling technique)过采样,使分类超平面向着真实类边界方向偏移。实验结果表明相比其他相关算法,该算法的F-value值和G-mean值均有较大提高。 展开更多
关键词 非平衡 支持向量机(SVM) 少数类样本过采样技术(SMOTE) 分类超平面 混合采样
下载PDF
基于汉语篇章框架语义分析的阅读理解问答研究 被引量:19
18
作者 王智强 李茹 +3 位作者 梁吉业 张旭华 武娟 苏娜 《计算机学报》 EI CSCD 北大核心 2016年第4期795-807,共13页
答案句检索和答案抽取是阅读理解中的两个核心技术.针对汉语阅读理解,该文提出一种新的基于篇章框架语义分析的答案句检索和答案抽取方法.答案句检索是基于框架相似性、框架关系及篇章框架关系来实现.其中,基于框架相似性的方法是通过... 答案句检索和答案抽取是阅读理解中的两个核心技术.针对汉语阅读理解,该文提出一种新的基于篇章框架语义分析的答案句检索和答案抽取方法.答案句检索是基于框架相似性、框架关系及篇章框架关系来实现.其中,基于框架相似性的方法是通过计算背景材料与问句之间语义场景(框架)的相似度来进行答案句检索;基于框架关系和篇章框架关系的方法可以从语义相关角度获得与问句语义相关的答案句.在答案抽取时,提出基于框架语义相似性、有定零形式线索及框架关系的答案抽取方法.基于框架语义相似性可以从语义相似的答案句中抽取出充当问句疑问角色的框架元素作为答案;有定零形式线索能够在篇章范围定位答案句中充当答案的缺失语义成分;框架关系则能够通过建立框架元素之间的关系,抽取相关度高的框架元素作为答案.针对15个领域的552个阅读理解问题,该方法在答案句检索时相比传统基于相似度的方法能够获得更好的答案句检索结果;相比基于框架相似性的Baseline实验,加入篇章框架关系、框架关系及有定零形式线索的篇章级框架语义特征,能够获得更优的答案句检索与答案抽取结果. 展开更多
关键词 框架语义分析 阅读理解 框架关系 有定零形式 篇章框架关系 社会媒体 社交网络 自然语言处理
下载PDF
基于赋权粗糙隶属度的文本情感分类方法 被引量:19
19
作者 王素格 李德玉 魏英杰 《计算机研究与发展》 EI CSCD 北大核心 2011年第5期855-861,共7页
提出了基于赋权粗糙隶属度的文本情感分类方法.该方法将特征倾向强度引入到文本的向量空间表示法中,建立了基于二元组属性(特征,特征倾向强度)的文本表示模型.提出了基于情感倾向强度序的属性离散化方法,将特征选择寓于离散化过程,达到... 提出了基于赋权粗糙隶属度的文本情感分类方法.该方法将特征倾向强度引入到文本的向量空间表示法中,建立了基于二元组属性(特征,特征倾向强度)的文本表示模型.提出了基于情感倾向强度序的属性离散化方法,将特征选择寓于离散化过程,达到数据降维的目的.利用特征倾向强度,定义了赋权粗糙隶属度,用于新文本的情感分类.在真实汽车评论语料上,与支持向量机分类模型进行比较实验表明,基于赋权粗糙隶属度的文本情感分类方法在对数据进行一定程度的压缩后仍表现出较好的分类性能. 展开更多
关键词 文本情感分类 文本表示 情感倾向强度 离散化 粗糙隶属度
下载PDF
基于依存关系的旅游景点评论的特征-观点对抽取 被引量:17
20
作者 王素格 吴苏红 《中文信息学报》 CSCD 北大核心 2012年第3期116-121,共6页
特征—观点对的抽取是观点挖掘中非常重要的研究课题之一。该文首先利用依存语法对句子进行了依存分析,在此基础上研究了旅游评论文本中特征-观点对的抽取。利用词对间的依存关系,构建了获取含有特征和观点词语的组块规则,并设计了候选... 特征—观点对的抽取是观点挖掘中非常重要的研究课题之一。该文首先利用依存语法对句子进行了依存分析,在此基础上研究了旅游评论文本中特征-观点对的抽取。利用词对间的依存关系,构建了获取含有特征和观点词语的组块规则,并设计了候选特征的识别算法和特征—观点对的抽取算法。该文对山西旅游景点评论语料进行了实验,结果表明,特征—观点对的抽取整体的F1值达到了87.10%,验证了方法的有效性。 展开更多
关键词 特征-观点对 依存关系 组块
下载PDF
上一页 1 2 27 下一页 到第
使用帮助 返回顶部