期刊文献+
共找到200篇文章
< 1 2 10 >
每页显示 20 50 100
综合评价方法分类及适用性研究 被引量:63
1
作者 张霞 何南 《统计与决策》 CSSCI 北大核心 2022年第6期31-36,共6页
在综合评价过程中,权重的确定是综合评价的关键环节,综合评价方法是获得评价结果的重要手段。只有针对不同问题选择合适的综合评价方法,才能使获得的评价结果具有准确性和科学性。文章首先采用文献综述法,总结9种综合评价方法的原理和... 在综合评价过程中,权重的确定是综合评价的关键环节,综合评价方法是获得评价结果的重要手段。只有针对不同问题选择合适的综合评价方法,才能使获得的评价结果具有准确性和科学性。文章首先采用文献综述法,总结9种综合评价方法的原理和特点。其次,根据权重将9种综合评价方法划分为两类,并验证方法分类条件的可行性。然后,以案例数据为例,应用两类方法进行评价,分析两类方法的计算原理,为提出的两类方法的适用条件提供依据。最后,提出了综合评价方法的适用条件:第一类综合评价方法适用于解决确定权重或选取影响因素的问题;第二类综合评价方法适用于解决需要改善实践过程或提出优化建议、方案优选或实施奖惩的评价等问题。所提出的分类方法及适用条件,为综合评价方法的未来研究提供了新思路。 展开更多
关键词 综合评价方法 权重 方法分类 适用条件
下载PDF
基于词典与机器学习的中文微博情感分析研究 被引量:50
2
作者 孙建旺 吕学强 张雷瀚 《计算机应用与软件》 CSCD 北大核心 2014年第7期177-181,共5页
随着Web2.0时代的兴起,与微博相关的研究得到学术界和工业界的广泛关注。选取微博文本中的动词和形容词作为特征;提出基于层次结构的特征降维方法;采用设计的基于表情符号的方法计算特征极性值;在此基础上,提出基于特征极性值的位置权... 随着Web2.0时代的兴起,与微博相关的研究得到学术界和工业界的广泛关注。选取微博文本中的动词和形容词作为特征;提出基于层次结构的特征降维方法;采用设计的基于表情符号的方法计算特征极性值;在此基础上,提出基于特征极性值的位置权重计算方法,借助SVM作为机器学习模型将微博文本分为正面、负面和中性三类。实验结果表明,提出的方法能够比较有效地对中文微博文本进行情感分类。 展开更多
关键词 微博 表情符号 极性值 位置权重 情感分类
下载PDF
K-最近邻分类技术的改进算法 被引量:25
3
作者 王晓晔 王正欧 《电子与信息学报》 EI CSCD 北大核心 2005年第3期487-491,共5页
该文提出了一种改进的K-最近邻分类算法。该算法首先将训练事例集中的每一类样本进行聚类,既减小了训练事例集的数据量,又去除了孤立点,大大提高了算法的快速性和预测精度,从而使该算法适用于海量数据集的情况。同时,在算法中根据每个... 该文提出了一种改进的K-最近邻分类算法。该算法首先将训练事例集中的每一类样本进行聚类,既减小了训练事例集的数据量,又去除了孤立点,大大提高了算法的快速性和预测精度,从而使该算法适用于海量数据集的情况。同时,在算法中根据每个属性对分类贡献的大小,采用神经网络计算其权重,将这些属性权重用在最近邻计算中,从而提高了算法的分类精度。在几个标准数据库和实际数据库上的实验结果表明,该算法适合于对复杂而数据量比较大的数据库进行分类。 展开更多
关键词 K-最近邻 聚类 权值调整 分类
下载PDF
基于熵权的K最临近算法改进 被引量:18
4
作者 王增民 王开珏 《计算机工程与应用》 CSCD 北大核心 2009年第30期129-131,160,共4页
维度灾难直接影响到K最临近算法(KNN)的效率和准确率,将信息论中的信息熵理论与KNN算法结合起来,用信息熵理论进行属性约简,并根据特征属性与分类的相关度来确定各属性的权限,从而建立相关度与权重的内在联系。仿真实验表明,与传统的KN... 维度灾难直接影响到K最临近算法(KNN)的效率和准确率,将信息论中的信息熵理论与KNN算法结合起来,用信息熵理论进行属性约简,并根据特征属性与分类的相关度来确定各属性的权限,从而建立相关度与权重的内在联系。仿真实验表明,与传统的KNN相比,基于熵权的KNN改进方法在保持分类效率的情况下,使分类器的准确率得到了极大的提高。 展开更多
关键词 K最邻近算法 熵权 属性约简 分类
下载PDF
Improved HVSR site classification method for free-field strong motion stations validated with Wenchuan aftershock recordings 被引量:16
5
作者 Wen Ruizhi Ren Yefei Shi Dacheng 《Earthquake Engineering and Engineering Vibration》 SCIE EI CSCD 2011年第3期325-337,共13页
Local site conditions play an important role in the effective application of strong motion recordings.In the China National Strong Motion Observation Network System(NSMONS),some of the stations do not provide boreho... Local site conditions play an important role in the effective application of strong motion recordings.In the China National Strong Motion Observation Network System(NSMONS),some of the stations do not provide borehole information,and correspondingly,do not assign the site classes yet.In this paper,site classification methodologies for free-field strong motion stations are reviewed and the limitations and uncertainties of the horizontal-to-vertical spectral ratio(HVSR) methods are discussed.Then,a new method for site classification based on the entropy weight theory is proposed.The proposed method avoids the head or tail joggle phenomenon by providing the objective and subjective weights.The method was applied to aftershock recordings from the 2008 Wenchuan earthquake,and 54 free-field NSMONS stations were selected for site classification and the mean HVSRs were calculated.The results show that the improved HVSR method proposed in this paper has a higher success rate and could be adopted in NSMONS. 展开更多
关键词 site classification strong motion recording entropy weight theory horizontal-to-vertical spectrum ratio Wenchuan earthquake aftershock head-tail joggle
下载PDF
一种新的基于粗集的辐射源信号识别模型 被引量:15
6
作者 关欣 何友 衣晓 《宇航学报》 EI CAS CSCD 北大核心 2007年第3期685-688,共4页
粗糙集理论作为一种新的处理含糊和不确定性问题的数学工具,已成为国际学术界的一个前沿的研究领域。在深入研究粗糙集理论的基础上,将其引入辐射源识别问题中,给出了一种基于粗糙集的辐射源信号识别模型。同时给出了一种不依赖先验知... 粗糙集理论作为一种新的处理含糊和不确定性问题的数学工具,已成为国际学术界的一个前沿的研究领域。在深入研究粗糙集理论的基础上,将其引入辐射源识别问题中,给出了一种基于粗糙集的辐射源信号识别模型。同时给出了一种不依赖先验知识确定辐射源识别权值的新方法,并提出了一种新的分类规则。最后,进行了计算机仿真实验,并与经典的模糊模式识别及统计模式识别方法进行了比较,实验结果证明了该方法的优势和有效性。 展开更多
关键词 粗糙集 辐射源识别 离散 权系数 模式分类
下载PDF
中文网页分类的研究与实现 被引量:13
7
作者 程传鹏 《中原工学院学报》 CAS 2007年第1期61-64,共4页
描述了一个完整的中文网页分类系统的设计和实现过程,重点介绍了网页分类中的网页净化、特征加权、KNN分类等关键技术.并结合网页的特征,对分类中的特征加权公式进行了一定的改进.实验结果表明改进后的特征加权公式取得了较高的分类准确率.
关键词 网页分类 网页净化 特征加权 KNN分类
下载PDF
关于权数与赋权方法分类的探讨 被引量:14
8
作者 孙慧钧 《东北财经大学学报》 2009年第4期3-7,共5页
本文在提出了权数的三种分类方案的基础上,形成了关于权数的分类体系。随后又依据按性质划分的权数方案以及赋权数据的来源,将各种确定权数的方法进行了归类与分类,并将它们予以整合而组成了一套完整的权数分类与赋权方法分类的对应关... 本文在提出了权数的三种分类方案的基础上,形成了关于权数的分类体系。随后又依据按性质划分的权数方案以及赋权数据的来源,将各种确定权数的方法进行了归类与分类,并将它们予以整合而组成了一套完整的权数分类与赋权方法分类的对应关系体系。 展开更多
关键词 权数 赋权方法 分类
下载PDF
一种基于属性加权补集的朴素贝叶斯文本分类算法 被引量:14
9
作者 陈凯 黄英来 +1 位作者 高文韬 赵鹏 《哈尔滨理工大学学报》 CAS 北大核心 2018年第4期69-74,共6页
针对文本训练集中各个类别的样本分布不均衡时,少数类别的特征会被多数类别的特征淹没的问题,提出一种属性加权补集的朴素贝叶斯文本分类算法,该算法使用属性加权改进补集朴素贝叶斯算法,使用TF-IDF算法计算特征词在当前文档中的权重;... 针对文本训练集中各个类别的样本分布不均衡时,少数类别的特征会被多数类别的特征淹没的问题,提出一种属性加权补集的朴素贝叶斯文本分类算法,该算法使用属性加权改进补集朴素贝叶斯算法,使用TF-IDF算法计算特征词在当前文档中的权重;利用当前类别补集的特征表示当前类别的特征并结合特征词在文档中的权重,解决分类器容易倾向大类别而忽略小类别的问题。与传统的朴素贝叶斯及补集朴素贝叶斯算法进行对比实验,结果表明:在样本集分布不均衡时,改进算法的性能表现最优,分类准确率、召回率及G-mean性能分别可达82.92%、84.6%、88.76%。 展开更多
关键词 属性加权 文本分类 朴素贝叶斯 不均衡数据集
下载PDF
非遗传因素对西门塔尔牛主要经济性状的影响 被引量:12
10
作者 魏趁 葛建军 +7 位作者 张梦华 张晓雪 刘丽元 王丹 张春红 马新兵 黄锡霞 马光辉 《中国农业大学学报》 CAS CSCD 北大核心 2017年第6期91-99,共9页
为探讨非遗传因素对西门塔尔母牛主要经济性状的影响规律,利用新疆呼图壁种牛场1989—2014年间共1 492头西门塔尔牛的生产性能记录,分析了不同胎次、产犊年份、产犊季节、产犊年龄对西门塔尔牛305d产奶量、体高、硬长、软长、胸围、腹... 为探讨非遗传因素对西门塔尔母牛主要经济性状的影响规律,利用新疆呼图壁种牛场1989—2014年间共1 492头西门塔尔牛的生产性能记录,分析了不同胎次、产犊年份、产犊季节、产犊年龄对西门塔尔牛305d产奶量、体高、硬长、软长、胸围、腹围、尻宽、尻长、腿围、管围、体重和外貌评分的影响,并进行了最小二乘分析。结果表明:不同胎次、产犊年份、产犊年龄对西门塔尔牛305d产奶量、体高、硬长、软长、胸围、腹围、尻宽、尻长、腿围、管围、体重和外貌评分有极显著的影响(P<0.01);不同产犊季节对西门塔尔牛305d产奶量、体高、胸围、尻宽、尻长、腿围、管围、体重和外貌评分有极显著的影响(P<0.01),对硬长、软长、腹围没有显著的影响(P>0.05)。 展开更多
关键词 西门塔尔牛 305天产奶量 体尺 体重 外貌评分
原文传递
收治病种结构对医院CMI值的影响 被引量:10
11
作者 廖慧群 麦紫娟 廖彩霞 《中国病案》 2022年第1期10-12,共3页
目的评估收治病种结构改变对CMI值的影响,为医院提高医疗质量和效率提供参考。方法将改革前2020年1月1日-2020年6月30日20916住院人次,以及改革后2020年7月1日-2020年12月31日25619住院人次作为研究对象。通过完善双向转诊模式、加强住... 目的评估收治病种结构改变对CMI值的影响,为医院提高医疗质量和效率提供参考。方法将改革前2020年1月1日-2020年6月30日20916住院人次,以及改革后2020年7月1日-2020年12月31日25619住院人次作为研究对象。通过完善双向转诊模式、加强住院病案首页培训、坚持医保惠民政策及开展专科疑难技术等举措后,对RW<0.5人次变动、DRG与绩效考核相关指标、RW<0.5和RW≥0.5人次、平均疾病诊断个数、平均手术与操作个数等方面进行差异比较。结果改革前后10个RW<0.5的DRG组人次对比,均为P<0.05有统计学意义。改革前DRG组数从604组上升到改革后648组,CMI值从0.93提高至1.11。下转人次增长54.05%,日间手术人次增长262.60%。改革前后出院患者RW<0.5与RW≥1.5相比,P<0.05有统计学意义。改革前RW≥1.5人次占比为10.85%,改革后占比上升到15.97%。改革后入组患者的平均疾病诊断个数为(3.80±3.51),平均手术与操作个数为(2.15±3.31),与改革前相比,P<0.05。结论借助三级综合医院评审标准和DRG评价体系,改变收治病种结构,提升收治疑难杂症患者能力,推动医院绩效考核,实现医院效率提高和质量提升。 展开更多
关键词 CMI RW DRG 病种结构 双向转诊 分级诊疗
原文传递
一种改进TF-IDF的中文邮件识别算法研究 被引量:9
12
作者 吴小晴 万国金 +2 位作者 李程文 林梦思 曹书强 《现代电子技术》 北大核心 2020年第12期83-86,共4页
传统的TF-IDF算法没有很好地分配分词的权重,对一些能代表邮件类别出现频率较大的词语计算的IDF值反而较小,IDF值小说明单词的区分能力弱而不符合实际情况。为了提升垃圾邮件识别的准确率,提出一种改进TF-IDF算法和类中心向量的中文垃... 传统的TF-IDF算法没有很好地分配分词的权重,对一些能代表邮件类别出现频率较大的词语计算的IDF值反而较小,IDF值小说明单词的区分能力弱而不符合实际情况。为了提升垃圾邮件识别的准确率,提出一种改进TF-IDF算法和类中心向量的中文垃圾邮件识别方法。通过改进传统的TF-IDF计算方式,在传统的TF-IDF算法里面加入卡方统计量CHI和位置影响因子能够很好地改善一些重要词汇的权重问题,并结合逆向最大匹配算法的邮件文本分词和类中心向量算法的特征选择进行垃圾邮件分类。实验结果表明,所提算法相较于传统的TF-IDF算法对垃圾邮件识别的准确率提升了约3.6%,具有一定的实际应用价值。 展开更多
关键词 TF-IDF算法 邮件识别 卡方统计量 权重分配 邮件分类 仿真分析
下载PDF
基于岩层参数贡献率分析的大岗山坝肩边坡模糊评判方法研究 被引量:9
13
作者 刘杰 李建林 +2 位作者 宛良朋 蔡健 肖蕾 《岩石力学与工程学报》 EI CAS CSCD 北大核心 2014年第S1期2835-2843,共9页
以大岗山坝肩边坡为算例,对不同岩层的变形模量、黏聚力和内摩擦角进行整体和局部折减计算其安全系数,得出不同参数在不同位置下对特定边坡稳定性的贡献率。该贡献率量化处理后应用到评价系统中,定量标定了不同岩层参数的权重分配,确定... 以大岗山坝肩边坡为算例,对不同岩层的变形模量、黏聚力和内摩擦角进行整体和局部折减计算其安全系数,得出不同参数在不同位置下对特定边坡稳定性的贡献率。该贡献率量化处理后应用到评价系统中,定量标定了不同岩层参数的权重分配,确定坡体综合力学参数的隶属度。根据规范要求,以安全系数1.30,1.175和1.05为界,通过线性回归分析有针对性的给出具体工程不同参数分级标准;确定不同岩层内参数所在稳定级别基础上,结合所占分析区域的面积比值,采用不同岩层的安全系数综合贡献率进行修正得出不同参数的隶属度矩阵。该方法对综合评价体系中部分模糊的成分进行了基于有限元计算的精确化处理,在权重分配、隶属度确定、分级标准确定及坡体综合力学参数确定等4个评判主要环节上以消弱主观因素带来的不确定性影响,与经验法相比工程针对性更强,结果得出更科学合理。 展开更多
关键词 边坡工程 坝肩边坡 有限元计算 权重 隶属度 分级标准
原文传递
基于多特征与复合分类法的中文微博情感分析 被引量:8
14
作者 吴维 肖诗斌 《北京信息科技大学学报(自然科学版)》 2013年第4期39-45,共7页
为了提高微博的情感分析的准确率,选取微博文本中的动词和形容词作为特征,提出了基于层次结构的特征降维方法,采用基于表情符号的方法计算特征极性值。在此基础上,提出了基于特征极性值的位置权重计算方法,借助支持向量机(SVM)作为机器... 为了提高微博的情感分析的准确率,选取微博文本中的动词和形容词作为特征,提出了基于层次结构的特征降维方法,采用基于表情符号的方法计算特征极性值。在此基础上,提出了基于特征极性值的位置权重计算方法,借助支持向量机(SVM)作为机器学习模型将微博文本分为正面、负面和中性3类。也就是多特征提取,结合字典法与机器学习法2种算法,来提高情感分析的准确率。实验结果表明,该方法能取得平均为72.16%的准确率。提出的基于多特征与复合分类器的情感分析方法能够比较有效地对中文微博文本进行情感分类。 展开更多
关键词 微博 表情符号 复合分类法 位置权重 情感分类
下载PDF
基于类信息的TF-IDF权重分析与改进 被引量:7
15
作者 姚严志 李建良 《计算机系统应用》 2021年第9期237-241,共5页
经典的TF-IDF算法仅考虑了特征词频率和逆文档频率等,忽略了特征词的类间、类内分布信息.本文通过TF-IDF算法计算特征词在不同规模语料库中的权重,分析特征词的类信息对权重的影响,并进一步针对该影响提出一种新的衡量特征词的类间、类... 经典的TF-IDF算法仅考虑了特征词频率和逆文档频率等,忽略了特征词的类间、类内分布信息.本文通过TF-IDF算法计算特征词在不同规模语料库中的权重,分析特征词的类信息对权重的影响,并进一步针对该影响提出一种新的衡量特征词的类间、类内分布信息的方法.本文通过增加两个新的权值,类间离散因子和类内离散因子,将其与经典的TF-IDF算法结合,提出了基于类信息的改进的TF-IDF-CI算法.本文通过朴素贝叶斯模型对改进后的算法的分类性能进行了验证.实验证明,改进后的权重算法在测试数据集上的表现,在准确率、召回率和F1值上均优于经典的TF-IDF算法. 展开更多
关键词 TF-IDF算法 类信息 权重分析 文本分类
下载PDF
基于熵权-集对分析模型的重大危险源安全等级评价研究 被引量:7
16
作者 刘惠临 麻金继 《灾害学》 CSCD 北大核心 2019年第4期41-46,共6页
针对国内危险化学品事故频发,但危险源分级监管研究不足的现状,尝试将集对分析理论应用于重大危险源安全等级评价中。以评价指标集合与分级标准集合构成一组集对,利用熵权法计算出各项评价指标的客观权重,再结合同异反联系度函数求出各... 针对国内危险化学品事故频发,但危险源分级监管研究不足的现状,尝试将集对分析理论应用于重大危险源安全等级评价中。以评价指标集合与分级标准集合构成一组集对,利用熵权法计算出各项评价指标的客观权重,再结合同异反联系度函数求出各指标单项联系度及加权平均联系度,以此为依据判定重大危险源的安全等级。研究案例的实施情况表明,熵权-集对分析模型充分考虑了危险源安全因素中的不确定性,并且通过熵权值能够识别出影响系统安全的关键指标;与传统方法相比,该模型具有较高的可行性和易操作性,可以为重大危险源的安全监管和事故预防工作提供理论支持。 展开更多
关键词 重大危险源 集对分析 联系度 熵权 指标体系 分级标准
下载PDF
基于基分类器系数和多样性的改进AdaBoost算法 被引量:7
17
作者 朱亮 徐华 崔鑫 《计算机应用》 CSCD 北大核心 2021年第8期2225-2231,共7页
针对传统AdaBoost算法的基分类器线性组合效率低以及过适应的问题,提出了一种基于基分类器系数与多样性的改进算法——WD AdaBoost。首先,根据基分类器的错误率与样本权重的分布状态,给出新的基分类器系数求解方法,以提高基分类器的组... 针对传统AdaBoost算法的基分类器线性组合效率低以及过适应的问题,提出了一种基于基分类器系数与多样性的改进算法——WD AdaBoost。首先,根据基分类器的错误率与样本权重的分布状态,给出新的基分类器系数求解方法,以提高基分类器的组合效率;其次,在基分类器的选择策略上,WD AdaBoost算法引入双误度量以增加基分类器间的多样性。在五个来自不同实际应用领域的数据集上,与传统AdaBoost算法相比,CeffAda算法使用新的基分类器系数求解方法使测试误差平均降低了1.2个百分点;同时,WD AdaBoost算法与WLDF_Ada、AD_Ada、sk_AdaBoost等算法相对比,具有更低的错误率。实验结果表明,WD AdaBoost算法能够更高效地集成基分类器,抵抗过拟合,并可以提高分类性能。 展开更多
关键词 权重 多样性 ADABOOST 双误度量 分类性能
下载PDF
皖北矿区回采巷道动态权值分类及其差异化支护 被引量:6
18
作者 李迎富 华心祝 +1 位作者 王晓虎 杨科 《采矿与安全工程学报》 EI CSCD 北大核心 2017年第6期1042-1050,共9页
皖北矿区回采巷道支护设计很大程度上依赖于技术人员的工程判断力和实践经验,导致有些巷道支护效果不佳,有些设计参数偏于保守,制约着矿井安全高效水平的提高。因此,在考虑层位岩性、节理裂隙、开采深度等因素基础上,定义了巷道顶板、... 皖北矿区回采巷道支护设计很大程度上依赖于技术人员的工程判断力和实践经验,导致有些巷道支护效果不佳,有些设计参数偏于保守,制约着矿井安全高效水平的提高。因此,在考虑层位岩性、节理裂隙、开采深度等因素基础上,定义了巷道顶板、底板及煤帮的稳定性判别指标。基于关键层理论,计算出顶板垮断极限层的层序数和采空区悬顶长度,推导出临界煤柱宽度计算式,从而确定了护巷煤柱稳定性判别指标,并进行了巷道围岩综合评价和整体分类。采用计算机数值模拟,拟合出分类指标与围岩塑性率的函数关系,计算了随围岩条件动态变化的分类指标权值,并依据基本顶来压当量及围岩塑性率函数的斜率变化,确定了围岩次分类的判别条件。结合皖北矿区回采巷道支护的成功实例,构建了包含巷道围岩力学参数、支护参数及其支护效果等信息的样本数据库,在综合考虑巷道类型及服务年限、区域类型、整体分类及围岩次分类基础上,优选试验巷道的支护方案,实现回采巷道支护决策安全可靠、经济合理。 展开更多
关键词 层位岩性 临界煤柱宽度 整体分类 围岩塑性率 动态权值 围岩次分类 差异化支护
原文传递
基于分类树模型的产后盆底肌筋膜疼痛的危险因素分析 被引量:5
19
作者 何雨欣 江华 +1 位作者 刘英慧 朱开欣 《安徽医药》 CAS 2023年第6期1192-1195,I0009,共5页
目的 构建产后盆底肌筋膜疼痛(MFPP)发病影响因素的分类树模型,寻找产后MFPP发生的危险因素。方法 选取2017年1—12月在南京市妇幼保健院常规产后检查的975例产妇,进行流行病学调查。205例产妇患有MFPP分为病例组,229例产妇无盆底功能... 目的 构建产后盆底肌筋膜疼痛(MFPP)发病影响因素的分类树模型,寻找产后MFPP发生的危险因素。方法 选取2017年1—12月在南京市妇幼保健院常规产后检查的975例产妇,进行流行病学调查。205例产妇患有MFPP分为病例组,229例产妇无盆底功能障碍性疾病(PFD)情况分为对照组。结果 病例组中轻、中、重度疼痛人数分别为27例、173例、5例。我们对病例组研究发现产后MFPP发病影响因素的分类树模型共有5层,筛选出4个解释变量:快肌最大值,慢肌平均值,产妇体质量指数(BMI),新生儿出生体质量。其中快肌最大值≤41.20μv且慢肌平均值≤6.85μv时,产后MFPP发生率为76.0%,分类树模型预测的受试者操作特征(ROC)曲线下面积(AUC)为69.1%,95%CI:(0.64,0.74)。结论 快肌最大值、慢肌平均值、产妇BMI及新生儿出生体质量为影响产后MFPP发生的危险因素,盆底肌电筛查中快肌最大值≤41.20μv和慢肌平均值≤6.85μv可作为筛查指标,对于这部分的产妇,需联合盆底肌疼痛检查是否存在产后MFPP。 展开更多
关键词 盆底疾病 分娩并发症 体质量 快缩型肌纤维 慢缩型肌纤维 盆底肌筋膜疼痛 危险因素 分类树 盆底肌电筛查
下载PDF
Words semantic orientation classification based on HowNet 被引量:4
20
作者 LI Dun MA Yong-tao GUO Jian-li 《The Journal of China Universities of Posts and Telecommunications》 EI CSCD 2009年第1期106-110,共5页
Based on the text orientation classification, a new measurement approach to semantic orientation of words was proposed. According to the integrated and detailed definition of words in HowNet, seed sets including the w... Based on the text orientation classification, a new measurement approach to semantic orientation of words was proposed. According to the integrated and detailed definition of words in HowNet, seed sets including the words with intense orientations were built up. The orientation similarity between the seed words and the given word was then calculated using the sentiment weight priority to recognize the semantic orientation of common words. Finally, the words' semantic orientation and the context were combined to recognize the given words' orientation. The experiments show that the measurement approach achieves better results for common words' orientation classification and contributes particularly to the text orientation classification of large granularities. 展开更多
关键词 text classification semantic orientation semantic similarity orientation weight priority HOWNET
原文传递
上一页 1 2 10 下一页 到第
使用帮助 返回顶部