期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
大规模分类任务的分层学习方法综述 被引量:17
1
作者 胡清华 王煜 +3 位作者 周玉灿 赵红 钱宇华 梁吉业 《中国科学:信息科学》 CSCD 北大核心 2018年第5期487-500,共14页
分层分类是一种利用数据类别间层次结构关系进行分类的任务,可以高效地组织和处理大规模数据.近些年来,在这个受到越来越多关注的领域中涌现出许多重要的工作.本文介绍分层分类的定义,并按照不同种类的问题解决策略,对大规模分层分类任... 分层分类是一种利用数据类别间层次结构关系进行分类的任务,可以高效地组织和处理大规模数据.近些年来,在这个受到越来越多关注的领域中涌现出许多重要的工作.本文介绍分层分类的定义,并按照不同种类的问题解决策略,对大规模分层分类任务中的几个基本问题的研究进行总结.首先,给出层次结构的形式化定义.其次,分别阐述如何设计分层评价指标、如何构建层次结构、如何利用层次结构信息进行特征选择、如何利用层次结构信息训练分类器以及如何面向层次结构设计停止机制,并介绍具有代表性的相关工作.最后,对大规模分层分类任务进行总结,并展望未来可能的研究方向. 展开更多
关键词 分层学习 层次结构构建 分层分类器学习 分层分类停止机制 分层特征选择 分类
原文传递
逐层特征选择的多层部件模型用于遥感图像飞机目标检测 被引量:5
2
作者 张宇 何楚 +1 位作者 石博 徐新 《武汉大学学报(信息科学版)》 EI CSCD 北大核心 2014年第12期1406-1411,共6页
提出了一种基于逐层特征选择的多层部件模型目标检测算法(multi-layer feature selection based hierarchal component model,MFSHCM),用于遥感图像飞机目标检测。通过提取目标多特征并结合局部判别式模型的建模方法,首先将提取的目标... 提出了一种基于逐层特征选择的多层部件模型目标检测算法(multi-layer feature selection based hierarchal component model,MFSHCM),用于遥感图像飞机目标检测。通过提取目标多特征并结合局部判别式模型的建模方法,首先将提取的目标多种特征采用多核学习的方法经过核函数变换后再进行组合,提高了目标描述的准确性;其次考虑到目标自身固有的结构特性,特别是层次结构关系,引入分层的思想,构造目标的分层结构特征,并通过分层特征选择有效地降低了特征计算的复杂度;最后将MKL多特征和分层结构相结合,利用LSVM学习和推理,提出了基于逐层特征选择的多层部件模型目标检测算法。实验中将该算法在收集的十大机场真实场景数据上进行测试,验证了算法的有效性。 展开更多
关键词 遥感 分层结构(LHS) 多核学习(MKL) 多特征组合 分层特征选择 目标检测
原文传递
基于多重特征选择和多分类器融合的文本层次分类研究 被引量:2
3
作者 贾美英 杨炳儒 +1 位作者 郑德权 陈庆轩 《计算机应用研究》 CSCD 北大核心 2009年第12期4467-4470,共4页
针对大量电子文档需要准确地进行多层次自动分类管理的现实需求,提出基于多重特征选择和多分类器融合技术的层次分类方法。通过引入可信度函数对单分类器效果进行评价,适时采用辅助分类器对较难分类的文档进行分类投票判决。实验结果表... 针对大量电子文档需要准确地进行多层次自动分类管理的现实需求,提出基于多重特征选择和多分类器融合技术的层次分类方法。通过引入可信度函数对单分类器效果进行评价,适时采用辅助分类器对较难分类的文档进行分类投票判决。实验结果表明,相对于单分类器,该方法无论在平面分类和层次分类语料上都获得了更好的分类精度,且具有较好的时间复杂性,有很好的实际应用前景。 展开更多
关键词 文本自动分类 文本层次分类 多重特征选择 可信度函数 多分类器融合
下载PDF
iRIPPER——一种改进的基于规则学习的文本分类算法 被引量:2
4
作者 袁晓航 杜小勇 《山东大学学报(理学版)》 CAS CSCD 北大核心 2007年第11期66-68,72,共4页
基于规则学习的文本分类算法RIPPER具有易理解、易优化、高效率等特点,但是当规则所涉及的特征项很多的时候,上述优点不复存在。基于层次的规则学习算法hRIPPER采用了层次架构对RIPPER进行了改进,但其对特征项的过滤仍然有限。针对RIPPE... 基于规则学习的文本分类算法RIPPER具有易理解、易优化、高效率等特点,但是当规则所涉及的特征项很多的时候,上述优点不复存在。基于层次的规则学习算法hRIPPER采用了层次架构对RIPPER进行了改进,但其对特征项的过滤仍然有限。针对RIPPER,hRIPPER在规则学习过程中出现的问题,对规则学习的分类算法进行改进,提出了一种改进的基于规则学习的文本分类算法iRIPPER,在规则学习的同时进一步过滤噪音特征项。实验证明,该方法不但有效地提取了特征项,生成较少的规则,提高了算法的准确率和召回率,而且缩短了生成规则的时间,从而改进了规则学习分类算法的性能。 展开更多
关键词 文本分类 RIPPER hRIPPER 层次特征选择 噪音特征项 过滤
下载PDF
基于最大熵模型的中文文本层次分类方法 被引量:3
5
作者 肖雪 《计算机与网络》 2015年第9期36-38,共3页
针对文本信息海量增加的现状,快速、准确、全面地获取有用信息的大规模信息处理应用技术越来越受到关注。本文将中文文本分类的类别体系构建为层次结构,并把最大熵模型引入中文文本的层次分类,该模型用于得到未知事件分布的最大熵。实... 针对文本信息海量增加的现状,快速、准确、全面地获取有用信息的大规模信息处理应用技术越来越受到关注。本文将中文文本分类的类别体系构建为层次结构,并把最大熵模型引入中文文本的层次分类,该模型用于得到未知事件分布的最大熵。实验证明,最大熵模型方法的层次分类性能在很多时候优于平面分类,是一种有效的中文文本分类方法。 展开更多
关键词 文本分类 层次分类 特征选择 最大熵模型
下载PDF
基于层次分类的手机位置无关的动作识别 被引量:2
6
作者 王昌海 许昱玮 张建忠 《电子与信息学报》 EI CSCD 北大核心 2017年第1期191-197,共7页
使用智能手机中集成的加速度传感器识别用户日常动作在惯性定位、个性化推荐、运动量评估等领域有重要的应用。手机位置不固定导致的动作识别率低下是该领域面临的主要问题。为了提高手机位置不固定时的动作识别率,该文提出一种基于层... 使用智能手机中集成的加速度传感器识别用户日常动作在惯性定位、个性化推荐、运动量评估等领域有重要的应用。手机位置不固定导致的动作识别率低下是该领域面临的主要问题。为了提高手机位置不固定时的动作识别率,该文提出一种基于层次分类的动作识别方法。该方法将动作识别分为多层,每一层包含一个分类器。在训练某一层分类器时,首先根据本层训练样本集进行特征选择并训练分类器。然后使用训练得到的分类器对训练样本分类,并计算分类结果的可信度。最后通过对低可信度的样本进行剪枝得到下层分类器的训练样本。对未知类别的样本分类时,首先使用第1层分类器分类。如果分类结果可信度较高,则分类结束;否则使用下层分类器分类,直至所有分类器遍历完。实验部分通过对采集的动作数据进行仿真,验证了该文方法的有效性。结果表明,与单层分类器相比,该方法可以将动作识别率由85.2%提高至89.2%。 展开更多
关键词 动作识别 加速度传感器 层次分类 特征选择
下载PDF
面向层次结构数据的增量特征选择 被引量:1
7
作者 折延宏 黄婉丽 +1 位作者 贺晓丽 钱婷 《计算机科学与探索》 CSCD 北大核心 2023年第12期2928-2941,共14页
随着大数据时代的到来,数据样本量越来越多,维度越来越高,同时样本标签存在复杂的层次结构关系。采用包含策略,研究了基于依赖度的分层分类增量特征选择,解决了标签具有树结构且标签分布在任意节点的分层分类问题。首先,利用标签之间的... 随着大数据时代的到来,数据样本量越来越多,维度越来越高,同时样本标签存在复杂的层次结构关系。采用包含策略,研究了基于依赖度的分层分类增量特征选择,解决了标签具有树结构且标签分布在任意节点的分层分类问题。首先,利用标签之间的层次结构,采用包含策略来缩小负样本空间。其次,使用模糊粗糙集理论,提出了一个基于包含策略的模糊粗糙集模型,设计了一个基于包含策略的依赖度计算算法和一个非增量特征选择算法。基于此,引入增量机制,提出了基于包含策略的依赖度增量更新方法,设计了两个基于两种策略的增量特征选择算法。最后,将此方法与基于兄弟策略的依赖度进行对比,通过实验验证了所提方法的可行性与高效性。 展开更多
关键词 模糊粗糙集 依赖度 分层分类 增量特征选择 包含策略
下载PDF
Hierarchical Classification of Chinese Documents Based on N grams 被引量:1
8
作者 Zhou Shui geng 1, Guan Ji hong 2, He Yan xiang 2 1. State Key Laboratory of Software Engineering, Wuhan University, Wuhan 430072, China 2. School of Computer Science, Wuhan University, Wuhan 430072, China 《Wuhan University Journal of Natural Sciences》 CAS 2001年第Z1期416-422,共7页
We explore the techniques of utilizing N gram information to categorize Chinese text documents hierarchically so that the classifier can shake off the burden of large dictionaries and complex segmentation process... We explore the techniques of utilizing N gram information to categorize Chinese text documents hierarchically so that the classifier can shake off the burden of large dictionaries and complex segmentation processing, and subsequently be domain and time independent. A hierarchical Chinese text classifier is implemented. Experimental results show that hierarchically classifying Chinese text documents based N grams can achieve satisfactory performance and outperforms the other traditional Chinese text classifiers. 展开更多
关键词 Chinese text classification N grams feature selection hierarchical classification
下载PDF
Data field for mining big data 被引量:1
9
作者 Shuliang Wang Ying Li Dakui Wang 《Geo-Spatial Information Science》 CSCD 2016年第2期中插2-中插2,106-118,共14页
Big data is a highlighted challenge for many fields with the rapid expansion of large-volume, complex, and fast-growing sources of data. Mining from big data is required for exploring the essence of data and providing... Big data is a highlighted challenge for many fields with the rapid expansion of large-volume, complex, and fast-growing sources of data. Mining from big data is required for exploring the essence of data and providing meaningful information. To this end, we have previously introduced the theory of physical field to explore relations between objects in data space and proposed a framework of data field to discover the underlying distribution of big data. This paper concerns an overview of big data mining by the use of data field. It mainly discusses the theory of data field and different aspects of applications including feature selection for high-dimensional data, clustering, and the recognition of facial expression in human-computer interaction. In these applications, data field is employed to capture the intrinsic distribution of data objects for selecting meaningful features, fast clustering, and describing variation of facial expression. It is expected that our contributions would help overcome the problems in accordance with big data. 展开更多
关键词 Physical FIELD DATA FIELD BIG DATA MINING feature selection hierarchical clustering recognition of FACE expression
全文增补中
基于系统聚类和SVM模型的乳腺癌诊断研究 被引量:1
10
作者 余莹 樊重俊 +1 位作者 朱人杰 熊红林 《智能计算机与应用》 2020年第11期97-100,105,共5页
随着医疗技术的发展,临床医学中已收集了用于乳腺癌诊断的不同肿瘤特征。然而如何从庞大的医疗数据集中选择特征信息,以支持临床疾病诊断,是一项艰巨而耗时的任务。针对于此,本文提出了基于系统聚类和支持向量机(H-SVM)的组合模型。其... 随着医疗技术的发展,临床医学中已收集了用于乳腺癌诊断的不同肿瘤特征。然而如何从庞大的医疗数据集中选择特征信息,以支持临床疾病诊断,是一项艰巨而耗时的任务。针对于此,本文提出了基于系统聚类和支持向量机(H-SVM)的组合模型。其中系统聚类算法用于特征选择,分别识别良性肿瘤和恶性肿瘤的隐藏模式;通过从属函数计算原始肿瘤数据与隐藏模式之间的相似度进行特征重建;重建后的数据集作为新的特征集通过支持向量机算法训练分类器,以检验分类效果。实验结果表明,该算法从威斯康星州乳腺癌(WDBC)数据集训练阶段的32个原始特征中提取了15个抽象的肿瘤特征,不仅将分类精确率提高到97.50%,而且大大减少了模型训练时间。 展开更多
关键词 系统聚类 特征选择 支持向量机 乳腺癌诊断
下载PDF
基于样本对选择的分层分类特征选择算法研究 被引量:1
11
作者 折延宏 武晋兰 贺晓丽 《昆明理工大学学报(自然科学版)》 北大核心 2022年第5期92-102,共11页
在大数据时代,数据的标签数量急剧增加,且标签集之间往往存在层次结构,利用层次结构进行大规模分类学习可有效解决维数灾难、类别不均衡问题,是近年来的研究热点.模糊粗糙集作为处理不确定性信息的有效工具,对于层次结构的描述有着特别... 在大数据时代,数据的标签数量急剧增加,且标签集之间往往存在层次结构,利用层次结构进行大规模分类学习可有效解决维数灾难、类别不均衡问题,是近年来的研究热点.模糊粗糙集作为处理不确定性信息的有效工具,对于层次结构的描述有着特别的优势,本文给出了一种基于样本对选择的分层特征选择方法.通过将层次结构融入到目标概念的上、下近似之中,给出了一种新的模糊粗糙集模型,并研究了其详细性质,基于此,设计了一种基于样本对选择的特征选择算法,实验结果表明,本文所提出的算法在效率和准确性方面优于平面算法,从而为基于粒计算的分层特征选择提供了一种可能的框架. 展开更多
关键词 分层分类 模糊粗糙集 辨识矩阵 样本对选择 特征选择
原文传递
基于相对贡献率的噪声裁剪算法
12
作者 刘朔瑜 戴月明 《系统仿真学报》 CAS CSCD 北大核心 2019年第12期2721-2730,共10页
提出了一种基于相对贡献率的噪声裁剪算法(Class noise cutting, CNC)。通过计算得到特征对于主题的相对贡献率,利用特征区分度评分挑选对于当前主题分类最有价值的特征集,选出相应的候选类别,减少候选类别集,提高了分类准确率,加快了... 提出了一种基于相对贡献率的噪声裁剪算法(Class noise cutting, CNC)。通过计算得到特征对于主题的相对贡献率,利用特征区分度评分挑选对于当前主题分类最有价值的特征集,选出相应的候选类别,减少候选类别集,提高了分类准确率,加快了分类器的响应速度。与另一种噪声裁剪算法(Eliminating class noise, ECN)比较,CNC具有更高的准确率,由于具有更精简的特征维度词典以及更优异的候选类别集使得响应速度大大加快。 展开更多
关键词 相对贡献率 类别噪声裁剪 层次结构分类 特征选择
下载PDF
基于分级神经网络的柱形代数分解变元序选择
13
作者 朱章鹏 陈长波 《计算机科学》 CSCD 北大核心 2020年第S02期106-110,138,共6页
柱形代数分解是广泛应用于求多项式系统实数解的一种计算方法。不同的变元序对其计算时间有显著影响。已有选序算法多基于启发式的经验算法,准确率不高。少数基于机器学习的方法使用的数据集较小,且基于复杂人工特征。文中在随机生成大... 柱形代数分解是广泛应用于求多项式系统实数解的一种计算方法。不同的变元序对其计算时间有显著影响。已有选序算法多基于启发式的经验算法,准确率不高。少数基于机器学习的方法使用的数据集较小,且基于复杂人工特征。文中在随机生成大量多项式系统与所有序计算时间标注的数据基础上,提出一类新的多项式显性表示特征和一种新的分级神经网络。首先根据最差序计算时间将数据集划分成4个不同计算难度的子集并分别建立预测最优序的分类模型,其次建立预测最长计算时间的回归模型,最后根据回归模型预测最长计算时间并据其自动选择相应难度分类模型预测最优变元序。实验结果表明,显性特征的性能优于复杂人工特征,且在困难问题上分级神经网络所预测最优序的性能约为经验选序算法的3倍。 展开更多
关键词 分级神经网络 柱形代数分解 变元序 回归 特征选择
下载PDF
基于多层次分割分类模型及其特征空间优化的建筑物提取方法 被引量:16
14
作者 党涛 宋起 +3 位作者 刘勇 徐安建 徐波 张宏刚 《国土资源遥感》 CSCD 北大核心 2019年第3期111-122,共12页
针对高空间分辨率遥感影像城市地物信息提取中的尺度效应、光谱多样性及分类特征优化等问题,基于面向对象影像分析方法,结合数据挖掘与机器学习技术,提出了一种多层次分割分类模型及其特征空间优化的建筑物提取方法。首先,根据遥感信息... 针对高空间分辨率遥感影像城市地物信息提取中的尺度效应、光谱多样性及分类特征优化等问题,基于面向对象影像分析方法,结合数据挖掘与机器学习技术,提出了一种多层次分割分类模型及其特征空间优化的建筑物提取方法。首先,根据遥感信息多尺度特性,针对地物特征差异设立层级关系,再结合光谱多样性特征定义地物包含的子类型,建立基于不透水面分割分类提取建筑物的层次化结构;然后,利用提出的ReliefF-PSO组合特征选择方法,优化构建相应层次的影像特征空间;最后,在多尺度分割和特征优化的基础上,基于随机森林模型获取不透水面分布,进而采用J48决策树算法分类提取建筑物。实验结果表明,该方法能够利用较少数量的影像特征,获得高精度的建筑物提取成果。 展开更多
关键词 基于对象影像分析 建筑物 多层次模型 特征选择
下载PDF
学术论文大纲中关键术语抽取方法研究 被引量:7
15
作者 何远标 乐小虬 张帆 《现代图书情报技术》 CSSCI 北大核心 2014年第3期73-79,共7页
【目的】针对学术论文大纲内容精炼、层次性的特点,研究从中抽取重要且具有实质意义术语的方法。【方法】结合语言学规则和术语词典从大纲各级标题中识别出候选术语集,然后根据术语间的句法依存关系计算tf-idf,并利用大纲结构量化术语... 【目的】针对学术论文大纲内容精炼、层次性的特点,研究从中抽取重要且具有实质意义术语的方法。【方法】结合语言学规则和术语词典从大纲各级标题中识别出候选术语集,然后根据术语间的句法依存关系计算tf-idf,并利用大纲结构量化术语层级特征,最后结合tf-idf与层级特征对候选术语进行排名,选择出关键术语。【结果】实验证明,该方法的候选术语识别F值达到89.57%,术语选择F值达到36.89%。【局限】采用的术语抽取规则不完备,且tf-idf计算过程中的权值设置仅使用经验值,导致未能达到最优效果。【结论】该方法能有效抽取大纲中的关键术语,适用于层级结构中的关键术语抽取。 展开更多
关键词 候选术语识别 候选术语选择 句法依存关系 层级特征
原文传递
基于改进层次全局模糊熵和MCFS的滚动轴承损伤识别 被引量:3
16
作者 柏世兵 林金亮 杨玉华 《机电工程》 CAS 北大核心 2023年第7期1024-1030,共7页
针对传统的多尺度特征提取方法无法捕捉振动信号高频故障信息的问题,提出了一种基于改进层次全局模糊熵(IHGFE)全局全频段特征提取、多聚类特征选择(MCFS)特征降维和支持向量机分类的滚动轴承故障诊断方法。首先,提出了能够捕捉振动信... 针对传统的多尺度特征提取方法无法捕捉振动信号高频故障信息的问题,提出了一种基于改进层次全局模糊熵(IHGFE)全局全频段特征提取、多聚类特征选择(MCFS)特征降维和支持向量机分类的滚动轴承故障诊断方法。首先,提出了能够捕捉振动信号低频到高频的全局特征的IHGFE非线性动力学方法,并将其用于滚动轴承的故障特征提取;然后,利用MCFS对初始特征向量进行了维数约简和优化,构建了低维且对故障敏感的故障特征向量;最后,建立了基于支持向量机的多故障分类器,实现了滚动轴承损伤的智能化识别,并通过两个滚动轴承实验进行了对比分析。研究结果表明:IHGFE的分类准确率和识别稳定性均优于对比方法,证明了其在特征提取中能够在一定程度上解决现有方法无法同时考虑信号的高频特征和全局特征的问题,可为进一步扩展模糊熵方法在滚动轴承损伤识别中的应用提供参考。 展开更多
关键词 轴承故障诊断 改进层次全局模糊熵 多聚类特征选择 支持向量机 特征降维 故障分类器
下载PDF
多层文本分类器的研究及应用 被引量:2
17
作者 袁路妍 顾国强 鲍世方 《计算机应用与软件》 CSCD 北大核心 2012年第3期139-140,201,共3页
以解决公安部门犯罪信息文本数据自动分类问题为应用目的,通过对已有多层文本自动分类技术的研究,给出多层文本分类器的过程模型,并对模型中的特征提取方法进行深入研究,提出改进后的特征提取权重计算公式。实验证明,该分类器能够有效... 以解决公安部门犯罪信息文本数据自动分类问题为应用目的,通过对已有多层文本自动分类技术的研究,给出多层文本分类器的过程模型,并对模型中的特征提取方法进行深入研究,提出改进后的特征提取权重计算公式。实验证明,该分类器能够有效解决犯罪信息文本的自动分类问题。 展开更多
关键词 多层文本分类 向量空间模型 特征提取 分类算法
下载PDF
集成学习算法在中医证型分类预测中的应用 被引量:1
18
作者 张守宾 朱习军 《计算机工程与科学》 CSCD 北大核心 2019年第2期328-334,共7页
为提高中医诊断的智能化以及辩证的准确度,提出一种基于多模态扰动策略的集成学习算法(MPEL算法)。首先,在样本域多次抽样产生不同的样本子空间;其次,在属性域采用改进的层次聚类特征选择算法,划分不同的属性子空间,进而训练出具有较大... 为提高中医诊断的智能化以及辩证的准确度,提出一种基于多模态扰动策略的集成学习算法(MPEL算法)。首先,在样本域多次抽样产生不同的样本子空间;其次,在属性域采用改进的层次聚类特征选择算法,划分不同的属性子空间,进而训练出具有较大差异性的基分类器;然后,采用贪心策略选取最优的基分类器组合,提高算法整体性能。选择中医哮喘病症状-证型病案进行验证,并与其它集成学习算法对比,实验结果表明,改进的集成学习算法在哮喘病症状-证型分类预测中训练速度较快、识别准确率更高,最高识别率高达98.16%。 展开更多
关键词 集成学习 多模态扰动 层次聚类特征选择 贪心策略 哮喘病症状-症型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部