期刊文献+
共找到108篇文章
< 1 2 6 >
每页显示 20 50 100
特征选择算法研究综述 被引量:95
1
作者 毛勇 周晓波 +2 位作者 夏铮 尹征 孙优贤 《模式识别与人工智能》 EI CSCD 北大核心 2007年第2期211-218,共8页
特征选择是当前信息领域,尤其是模式识别领域的研究热点.本文从不同角度对特征选择算法进行分类,概述特征选择技术发展的各个分支及发展态势,指出理论研究和实际应用中所存在的一些困难和亟待解决的问题.然后从算法实用性角度出发,结合... 特征选择是当前信息领域,尤其是模式识别领域的研究热点.本文从不同角度对特征选择算法进行分类,概述特征选择技术发展的各个分支及发展态势,指出理论研究和实际应用中所存在的一些困难和亟待解决的问题.然后从算法实用性角度出发,结合机器学习的观点,探讨应用支持向量机技术进行特征选择的研究发展思路. 展开更多
关键词 特征选择 模式识别 机器学习 Wrapper方法
原文传递
一个无需词典支持和切词处理的中文文档分类系统 被引量:23
2
作者 周水庚 关佶红 +1 位作者 胡运发 周傲英 《计算机研究与发展》 EI CSCD 北大核心 2001年第7期839-844,共6页
报道了一个无需词典支持和切词处理的中文文档分类系统 .其特点是利用 N - gram信息进行中文文档分类 ,使中文文档分类摆脱了对词典和切词处理的依赖 ,实现了中文文档分类的领域无关性和时间无关性 ;采用开放的体系结构使文档分类系统... 报道了一个无需词典支持和切词处理的中文文档分类系统 .其特点是利用 N - gram信息进行中文文档分类 ,使中文文档分类摆脱了对词典和切词处理的依赖 ,实现了中文文档分类的领域无关性和时间无关性 ;采用开放的体系结构使文档分类系统易于功能扩充和性能完善 .测试结果表明该系统具有令人满意的分类性能 . 展开更多
关键词 中文文档分类系统 词典支持 切词处理 中文信息处理 INTERNET
下载PDF
基于SVM的特征筛选方法及其若干应用 被引量:16
3
作者 李国正 王振晓 +2 位作者 杨杰 姚莉秀 陈念贻 《计算机与应用化学》 CAS CSCD 北大核心 2002年第6期703-705,共3页
对于拟合问题,传统的模式识别特征筛选方法以各特征量对训练数据拟合能力的贡献为取舍标准,未考虑经验风险最小化和结构风险最小化间的差别,不能获得预报能力最强的特征筛选结果。为此我们提出了结合支持向量回归法与留一法的特征筛选... 对于拟合问题,传统的模式识别特征筛选方法以各特征量对训练数据拟合能力的贡献为取舍标准,未考虑经验风险最小化和结构风险最小化间的差别,不能获得预报能力最强的特征筛选结果。为此我们提出了结合支持向量回归法与留一法的特征筛选新算法,并将它试用于镍氢电池材料和氧化铝净溶出率两套实验数据集的特征筛选。 展开更多
关键词 SVM 应用 特征筛选 支持向量回归 留一法 预报能力 化学模式识别 镍-氢电池 材料 电化学容量 净溶出率 氧化铝
原文传递
Coal–rock interface detection on the basis of image texture features 被引量:20
4
作者 Sun Jiping Su Bo 《International Journal of Mining Science and Technology》 SCIE EI 2013年第5期681-687,共7页
Based on the stability and inequality of texture features between coal and rock,this study used the digital image analysis technique to propose a coal–rock interface detection method.By using gray level co-occurrence... Based on the stability and inequality of texture features between coal and rock,this study used the digital image analysis technique to propose a coal–rock interface detection method.By using gray level co-occurrence matrix,twenty-two texture features were extracted from the images of coal and rock.Data dimension of the feature space reduced to four by feature selection,which was according to a separability criterion based on inter-class mean difference and within-class scatter.The experimental results show that the optimized features were effective in improving the separability of the samples and reducing the time complexity of the algorithm.In the optimized low-dimensional feature space,the coal–rock classifer was set up using the fsher discriminant method.Using the 10-fold cross-validation technique,the performance of the classifer was evaluated,and an average recognition rate of 94.12%was obtained.The results of comparative experiments show that the identifcation performance of the proposed method was superior to the texture description method based on gray histogram and gradient histogram. 展开更多
关键词 Coal–rock interface detection TEXTURE Gray level co-occurrence matrix feature selection Fisher discriminant method Cross-validation
下载PDF
基于LightGBM的特征选择算法 被引量:19
5
作者 李占山 姚鑫 +1 位作者 刘兆赓 张家晨 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2021年第12期1688-1695,共8页
为解决过滤式和基于演化学习的包裹式两类特征选择算法的缺陷,提出一种新型包裹式特征选择算法LGBFS(LightGBM feature selection).首先引入LightGBM对原始特征构建迭代提升树模型并对特征重要度进行度量;随后结合提出的LR序列前向搜索... 为解决过滤式和基于演化学习的包裹式两类特征选择算法的缺陷,提出一种新型包裹式特征选择算法LGBFS(LightGBM feature selection).首先引入LightGBM对原始特征构建迭代提升树模型并对特征重要度进行度量;随后结合提出的LR序列前向搜索策略LRSFFS对特征进行选择;最后将所提出算法与9种对比算法在21个标准数据集上进行对比,结果显示LGBFS在21个标准数据集中的16个取得最优分类精度、18个取得最优维度缩减率和最优CPU运行时间.还进行了时间复杂度分析与显著性检验,检验表明LGBFS相较6种对比算法具有显著性差异,也说明LGBFS能够同时兼顾特征子集的计算效率和分类精度. 展开更多
关键词 特征选择 LightGBM 迭代提升树 包裹式 序列搜索
下载PDF
基于核空间距离测度的特征选择 被引量:16
6
作者 蔡哲元 余建国 +1 位作者 李先鹏 金震东 《模式识别与人工智能》 EI CSCD 北大核心 2010年第2期235-240,共6页
提出核空间距离测度这一可分性判据.在核空间中计算两类样本点之间的距离,并以距离的大小评价子集的分类性能.使用顺序前进法作为搜索算法,在人造和真实的数据集上进行测试,文中的核空间距离测度可分性判据明显优于传统非核的可分性判据... 提出核空间距离测度这一可分性判据.在核空间中计算两类样本点之间的距离,并以距离的大小评价子集的分类性能.使用顺序前进法作为搜索算法,在人造和真实的数据集上进行测试,文中的核空间距离测度可分性判据明显优于传统非核的可分性判据,优于或接近于W ang提出的核散布矩阵测度,并在运行时间上快一个数量级.将文中方法应用于胰腺内镜超声图像分类,取得较好分类结果. 展开更多
关键词 特征选择 可分性判据 距离测度 核方法 分类
原文传递
无需词典支持和切词处理的中文文档分类 被引量:1
7
作者 周水庚 关佶红 胡运发 《高技术通讯》 EI CAS CSCD 2001年第3期31-35,共5页
利用中文文本的N gram信息进行中文文档分类 ,使中文文档分类摆脱了对词典和切词处理的依赖。实验结果表明 。
关键词 中文文档分类 N-gram信息 属性选择 贝叶斯分类 kNN法
下载PDF
基于熵权法的过滤式特征选择算法 被引量:11
8
作者 李占山 杨云凯 张家晨 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2022年第7期921-929,共9页
互信息过滤式特征选择算法往往仅局限于互信息这一度量标准.为规避采取单一的互信息标准的局限性,在互信息的基础上引入基于距离度量的算法RReliefF,从而得出更好的过滤式准则.将RReliefF用于分类任务,度量特征与标签的相关性;应用最大... 互信息过滤式特征选择算法往往仅局限于互信息这一度量标准.为规避采取单一的互信息标准的局限性,在互信息的基础上引入基于距离度量的算法RReliefF,从而得出更好的过滤式准则.将RReliefF用于分类任务,度量特征与标签的相关性;应用最大互信息系数(maximal information coefficient,MIC)度量特征与特征之间的冗余性、特征与标签的相关性;最后,应用熵权法为MIC和RReliefF进行客观赋权,提出了基于熵权法的过滤式特征选择算法(filtering feature selection algorithm based on entropy weight method,FFSBEWM).在13个数据集上进行对比实验,结果表明,FFSBEWM所选择的特征子集的平均分类准确率和最高分类准确率均优于其他对比算法. 展开更多
关键词 特征选择 熵权法 互信息 过滤式准则 信息理论
下载PDF
数据驱动下的半导体生产线动态调度方法 被引量:12
9
作者 吴启迪 马玉敏 +1 位作者 李莉 乔非 《控制理论与应用》 EI CAS CSCD 北大核心 2015年第9期1233-1239,共7页
本文研究了一种数据驱动下的半导体生产线调度框架,该框架基于调度优化数据样本,应用机器学习算法,获得动态调度模型,通过该模型,对于半导体生产线,能够根据其当前的生产状态,实时地定出近似最优的调度策略.在此基础上,利用特征选择和... 本文研究了一种数据驱动下的半导体生产线调度框架,该框架基于调度优化数据样本,应用机器学习算法,获得动态调度模型,通过该模型,对于半导体生产线,能够根据其当前的生产状态,实时地定出近似最优的调度策略.在此基础上,利用特征选择和分类算法,提出一种生成动态调度模型的方法,并且具体实现出一种混合式特征选择和分类算法的调度模型:先采用过滤式特征选择方法对生产属性进行初步筛选,然后再采用封装式特征选择和分类方法生成模型以提高模型生成的效率.最后,在某实际半导体生产线上,对在所提出的框架上采用6种不同算法实现的动态调度模型进行测试,并对算法性能数据和生产线性能据进行对比和分析.结果表明,数据驱动下的动态调度方法优于单一的调度规则,同时也能满足生产线调度实时性要求.在数据样本较多的情况下,建议采用本文所提出的方法. 展开更多
关键词 半导体生产线 动态调度 数据驱动 特征选择 分类算法
下载PDF
特征选择算法研究综述 被引量:11
10
作者 梁伍七 王荣华 +1 位作者 刘克礼 李斌 《安徽广播电视大学学报》 2019年第4期85-91,共7页
模式识别领域中,特征选择作为预处理模块的关键步骤,特征选择函数用来降低特征空间的维数,提高分类器的分类性能。首先分析了特征选择的主要过程,从不同视角探讨了特征选择的分类方法,然后分析了基于SVM进行特征选择的作用,对基于SVM的... 模式识别领域中,特征选择作为预处理模块的关键步骤,特征选择函数用来降低特征空间的维数,提高分类器的分类性能。首先分析了特征选择的主要过程,从不同视角探讨了特征选择的分类方法,然后分析了基于SVM进行特征选择的作用,对基于SVM的特征选择算法进行了归纳总结,最后分析对比了基于SVM的三类特征选择的优缺点,指出理论研究和实际应用中的研究热点和应用发展方向。 展开更多
关键词 模式识别 文本分类 特征选择 支持向量机 Wrapper方法
下载PDF
基于类别加权和方差统计的特征选择方法 被引量:11
11
作者 冀俊忠 吴金源 +1 位作者 吴晨生 杜芳华 《北京工业大学学报》 CAS CSCD 北大核心 2014年第10期1593-1602,共10页
为提高不均衡文本分类的准确率和稳定性,提出了一种基于类别加权和方差统计的联合特征选择方法.首先,基于类别文档数大小对特征选择的影响,给出了一种类别加权策略以强化小类别的特征;其次,在探究特征类别区分能力的基础上,设计了类别... 为提高不均衡文本分类的准确率和稳定性,提出了一种基于类别加权和方差统计的联合特征选择方法.首先,基于类别文档数大小对特征选择的影响,给出了一种类别加权策略以强化小类别的特征;其次,在探究特征类别区分能力的基础上,设计了类别方差统计策略来凸显含有丰富类别信息的特征;最后,将2种策略相融合,实现了一种联合特征选择的新算法.在Reuters-21578和复旦大学语料这2个不均衡语料上的实验都表明:该算法有效,特别是在小类别的分类效果上远远好于IG、CHI和DFICF等流行的通用算法. 展开更多
关键词 文本分类 不均衡数据集 特征选择方法 类别加权 方差统计
下载PDF
基于近邻信息和PSO算法的集成特征选取 被引量:9
12
作者 刘全金 赵志敏 +1 位作者 李颖新 俞晓磊 《电子学报》 EI CAS CSCD 北大核心 2016年第4期995-1002,共8页
提出了一种新的PSO特征选取方法.以粒子对应特征组合的同类近邻样本和异类近邻样本间的距离关系作为类别可分性和粒子适应度函数.以适应度函数加权的群体历史最佳、粒子历史最佳和粒子邻域内最佳个体信息共同指导粒子运动方向,搜索类内... 提出了一种新的PSO特征选取方法.以粒子对应特征组合的同类近邻样本和异类近邻样本间的距离关系作为类别可分性和粒子适应度函数.以适应度函数加权的群体历史最佳、粒子历史最佳和粒子邻域内最佳个体信息共同指导粒子运动方向,搜索类内紧密、类间分离的最佳特征组合;同时,利用加权集成方法对PSO特征选取方法进行集成,以提高特征选取方法的稳定性和鲁棒性.在5个高维数据集上的特征选取实验结果表明集成PSO特征选取方法的有效性和可行性. 展开更多
关键词 特征选取 PSO 集成方法 分类
下载PDF
一种基于特征选择的SVM Bagging集成方法 被引量:9
13
作者 亓慧 王文剑 郭虎升 《小型微型计算机系统》 CSCD 北大核心 2014年第11期2533-2537,共5页
针对传统支持向量机(Support Vector Machine,SVM)集成学习(Ensemble Learning,EL)方法不能够解决高维复杂数据且子学习器差异性小集成效果不明显的问题,提出一种基于多种特征选择方法进行Bagging集成的支持向量机学习(Support Vector M... 针对传统支持向量机(Support Vector Machine,SVM)集成学习(Ensemble Learning,EL)方法不能够解决高维复杂数据且子学习器差异性小集成效果不明显的问题,提出一种基于多种特征选择方法进行Bagging集成的支持向量机学习(Support Vector M achine Based on M ultiple Feature Selection Bagging,M FSB_SVM)方法.该方法首先采用不同的特征选择方法构建子学习器,以增加不同子学习器间的差异性,并直接从训练数据中对样本特征的重要性进行评估,而无需学习算法的反馈.实验表明,本文提出的MFSB_SVM方法既可以有效解决高维数据问题,也可避免传统SVM集成方法效果不明显的缺点,从而进一步提高学习模型的泛化性能. 展开更多
关键词 支持向量机 集成学习 特征选择 Bagging方法
下载PDF
一种基于概率的卡方特征选择方法 被引量:8
14
作者 张辉宜 谢业名 +1 位作者 袁志祥 孙国华 《计算机工程》 CAS CSCD 北大核心 2016年第8期194-198,205,共6页
传统卡方特征选择方法没有考虑在不均衡数据集上词出现的类别数量、词的频度以及在类间与类内的分布情况等,以致不能为不同的类别选择出有效的特征词。为此,提出一种卡方特征选择方法。以词概率和文档概率衡量词文档频繁程度,并用来分... 传统卡方特征选择方法没有考虑在不均衡数据集上词出现的类别数量、词的频度以及在类间与类内的分布情况等,以致不能为不同的类别选择出有效的特征词。为此,提出一种卡方特征选择方法。以词概率和文档概率衡量词文档频繁程度,并用来分别计算类别频数因子、词的类间集中因子、词在类内的均衡度因子、文档的类间集中因子。基于这些因子修正卡方值,利用同一个词不同类别的差异程度因子,使得改进的卡方能选出更高效的特征词。文本分类实验结果表明,与改进前的方法相比,该方法能使宏观F1值得到一定程度的提高,在不均衡数据集上具有更好的分类效果。 展开更多
关键词 文本分类 卡方统计 特征选择 不均衡数据集 概率方法
下载PDF
基于随机森林的自适应特征选择算法 被引量:8
15
作者 刘凯 郑山红 +1 位作者 蒋权 赵天傲 《计算机技术与发展》 2018年第9期101-104,111,共5页
为了解决传统的随机森林算法在随机特征选择时,导致少数比较重要的特征变量被过滤掉的问题,以及没有考虑特征变量相关性对预测应变量准确性带来的影响,提出了一种基于随机森林的自适应特征选择算法SARFFS。该算法首先利用卡方检验样本... 为了解决传统的随机森林算法在随机特征选择时,导致少数比较重要的特征变量被过滤掉的问题,以及没有考虑特征变量相关性对预测应变量准确性带来的影响,提出了一种基于随机森林的自适应特征选择算法SARFFS。该算法首先利用卡方检验样本间关联程度后自助采样,并设计出一种特征对类代表强弱程度的计算方法;然后引入自适应稀疏约束机制Group LASSO优化特征的选择;最后在Spark分布式计算平台利用UCI数据集进行实验,结果表明,相比传统的RF算法,SARFFS算法在特征子集选择上具有更好的性能,在F1上提升将近9%。从最终排名靠前的重要特征分析,该算法能够考虑特征间相关性,对预测结果确实有影响,并有效地提高了随机属性权值的可靠性和稳定性。 展开更多
关键词 随机森林 自适应 特征选择 GroupLASSO方法
下载PDF
基于交叉熵方法和支持向量机的模拟电路故障诊断 被引量:7
16
作者 唐静远 师奕兵 +1 位作者 周龙甫 张伟 《控制与决策》 EI CSCD 北大核心 2009年第9期1416-1420,共5页
针对故障诊断系统中存在的大量无关或冗余的特征会严重影响故障诊断性能的缺陷,提出了基于交叉熵和支持向量机方法进行特征选择和参数优化的故障诊断方法.首先以某种概率分布产生若干随机样本,并依据交叉熵最小原理建立分布参数的更新... 针对故障诊断系统中存在的大量无关或冗余的特征会严重影响故障诊断性能的缺陷,提出了基于交叉熵和支持向量机方法进行特征选择和参数优化的故障诊断方法.首先以某种概率分布产生若干随机样本,并依据交叉熵最小原理建立分布参数的更新规则进行特征搜索和SVM参数优化;然后利用优化后的特征向量和参数训练支持向量机获得故障诊断模型.故障诊断实验结果表明,该故障诊断方法能有效地优化故障特征和模型参数,提高故障诊断性能. 展开更多
关键词 故障诊断 特征选择 模拟电路 交叉熵方法 支持向量机
原文传递
一种新的混合特征选择方法RRK 被引量:7
17
作者 刘杰 金弟 +1 位作者 杜惠君 刘大有 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2009年第2期419-423,共5页
提出一种新的基于包装方法和过滤器方法的混合特征选择算法RRK。该算法主要包括两个方面:①在特征预选阶段,提出一种基于ReliefF算法的特征加权算法NReliefF和降维算法DR,以实现特征加权并去掉不太重要的特征;②在特征选择阶段,把NReli... 提出一种新的基于包装方法和过滤器方法的混合特征选择算法RRK。该算法主要包括两个方面:①在特征预选阶段,提出一种基于ReliefF算法的特征加权算法NReliefF和降维算法DR,以实现特征加权并去掉不太重要的特征;②在特征选择阶段,把NReliefF算法和KNN算法结合起来,将预选特征作为输入,用分类正确率来选择最优特征。分别采用一个实际的乘员类型数据集和UCI上的imagine标准数据集进行了实验。实验结果表明,采用RRK后分类的效率和正确率都有明显提高。 展开更多
关键词 人工智能 特征选择 包装方法 过滤器方法 RELIEFF算法
下载PDF
一种基于特征筛选的原核生物启动子判别分析方法 被引量:6
18
作者 杜耀华 王正志 +1 位作者 倪青山 李冬冬 《生物物理学报》 CAS CSCD 北大核心 2006年第1期39-48,共10页
启动子识别是研究基因转录调控的重要环节,但目前方法的识别正确率偏低。在深入分析原核启动子特征的基础上,提出了一种基于特征筛选的原核启动子判别分析方法,首先在启动子序列的组成特征、信号特征和结构特征中选取备选特征,为每个特... 启动子识别是研究基因转录调控的重要环节,但目前方法的识别正确率偏低。在深入分析原核启动子特征的基础上,提出了一种基于特征筛选的原核启动子判别分析方法,首先在启动子序列的组成特征、信号特征和结构特征中选取备选特征,为每个特征建立适当的描述模型,并对主要的保守模式采用复合模式模型;再通过模型计算对备选特征进行逐步筛选,优化特征集,将序列表示为组合特征向量;最终利用二次判别分析实现识别。对大肠杆菌和枯草杆菌实际启动子数据进行的刀切法测试验证了方法的有效性和通用性。对于大肠杆菌非编码区(70启动子,识别的平均正确率达到了85.8%,优于其它几种典型识别方法;对于大肠杆菌编码区内部)70启动子和其它几种原核启动子,平均正确率也都超过了80%。方法框架还具有良好的可扩展性,能够方便地容纳新特征,使识别性能不断提高。 展开更多
关键词 原核生物 启动子识别 复合模式 特征筛选 二次判别分析 刀切法
下载PDF
基于无人机可见光图像的作物分类研究 被引量:7
19
作者 李志铭 赵静 +2 位作者 兰玉彬 崔欣 杨焕波 《西北农林科技大学学报(自然科学版)》 CSCD 北大核心 2020年第6期137-144,154,共9页
【目的】采用无人机遥感技术对作物进行分类识别,为及时获取农田信息、制定农田管理策略及产量估测提供技术支持。【方法】采用无人机遥感平台,获取试验区域玉米、桃树、菜花、大豆的可见光正射影像;利用HSV色彩空间转换和纹理滤波,获... 【目的】采用无人机遥感技术对作物进行分类识别,为及时获取农田信息、制定农田管理策略及产量估测提供技术支持。【方法】采用无人机遥感平台,获取试验区域玉米、桃树、菜花、大豆的可见光正射影像;利用HSV色彩空间转换和纹理滤波,获取不同地物的24项纹理特征与3项色彩特征。分别通过ReliefF算法及基于支持向量机的递归特征消除算法(support vector machine-recursive feature elimination,SVM-RFE)进行特征选择与分类,建立6种监督分类模型,利用得到的特征子集对其进行训练,对各模型分类效果进行精度评价。【结果】由SVM-RFE特征子集训练的6种监督分类模型测试集的分类精度均高于80%,分类精度平均提高5.023%,优于ReliefF特征子集训练的监督分类模型,其中SVM-RFE特征子集与支持向量机模型组合对作物的监督分类效果最佳,总体精度达83.417%,Kappa系数为78.60。【结论】基于无人机遥感技术的作物分类识别是可行的。 展开更多
关键词 作物分类识别 无人机遥感 可见光图像 特征选择 监督分类
下载PDF
城市大面积停电应急能力评估指标探讨 被引量:3
20
作者 陈鹏冲 刘畅 +2 位作者 葛黄徐 张华杰 钟茂华 《中国安全生产科学技术》 CAS CSCD 北大核心 2023年第6期5-12,共8页
为科学应对城市大面积停电事件并提升应急能力,首先基于我国部分省、市、县(区)及电力相关企业发布的198份大面积停电事件应急预案,按照应急处置流程总结预防准备、监测预警、处置救援、评估重建4个一级指标和11个二级指标;其次,提取预... 为科学应对城市大面积停电事件并提升应急能力,首先基于我国部分省、市、县(区)及电力相关企业发布的198份大面积停电事件应急预案,按照应急处置流程总结预防准备、监测预警、处置救援、评估重建4个一级指标和11个二级指标;其次,提取预案中针对城市的高频风险因素构建三级指标;最后,结合层次分析法和熵权法计算各个指标的综合权重值并结合实例进行验证分析。研究结果表明:基于特征选择构建的应急能力指标体系与实际应急处置过程和措施具有一致性,能够全面表征城市大面积停电应急能力的关键节点;增加对权重值较大指标的投入能够有效提升城市电网系统应急处置能力。研究结果可为城市提升其应对大面积停电应急处置能力提高参考。 展开更多
关键词 大面积停电 特征选择 层次分析法 熵权法
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部