期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
一种改进的互信息特征选取预处理算法 被引量:12
1
作者 卢新国 林亚平 陈治平 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2005年第1期104-107,共4页
讨论了基于互信息的特征选取算法在文本分类中的性能问题,分析了利用这种特征选取算法存在分类精度不高的原因,认为互信息为负值的特征在分类中具有很重要的作用.在此基础上提出了一种基于互信息特征选取的改进算法,该算法加强了互信息... 讨论了基于互信息的特征选取算法在文本分类中的性能问题,分析了利用这种特征选取算法存在分类精度不高的原因,认为互信息为负值的特征在分类中具有很重要的作用.在此基础上提出了一种基于互信息特征选取的改进算法,该算法加强了互信息为负值的特征在分类中的作用.实验结果表明,改进后的算法可以有效地提高文本分类精度. 展开更多
关键词 互信息 改进互信息 特征选取 文本分类
下载PDF
基于改进轮廓系数法的航空公司客户分群研究 被引量:15
2
作者 马鑫 段刚龙 +1 位作者 王建仁 薛宏全 《运筹与管理》 CSSCI CSCD 北大核心 2021年第1期140-146,共7页
鉴于航空公司在客户聚类分群中对聚类效果进行评价并确定最佳k值的轮廓系数法存在时间复杂度过高O(n2)以及准确率较低问题,文章首先采用对象与同簇或不同簇中心间距离计算来替换同类或异类对象间的距离计算,并通过聚类效果变化率确定轮... 鉴于航空公司在客户聚类分群中对聚类效果进行评价并确定最佳k值的轮廓系数法存在时间复杂度过高O(n2)以及准确率较低问题,文章首先采用对象与同簇或不同簇中心间距离计算来替换同类或异类对象间的距离计算,并通过聚类效果变化率确定轮廓系数调节位置及调节权重,提出一种改进的轮廓系数法;其次,基于预处理且特征选择后真实航空公司客户数据构建聚类模型,借助改进轮廓系数法确定最优客户分群,并构建用户画像;最后,针对不同航空公司分群客户进行特征描述并提出相应个性化服务措施,辅助航空公司为客户提供个性化产品与服务。实证研究结果表明:不同样本量下改进轮廓系数法的精确率和运行效率均有所提升;基于改进轮廓系数法的航空公司客户分群结果符合客观实际,所提服务措施为航空公司最大化客户需求、提高客户满意度提供借鉴。 展开更多
关键词 改进轮廓系数 最佳k值 客户分群 特征选择 用户画像
下载PDF
基于改进特征选择法的光纤网络流量异常监测 被引量:7
3
作者 任春雷 刘世民 +1 位作者 朱继阳 曹秀峰 《科学技术与工程》 北大核心 2018年第23期50-54,共5页
采用当前方法进行光纤网络流量异常监测过程中,特征选择法无法全面描述流量异常特征监测的不足,存在监测效果较差的问题。为此,提出一种基于改进特征选择法的异常流量监测方法。首先采用分光方式对光纤网络流量进行分析,获取光纤网络流... 采用当前方法进行光纤网络流量异常监测过程中,特征选择法无法全面描述流量异常特征监测的不足,存在监测效果较差的问题。为此,提出一种基于改进特征选择法的异常流量监测方法。首先采用分光方式对光纤网络流量进行分析,获取光纤网络流量时间序列,并描述用于流量异常监测的多时间序列之间的相互关系,然后利用改进特征选择法对网络出口流量进行特征提取。利用聚类算法选择网络流量异常最优类数和聚类中心,来对网络流量异常现象进行过滤,从而实现网络异常流量特征抽取、特征选择改进算法和网络流量异常监测的研发,从而提高光纤网络流量异常现象监测的准确度。仿真实验结果证明,通过这种方法,能有效地对网络流量异常现象进行监测,且算法简单,能够满足网络流量异常监测的应用需求,实用价值较高。 展开更多
关键词 改进特征选择法 光纤网络 流量异常 监测 安全
下载PDF
改进遗传算法的电子会议汉语语音识别方法
4
作者 杨艺西 武志栋 +2 位作者 袁洲 陈思平 何宇泽 《电子设计工程》 2024年第18期132-135,140,共5页
语音识别普遍存在识别不准确、不全面的问题,影响电子会议汉语记录的质量。面对这种情况,为提高语音识别性能,提出一种改进遗传算法的电子会议汉语语音识别方法。该方法通过预加重、分帧加窗以及去噪,预处理语音信号。利用改进遗传算法... 语音识别普遍存在识别不准确、不全面的问题,影响电子会议汉语记录的质量。面对这种情况,为提高语音识别性能,提出一种改进遗传算法的电子会议汉语语音识别方法。该方法通过预加重、分帧加窗以及去噪,预处理语音信号。利用改进遗传算法选取最优语音特征,语音特征包括梅尔频率倒谱系数、短时平均能量以及频谱均值。以三个特征对应数值的标准化数值为输入,利用构建的基于改进神经网络的识别模型将语音转换为对应的汉语文字,实现语音识别。结果表明,在基于改进遗传算法的识别方法应用下,误识率最高仅为2.122%,识全率最低为95.621%,由此说明所研究识别方法的识别更为准确和全面,识别效果更好。 展开更多
关键词 改进遗传算法 电子会议 特征选取 汉语语音识别
下载PDF
基于改进RF特征选择策略的烤烟油分高光谱特征分析 被引量:4
5
作者 叶磊 韦克苏 +2 位作者 李德仑 张富贵 吴雪梅 《中国农机化学报》 北大核心 2021年第8期196-202,共7页
针对烤烟油分特征预测模型的特征优选问题,提出一种改进RF(随机森林)算法特征选择策略,首先通过RF特征选择算法计算出各个特征的RF-Score,将特征按RF-Score的大小排序依次添加到特征子集中,若分类器分类准确率提高则保留该特征,若分类... 针对烤烟油分特征预测模型的特征优选问题,提出一种改进RF(随机森林)算法特征选择策略,首先通过RF特征选择算法计算出各个特征的RF-Score,将特征按RF-Score的大小排序依次添加到特征子集中,若分类器分类准确率提高则保留该特征,若分类器分类准确率没有提高或降低则去除该特征。结果表明:利用RF特征选择算法对烤烟高光谱特征进行筛选时,将176个高光谱特征中按基尼系数降序排列依次输入SVM分类器中,前64个高光谱波段特征即可使支持向量机分类器性能最佳,特征子集维度为64,其分类准确率为93.33%。利用改进RF特征选择策略对176个烤烟高光谱波段特征进行筛选,只需输入371.08 nm、716.71 nm、378.31 nm、487.77 nm、484.09 nm、535.85 nm六个波段的高光谱特征即可使支持向量机分类器性能最佳,其分类准确率为95%,特征子集维度为6,说明改进的RF特征选择策略可以在保证分类器性能的前提下能较好地进行数据降维,减小特征集的冗余。改进后的RF特征选择算法与全高光谱波段相比,特征数量减少170个,分类准确率提高3.33%;与RF特征选择算法相比,特征数量减少58个,分类准确率提高1.67%。 展开更多
关键词 改进RF算法 特征选择 烤烟 油分特征 高光谱
下载PDF
基于BP神经网络的入侵检测系统的特征选择 被引量:3
6
作者 李凯 田双亮 耿丽君 《长春大学学报》 2009年第6期37-40,共4页
随着各种入侵和攻击网络工具的出现,入侵检测成为网络管理的关键组成部分。特征选择能够有效地提高机器学习与规则提取算法性能。本文设计了一种基于遗传神经网络的入侵检测系统,采用基于多种改进的遗传算法特征选择方法,实验结果表明... 随着各种入侵和攻击网络工具的出现,入侵检测成为网络管理的关键组成部分。特征选择能够有效地提高机器学习与规则提取算法性能。本文设计了一种基于遗传神经网络的入侵检测系统,采用基于多种改进的遗传算法特征选择方法,实验结果表明不同改进的遗传算法特征选择对BP神经网络的分类正确率有一定的影响。 展开更多
关键词 入侵检测 改进的遗传算法 特征选择 BP神经网络
下载PDF
基于改进XGBoost算法的电力中长期负荷预测 被引量:2
7
作者 杜艳霞 康荣保 +2 位作者 王莉莉 张晓 赵尔凡 《电声技术》 2022年第9期129-134,共6页
为提高电力中长期负荷预测的精度,提出一种基于改进XGBoost算法的负荷预测方法。首先考虑影响负荷的多种因素,提取特征向量;其次,利用XGBoost方法对特征变量的相关性进行计算和选择;最后,基于特征选择后的负荷数据,构建XGBoost电力中长... 为提高电力中长期负荷预测的精度,提出一种基于改进XGBoost算法的负荷预测方法。首先考虑影响负荷的多种因素,提取特征向量;其次,利用XGBoost方法对特征变量的相关性进行计算和选择;最后,基于特征选择后的负荷数据,构建XGBoost电力中长期负荷预测模型。在某地区真实历史负荷数据集上的实验结果表明,相较于LASSO等传统负荷预测方法,所提出的方法能够显著降低平均绝对误差(Mean Absolute Error,MAE)等多种预测误差指标。相较于原始XGBoost方法,所提方法的MAE值降低了9.35%,平均绝对百分误差(Mean Absolute Percentage Error,MAPE)值降低了8.89%,均方误差(Mean Square Error,MSE)值降低了22.66%,均方根误差(Root Mean Square Error,RMSE)值降低了12.07%,验证了所提方法能够有效提升电力中长期负荷预测精度。 展开更多
关键词 负荷预测 机器学习 改进XGBoost 特征提取 特征选择
下载PDF
基于随机森林与改进极限学习机的PM2.5浓度模型 被引量:2
8
作者 王鑫圆 曹春萍 《软件》 2020年第6期12-18,62,共8页
由于PM2.5浓度预测中的影响因素过于复杂,影响因素的高维性与非线性对预测结果有着很大的干扰,容易产生PM2.5浓度预测误差高和模型泛化能力差等问题。针对上述缺陷,可通过一种基于随机森林-粒子群优化-极限学习机(RF-PSO-ELM)的PM2.5浓... 由于PM2.5浓度预测中的影响因素过于复杂,影响因素的高维性与非线性对预测结果有着很大的干扰,容易产生PM2.5浓度预测误差高和模型泛化能力差等问题。针对上述缺陷,可通过一种基于随机森林-粒子群优化-极限学习机(RF-PSO-ELM)的PM2.5浓度预测模型解决。该模型首先使用随机森林算法对影响因素进行特征选择,选择出对于PM2.5浓度重要性高的因素构成特征;再利用提取得到的特征作为PSO-ELM算法的输入;最后对上海市的PM2.5浓度做出预测,从最终的实验数据中可以看出:该模型比支持向量机(SVM)、未优化的极限学习机(ELM)和反向神经网络(BPNN)等预测模型在预测精度和泛化能力方面有着显著的提高。 展开更多
关键词 极限学习机 随机森林 改进的粒子群优化算法 PM2.5 特征选择
下载PDF
Feature selection algorithm for text classification based on improved mutual information 被引量:1
9
作者 丛帅 张积宾 +1 位作者 徐志明 王宇颖 《Journal of Harbin Institute of Technology(New Series)》 EI CAS 2011年第3期144-148,共5页
In order to solve the poor performance in text classification when using traditional formula of mutual information (MI) , a feature selection algorithm were proposed based on improved mutual information. The improve... In order to solve the poor performance in text classification when using traditional formula of mutual information (MI) , a feature selection algorithm were proposed based on improved mutual information. The improved mutual information algorithm, which is on the basis of traditional improved mutual information methods that enbance the MI value of negative characteristics and feature' s frequency, supports the concept of concentration degree and dispersion degree. In accordance with the concept of concentration degree and dispersion degree, formulas which embody concentration degree and dispersion degree were constructed and the improved mutual information was implemented based on these. In this paper, the feature selection algorithm was applied based on improved mutual information to a text classifier based on Biomimetic Pattern Recognition and it was compared with several other feature selection methods. The experimental results showed that the improved mutu- al information feature selection method greatly enhances the performance compared with traditional mutual information feature selection methods and the performance is better than that of information gain. Through the introduction of the concept of concentration degree and dispersion degree, the improved mutual information feature selection method greatly improves the performance of text classification system. 展开更多
关键词 text classification feature selection improved mutual information: Biomimetie Pattern Recognition
下载PDF
基于混合智能新模型的故障诊断 被引量:106
10
作者 雷亚国 何正嘉 訾艳阳 《机械工程学报》 EI CAS CSCD 北大核心 2008年第7期112-117,共6页
为了解决机械设备中早期故障和复合故障识别的难题,提高故障诊断的准确率,利用经验模式分解(Empirieal mode decomposition,EMD)、改进的距离评估技术、自适应神经模糊推理系统(Adaptive neuro-fuzzy inference system,ANFIS)和遗传算法... 为了解决机械设备中早期故障和复合故障识别的难题,提高故障诊断的准确率,利用经验模式分解(Empirieal mode decomposition,EMD)、改进的距离评估技术、自适应神经模糊推理系统(Adaptive neuro-fuzzy inference system,ANFIS)和遗传算法(Genetic algorithm,GA)等技术,提出一种综合运用多征兆域特征集和多个分类器的混合智能诊断模型。该模型在特征提取之前,利用滤波、EMD、解调等预处理技术挖掘潜藏在动态信号中的故障信息;从原始振动信号和预处理信号中,分别提取从不同侧面表征设备运行状态的时域和频域统计特征,得到6个特征集。采用提出的一种改进的距离评估技术选择特征,从6个原始特征集中相应地筛选出6个敏感特征集。将6个敏感特征集输入到基于GA组合的多个ANFIS分类器以得到最终的诊断结果。该模型在电力机车轮对轴承的故障诊断中实现了轴承不同故障类型、不同故障程度,以及复合故障的可靠识别,获得了满意的诊断结果。应用结果也验证了基于改进的距离评估技术的特征选择方法的有效性。 展开更多
关键词 改进的距离评估技术 特征选择 混合智能模型 故障诊断
下载PDF
一种基于最小分类错误率的改进型LDA特征选择算法 被引量:6
11
作者 张振平 宣国荣 +1 位作者 郑俊翔 柴佩琪 《微型电脑应用》 2005年第4期4-6,38,共4页
LDA是目前常用的较好的特征选择方法。然而散布矩阵不同时,LDA分类效果往往不理想。本文提出一种基于分类错误率最小的改进型LDA特征选择算法,采用迭代计算使Bayes分类错误率上界最小,能取得比原LDA更好的分类效果。对高维数据提出基于... LDA是目前常用的较好的特征选择方法。然而散布矩阵不同时,LDA分类效果往往不理想。本文提出一种基于分类错误率最小的改进型LDA特征选择算法,采用迭代计算使Bayes分类错误率上界最小,能取得比原LDA更好的分类效果。对高维数据提出基于PCA预处理的“快速改进型LDA特征选择”减少求解迭代计算时间。针对Marill.T.提供的典型数据和MINIST手写体数字库的实验证实以上论点是正确的。 展开更多
关键词 选择算法 LDA 改进型 错误率 最小 特征选择 分类效果 BAYES 迭代计算 计算时间 高维数据 预处理 PCA 数字库 手写体
下载PDF
基于改进增强特征选择算法的特征融合图像隐写分析 被引量:4
12
作者 时晨曦 张敏情 《光电子.激光》 EI CAS CSCD 北大核心 2014年第3期551-557,共7页
针对现有的基于特征融合的JPEG隐写分析方法特征冗余度高、通用性较低的问题,提出了一种基于改进的增强特征选择(BFS,boosting feature selection)算法的通用JPEG隐写分析方法。从线性相关度和非线性相关度两方面降低特征冗余,将特征自... 针对现有的基于特征融合的JPEG隐写分析方法特征冗余度高、通用性较低的问题,提出了一种基于改进的增强特征选择(BFS,boosting feature selection)算法的通用JPEG隐写分析方法。从线性相关度和非线性相关度两方面降低特征冗余,将特征自相关系数和互信息这两种统计性能引入到特征的评价准则中,重新设计了特征权重计算方法,改进了BFS算法的特征评价函数。通过改进的BFS特征选择算法将3组互补性较强且准确率高的特征进行融合降维,得到最优特征子集训练分类器。对3种高隐蔽性隐写算法F5、Outguess和MME3,在不同嵌入率下进行了大量实验。结果表明,本文方法的分析准确率高于现有的检测率较高的JPEG隐写分析方法和典型的融合分析方法,融合后的特征相关性明显下降,并且具有更强的通用性。 展开更多
关键词 隐写分析 特征融合 特征选择 改进的增强特征选择(BFS)算法 特征相关性
原文传递
基于改进鸽群算法和金字塔卷积的流量异常检测
13
作者 陈虹 卢健波 +2 位作者 金海波 武聪 程明佳 《信息安全研究》 CSCD 北大核心 2024年第12期1107-1114,共8页
针对网络流量中存在大量冗余特征以及机器学习方法检测准确率低的问题,提出一种基于改进鸽群算法(improved pigeon inspired optimizer,IPIO)和金字塔卷积网络(pyramid convolution neural network,PyConv)的流量异常检测方法.首先设计... 针对网络流量中存在大量冗余特征以及机器学习方法检测准确率低的问题,提出一种基于改进鸽群算法(improved pigeon inspired optimizer,IPIO)和金字塔卷积网络(pyramid convolution neural network,PyConv)的流量异常检测方法.首先设计基于IPIO的特征选择方法,降低特征冗余性.通过计算特征集的信息增益率初始化鸽群提高种群质量,加快收敛速度;采用2阶段变异随机修改当前最优解的1个分量,在当前最优解的附近进行搜索,避免陷入局部最优.其次采用PyConv实现深度特征提取,PyConv设计以多尺度的卷积核提取不同大小的特征并进行融合得到新特征.最后通过Softmax分类器实现分类,提升流量异常检测的精度.在UNSW-NB15数据集上的实验结果表明,所提方法在提升准确率的同时显著地减少了冗余特征. 展开更多
关键词 异常检测 改进鸽群算法 金字塔卷积 特征选择 特征提取
下载PDF
基于改进层次全局模糊熵和MCFS的滚动轴承损伤识别 被引量:3
14
作者 柏世兵 林金亮 杨玉华 《机电工程》 CAS 北大核心 2023年第7期1024-1030,共7页
针对传统的多尺度特征提取方法无法捕捉振动信号高频故障信息的问题,提出了一种基于改进层次全局模糊熵(IHGFE)全局全频段特征提取、多聚类特征选择(MCFS)特征降维和支持向量机分类的滚动轴承故障诊断方法。首先,提出了能够捕捉振动信... 针对传统的多尺度特征提取方法无法捕捉振动信号高频故障信息的问题,提出了一种基于改进层次全局模糊熵(IHGFE)全局全频段特征提取、多聚类特征选择(MCFS)特征降维和支持向量机分类的滚动轴承故障诊断方法。首先,提出了能够捕捉振动信号低频到高频的全局特征的IHGFE非线性动力学方法,并将其用于滚动轴承的故障特征提取;然后,利用MCFS对初始特征向量进行了维数约简和优化,构建了低维且对故障敏感的故障特征向量;最后,建立了基于支持向量机的多故障分类器,实现了滚动轴承损伤的智能化识别,并通过两个滚动轴承实验进行了对比分析。研究结果表明:IHGFE的分类准确率和识别稳定性均优于对比方法,证明了其在特征提取中能够在一定程度上解决现有方法无法同时考虑信号的高频特征和全局特征的问题,可为进一步扩展模糊熵方法在滚动轴承损伤识别中的应用提供参考。 展开更多
关键词 轴承故障诊断 改进层次全局模糊熵 多聚类特征选择 支持向量机 特征降维 故障分类器
下载PDF
基于IMIE、MCFS和SSA-ELM的离心泵故障诊断方法 被引量:1
15
作者 辜文娟 张扬 《机电工程》 CAS 北大核心 2023年第9期1456-1463,共8页
采用多尺度排列熵对离心泵振动信号进行分析时,存在忽略信号幅值信息以及粗粒化处理存在不足的问题,从而导致离心泵的故障识别准确率不高,为此,提出了一种基于改进多尺度增长熵(IMIE)、多聚类特征选择(MCFS)和麻雀搜索算法优化极限学习... 采用多尺度排列熵对离心泵振动信号进行分析时,存在忽略信号幅值信息以及粗粒化处理存在不足的问题,从而导致离心泵的故障识别准确率不高,为此,提出了一种基于改进多尺度增长熵(IMIE)、多聚类特征选择(MCFS)和麻雀搜索算法优化极限学习机(SSA-ELM)的离心泵故障诊断方法。首先,基于改进粗粒化处理,提出了改进多尺度增长熵(IMIE)方法,将其用于提取故障特征,构造了反映离心泵损伤属性的特征矩阵;随后,采用多聚类特征选择(MCFS),对原始故障特征进行了重要性排序,获得了对分类识别贡献度更高的故障特征,提高了故障特征的质量;最后,将低维的敏感特征输入至基于麻雀搜索算法(SSA)的极限学习机(ELM)中,进行了离心泵故障分类,完成了离心泵不同故障类型的识别任务;并采用离心泵故障数据集,对基于IMIE、MCFS和SSA-ELM的故障诊断方法的有效性进行了实验验证。研究结果表明:所提故障诊断方法的故障识别准确率达到了100%,多次实验的平均准确率和标准差也优于其他对比的故障诊断方法,即IMIE能够准确地提取信号中的故障信息,进而表征离心泵的健康状态;SSA-ELM能够准确地识别离心泵的故障类型,证明该方法具有一定的有效性和优越性。 展开更多
关键词 叶片式泵 改进粗粒化处理 改进多尺度增长熵 多聚类特征选择 麻雀搜索算法 极限学习机 特征矩阵
下载PDF
入侵检测中基于IBQGSA的特征选择及SVM参数优化 被引量:2
16
作者 李丛 闫仁武 +1 位作者 丁勇 王云 《计算机工程与设计》 北大核心 2017年第8期2227-2234,共8页
针对支持向量机(SVM)应用于网络入侵检测时特征选择及分类器参数优化问题,利用改进的二进制量子引力搜索算法(IBQGSA)对入侵特征集及SVM参数进行组合寻优。将入侵特征集及SVM参数看作是二进制量子引力搜索算法中的量子个体并进行组合编... 针对支持向量机(SVM)应用于网络入侵检测时特征选择及分类器参数优化问题,利用改进的二进制量子引力搜索算法(IBQGSA)对入侵特征集及SVM参数进行组合寻优。将入侵特征集及SVM参数看作是二进制量子引力搜索算法中的量子个体并进行组合编码,在使用量子旋转门更新个体位移时,引入动态的位移更新策略,确保算法收敛到全局极值,设计与进化程度及个体适应度值相关的自适应变异概率,提升量子非门变异操作时算法的自适应变异能力。利用KDD CUP 99数据集进行仿真实验,实验结果表明,所提算法能有效地获取最佳特征子集及分类器参数组合,检测效果更好。 展开更多
关键词 二进制量子引力搜索 支持向量机 特征选择 参数优化 入侵检测
下载PDF
基于改进ReliefF算法的哑铃动作识别 被引量:1
17
作者 刘国平 王南星 +2 位作者 周毅 汪文博 唐慜越 《科学技术与工程》 北大核心 2019年第32期219-224,共6页
为了实现哑铃动作分类识别的目标,在哑铃上加装惯性传感器模块,通过采集哑铃锻炼过程中的运动信号,经信号标准化、滤波、基于初始静态量周期分割预处理后,提取侧平举、前平举、反握弯举、锤式弯举、弯举5种哑铃动作的特征向量,使用改进... 为了实现哑铃动作分类识别的目标,在哑铃上加装惯性传感器模块,通过采集哑铃锻炼过程中的运动信号,经信号标准化、滤波、基于初始静态量周期分割预处理后,提取侧平举、前平举、反握弯举、锤式弯举、弯举5种哑铃动作的特征向量,使用改进的Relief F特征选择算法,选择最优特征向量,采用基于平衡决策树的支持向量机对不同的哑铃动作进行分类识别。通过在实验室自主研发的哑铃动作识别系统上进行测试,结果表明:系统能够在单个哑铃动作周期内对哑铃动作进行识别,且识别率可达90%以上,为提供更加个性化的哑铃动作指导奠定基础。 展开更多
关键词 哑铃 动作分类识别 初始静态量周期分割 改进的ReliefF特征选择算法 支持向量机
下载PDF
一种改进的特征选择方法在文本分类系统中的应用
18
作者 李长虹 李堂秋 《学术问题研究》 2005年第1期94-98,共5页
本文在介绍文本分类的背景及传统基于向量空间模型特征选择不足之处的同时,提出了不同特征选择方法相结合的文本分类模型。该模型首先对文本进行分析,把文本表示成向量空间的形式。文本在经过预处理后,按一定规则提取关键词,关键词的提... 本文在介绍文本分类的背景及传统基于向量空间模型特征选择不足之处的同时,提出了不同特征选择方法相结合的文本分类模型。该模型首先对文本进行分析,把文本表示成向量空间的形式。文本在经过预处理后,按一定规则提取关键词,关键词的提取中增加了对名词短语的识别。特征选择的方法上,结合了文档频数和互信息量,并对他们进行了改进。实验结果表明,使用新方法进行分类所得到的分类精度得到了一定的提高。 展开更多
关键词 文本分类 特征选择 文档频数 互信息量
下载PDF
基于改进NSGA3的焊接缺陷评估特征选择 被引量:1
19
作者 李波 周家豪 +1 位作者 刘民岷 朱品朝 《系统工程与电子技术》 EI CSCD 北大核心 2022年第7期2211-2218,共8页
在基于多源信息融合的焊接缺陷评估中,特征选择对提高评估精度与速度发挥着重要作用。多源特征集由电弧电特征与电弧声音特征组成,其特点在于特征集中存在冗余与互补特征。因此,本文提出一种基于改进非支配排序遗传算法-Ⅲ(non-dominate... 在基于多源信息融合的焊接缺陷评估中,特征选择对提高评估精度与速度发挥着重要作用。多源特征集由电弧电特征与电弧声音特征组成,其特点在于特征集中存在冗余与互补特征。因此,本文提出一种基于改进非支配排序遗传算法-Ⅲ(non-dominated sorting genetic algorithm-Ⅲ,NSGA3)的多目标特征选择方法,旨在从多源特征集中找到最优特征子集。该方法首先对特征集进行相关、冗余和互补特性分析,再以冗余性最小,相关性与互补性最大为目标建立多目标特征选择优化模型。并基于相关、冗余和互补评价函数提出一种新的变异算子来引导变异过程,以减少无效特征的影响,提高收敛效率。实验采用支持向量机作为学习器来验证学习效果,结果表明,所提方法与其他3种方法相比,可以在特征子集维度和预测精度方面获得更好的性能。 展开更多
关键词 改进非支配排序遗传算法-Ⅲ 冗余 互补 特征选择 变异算子
下载PDF
基于改进特征选择法的移动通信网络流量异常监测系统
20
作者 王小文 《平顶山学院学报》 2019年第5期44-47,共4页
由于传统系统受到网络时延和信号干扰的影响,导致系统监测效果较差,提出了基于改进特征选择法的移动通信网络流量异常监测系统.利用报警装置对异常数据进行警示,并通过显示模块显示监测结果,解析全部网络流量特征.根据特征选择流程,获... 由于传统系统受到网络时延和信号干扰的影响,导致系统监测效果较差,提出了基于改进特征选择法的移动通信网络流量异常监测系统.利用报警装置对异常数据进行警示,并通过显示模块显示监测结果,解析全部网络流量特征.根据特征选择流程,获取网络流量异常特征,实现对异常网络流量的实时监测.提取异常流量并展开分析,采用改进特征选择法对异常流量进行选择,由此实现移动通信网络流量异常监测系统的设计.实验结果显示,该系统最高监测准确率可达88%,保证移动通信网络能在安全稳定条件下运行. 展开更多
关键词 改进特征选择法 移动通信 网络流量 异常 监测 数据包
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部