期刊文献+
共找到233篇文章
< 1 2 12 >
每页显示 20 50 100
基于邻域粒化和粗糙逼近的数值属性约简 被引量:290
1
作者 胡清华 于达仁 谢宗霞 《软件学报》 EI CSCD 北大核心 2008年第3期640-649,共10页
对于空间中的任一子集,通过基本邻域信息粒子进行逼近,由此提出了邻域信息系统和邻域决策表模型.分析了该模型的性质,并且基于此模型构造了数值型属性的选择算法.利用UCI标准数据集与现有算法进行了比较分析,实验结果表明,该模型可以选... 对于空间中的任一子集,通过基本邻域信息粒子进行逼近,由此提出了邻域信息系统和邻域决策表模型.分析了该模型的性质,并且基于此模型构造了数值型属性的选择算法.利用UCI标准数据集与现有算法进行了比较分析,实验结果表明,该模型可以选择较少的特征而保持或改善分类能力. 展开更多
关键词 数值特征 粒度计算 邻域关系 粗糙集 可变精度 属性约简 特征选择
下载PDF
Rough Set身经网络智能系统及其应用 被引量:29
2
作者 陈遵德 《模式识别与人工智能》 EI CSCD 北大核心 1999年第1期1-5,共5页
提出将RS理论与人工神经网络结合起来进行模式识别的RS神经网络智能系统。并应用该系统对地质样品进行分类,分类结果表明:本系统速度快、易实现,而且在优选属性、最大程度地减少地质样品分析测试指标种数、提高分类正确率等方面,优于其... 提出将RS理论与人工神经网络结合起来进行模式识别的RS神经网络智能系统。并应用该系统对地质样品进行分类,分类结果表明:本系统速度快、易实现,而且在优选属性、最大程度地减少地质样品分析测试指标种数、提高分类正确率等方面,优于其它方法。 展开更多
关键词 智能系统 RS理论 人工神经网络 分类 干酪根
原文传递
基于改进离散型萤火虫群优化算法和分形维数的属性选择方法 被引量:30
3
作者 倪志伟 肖宏旺 +1 位作者 伍章俊 薛永坚 《模式识别与人工智能》 EI CSCD 北大核心 2013年第12期1169-1178,共10页
属性选择是数据挖掘领域中数据预处理的一个重要方法.文中提出一种融合离散型萤火虫群优化算法(DGSO)与分形维数的属性选择方法.该方法以分形维数作为属性子集的评估度量准则,以DGSO作为搜索策略.为分析该方法的可行性和有效性,采用6个... 属性选择是数据挖掘领域中数据预处理的一个重要方法.文中提出一种融合离散型萤火虫群优化算法(DGSO)与分形维数的属性选择方法.该方法以分形维数作为属性子集的评估度量准则,以DGSO作为搜索策略.为分析该方法的可行性和有效性,采用6个UCI数据集进行实验.结合10-fold交叉验证和SVM对属性选择前后的分类准确率进行分析,并进行搜索策略和评估度量准则间的性能对比及详细的参数分析.结果表明该方法具有较高的可行性和有效性. 展开更多
关键词 属性选择 分形维数 萤火虫群优化算法
下载PDF
基于分类规则的C4.5决策树改进算法 被引量:22
4
作者 李孝伟 陈福才 李邵梅 《计算机工程与设计》 CSCD 北大核心 2013年第12期4321-4325,4330,共6页
为解决大样本数据条件下C4.5决策树算法需要训练集常驻内存、分类精度达不到需求以及如何选取最优分类规则等问题,提出了一种基于分类规则选取的C4.5决策树改进算法。通过数次有放回的随机抽取训练集形成多个分类规则,在多次分类规则内... 为解决大样本数据条件下C4.5决策树算法需要训练集常驻内存、分类精度达不到需求以及如何选取最优分类规则等问题,提出了一种基于分类规则选取的C4.5决策树改进算法。通过数次有放回的随机抽取训练集形成多个分类规则,在多次分类规则内寻找特征的最优取值以建立最优分类规则,以划分相似度为标准进行C4.5决策树最优特征选取,在此基础上利用选定的最优分类规则和最优特征对C4.5决策树算法进行改进。实验结果表明,改进后的算法可有效解决C4.5决策树与初始训练集相关性较大的问题,对大样本数据集的分类识别在识别率上有显著提高,训练时间明显减少。 展开更多
关键词 C4 5决策树 分类规则 属性度量 划分相似度 特征选取
下载PDF
基于属性选择的改进加权朴素贝叶斯分类算法 被引量:21
5
作者 王行甫 杜婷 《计算机系统应用》 2015年第8期149-154,共6页
朴素贝叶斯分类算法简单且高效,但其基于属性间强独立性的假设限制了其应用范围.针对这一问题,提出一种基于属性选择的改进加权朴素贝叶斯分类算法(ASWNBC).该算法将基于相关的属性选择算法(CFS)和加权朴素贝叶斯分类算法(WNBC)相结合,... 朴素贝叶斯分类算法简单且高效,但其基于属性间强独立性的假设限制了其应用范围.针对这一问题,提出一种基于属性选择的改进加权朴素贝叶斯分类算法(ASWNBC).该算法将基于相关的属性选择算法(CFS)和加权朴素贝叶斯分类算法(WNBC)相结合,首先使用CFS算法获得属性子集使简化后的属性集尽量满足条件独立性,同时根据不同属性取值对分类结果影响的不同设计新权重作为算法的加权系数,最后使用ASWNBC算法进行分类.实验结果表明,该算法在降低分类消耗时间的同时提高了分类准确率,有效地提高了朴素贝叶斯分类算法的性能. 展开更多
关键词 属性选择 朴素贝叶斯分类 权重 相关性 关联性
下载PDF
科技期刊评价指标的属性分类及选用原则 被引量:20
6
作者 赵惠祥 张弘 +1 位作者 刘燕萍 陶文文 《编辑学报》 CSSCI 北大核心 2008年第2期179-182,共4页
从信息传播的角度对科技期刊评价指标的反映属性进行分析,将评价指标分为以下4类:影响力指标、文献指标、载体指标、管理指标。通过对评价目的、方法及需求的分析,评价指标相关性和量纲因素分析,以及评价指标选用的发展趋势,提出7项指... 从信息传播的角度对科技期刊评价指标的反映属性进行分析,将评价指标分为以下4类:影响力指标、文献指标、载体指标、管理指标。通过对评价目的、方法及需求的分析,评价指标相关性和量纲因素分析,以及评价指标选用的发展趋势,提出7项指标选用原则:与评价目的相适应、考虑评价需求的差异、考虑指标的相关性影响、考虑指标的量纲因素、考虑被评期刊类型特点、指标常态获取的便利与可操作性、考虑评价指标选用的发展趋势。 展开更多
关键词 科技期刊 评价指标 属性 分类 选用原则
下载PDF
基于蚁群算法的异常数据检测方法 被引量:20
7
作者 蔡美 刘波 《计算机工程》 CAS CSCD 北大核心 2016年第8期166-169,177,共5页
由于传统基于O-measure度量的异常数据检测方法在对异常数据进行检测时需要对路径进行全搜索,并且在数据量较少的情况下会产生误判,因此其在检测效率和查准率上具有明显的缺陷。为此,根据蚁群算法的正反馈性质,提出一种将蚁群算法和属... 由于传统基于O-measure度量的异常数据检测方法在对异常数据进行检测时需要对路径进行全搜索,并且在数据量较少的情况下会产生误判,因此其在检测效率和查准率上具有明显的缺陷。为此,根据蚁群算法的正反馈性质,提出一种将蚁群算法和属性相关分析相结合的属性异常点检测方法。将蚁群收敛到的路径作为异常路径,计算异常路径上各个节点O-measure值,并根据O-measure值确定数据异常点。实验结果表明,该方法在查全率、查准率和效率上均优于传统的基于O-measure度量的异常数据检测方法。 展开更多
关键词 异常检测 属性 异常数据 蚁群算法 路径选择
下载PDF
基于特征选择和多分类支持向量机的异常检测 被引量:20
8
作者 张晓惠 林柏钢 《通信学报》 EI CSCD 北大核心 2009年第S1期68-73,共6页
现有大部分的异常检测系统都是把数据分成正常和异常两类,这样可能会丢失重要信息。特征选择的目的是减少异常检测冗余特征的同时,高度保持和原始特征的一致性。实现了特征选择和多分类支持向量机的异常检测技术。采取粗糙集、SVDF、LGP... 现有大部分的异常检测系统都是把数据分成正常和异常两类,这样可能会丢失重要信息。特征选择的目的是减少异常检测冗余特征的同时,高度保持和原始特征的一致性。实现了特征选择和多分类支持向量机的异常检测技术。采取粗糙集、SVDF、LGP、MARS相结合的特征选择方法。同时利用多分类支持向量机把数据分成五类。通过实验分析,表明DoS攻击相对于其他3种攻击的漏报率是最高的。 展开更多
关键词 异常检测 粗糙集 支持向量机 多类分类 特征选择
下载PDF
基于支持向量机的属性优选和储层预测 被引量:17
9
作者 张长开 姜秀娣 +2 位作者 朱振宇 印海燕 陆文凯 《石油地球物理勘探》 EI CSCD 北大核心 2012年第2期282-285,183-184,共4页
本文采用基于支持向量机(SVM)的特征选择方法进行地震属性优选,根据油井的产油气情况将油井分为高产井和低产井,利用SVM对这些样本进行训练,然后根据每个属性对应的权值进行筛选,便可以选取对油气敏感的属性,进而更好地预测储层。具体... 本文采用基于支持向量机(SVM)的特征选择方法进行地震属性优选,根据油井的产油气情况将油井分为高产井和低产井,利用SVM对这些样本进行训练,然后根据每个属性对应的权值进行筛选,便可以选取对油气敏感的属性,进而更好地预测储层。具体过程为:①提取一定量的地震属性;②根据已知井的信息,获得训练样本,训练线性SVM;③计算各个特征的权值;④选取较大权值绝对值对应的多个属性;⑤将支持向量回归机(SVR)应用于优选出的属性,获得储层预测的结果。实际资料应用结果表明,文中方法不仅能筛选出有效的地震属性,还能够有效地预测储层。 展开更多
关键词 支持向量机 地震属性 属性优选 支持向量回归机 储层预测
下载PDF
一种基于分形维的快速属性选择算法 被引量:14
10
作者 鲍玉斌 王琢 +1 位作者 孙焕良 于戈 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2003年第6期527-530,共4页
属性选择是数据挖掘、文档分类和多媒体索引等领域研究的一个热点问题·利用分形维进行属性选择是一种新的方法,它利用数据集的分形维作为属性的重要性度量·基于分形维的快速属性选择算法(IFAS),利用后向属性选择策略和降维操... 属性选择是数据挖掘、文档分类和多媒体索引等领域研究的一个热点问题·利用分形维进行属性选择是一种新的方法,它利用数据集的分形维作为属性的重要性度量·基于分形维的快速属性选择算法(IFAS),利用后向属性选择策略和降维操作的投影特性,根据E维的分形树导出E 1维的分形树(用来计算分形维的数据结构)·因此,只需扫描一次数据集,避免了FDR算法多次扫描数据集的问题·通过图像特征数据集合和合成的分形数据集对两种算法进行性能测试·实验结果显示,IFAS算法明显优于FDR算法·IFAS算法的时间和空间复杂度都为O(n),响应时间与属性维数呈线性关系· 展开更多
关键词 属性选择 分形 分形维 数据挖掘 计盒维数 分形树 合并
下载PDF
基于贝叶斯公式的垃圾邮件过滤方法 被引量:11
11
作者 詹川 卢显良 +2 位作者 周旭 侯孟书 袁连海 《计算机科学》 CSCD 北大核心 2005年第2期73-75,共3页
伴随着电子邮件的广泛使用,垃圾邮件泛滥成灾,严重影响了人们正常的学习、工作和生活。本文提出了一种改进的基于贝叶斯公式垃圾邮件过滤技术。我们采用了基于词熵的特征项提取方法,并且使用特征项单词出现频率来表示向量,推导出相应的... 伴随着电子邮件的广泛使用,垃圾邮件泛滥成灾,严重影响了人们正常的学习、工作和生活。本文提出了一种改进的基于贝叶斯公式垃圾邮件过滤技术。我们采用了基于词熵的特征项提取方法,并且使用特征项单词出现频率来表示向量,推导出相应的贝叶斯计算公式。实验表明,我们的方法使垃圾邮件过滤的整体性能都有明显提高。 展开更多
关键词 垃圾邮件过滤 特征项 电子邮件 表示 整体性能 使用 提取方法 正常 泛滥 实验
下载PDF
融合基于MapReduce并行改进二元蚁群算法与分形维数的属性选择方法 被引量:11
12
作者 许力分 倪志伟 +2 位作者 朱旭辉 贾凯 伍章俊 《系统科学与数学》 CSCD 北大核心 2019年第6期918-933,共16页
属性选择是数据挖掘领域用于降低数据特征维度的预处理方法.针对大数据环境下高维数据的属性约简问题,提出了融合基于MapReduce并行改进二元蚁群算法与分形维数的属性选择方法.首先,引入了参数控制的位置更新策略、对蚂蚁个体与种群进... 属性选择是数据挖掘领域用于降低数据特征维度的预处理方法.针对大数据环境下高维数据的属性约简问题,提出了融合基于MapReduce并行改进二元蚁群算法与分形维数的属性选择方法.首先,引入了参数控制的位置更新策略、对蚂蚁个体与种群进行交叉变异、重新定义阻塞机制的信息素更新,提出了并行改进的二元蚁群算法MRIBACO.其次,以并行二元蚁群算法作为离散解空间的搜索策略,结合分形维数提出了属性选择模型.在6个UCI数据集上的实验结果表明,较其他方法计算效率更优,同时表明了其有效性与稳定性. 展开更多
关键词 属性选择 分形理论 二元蚁群优化算法 MAPREDUCE 分群分治
原文传递
面向类不平衡数据集的软件缺陷预测模型 被引量:11
13
作者 李冉 周丽娟 王华 《计算机应用研究》 CSCD 北大核心 2018年第9期2806-2810,共5页
软件缺陷数据的类不平衡问题会影响缺陷预测分类的准确性,为解决类不平衡数据对预测分类的影响,针对如何优化数据预处理的算法执行顺序进行了研究,提出了一种有效提升分类效果的软件缺陷预测模型(ASRAdaBoost)。该算法模型在根据对照实... 软件缺陷数据的类不平衡问题会影响缺陷预测分类的准确性,为解决类不平衡数据对预测分类的影响,针对如何优化数据预处理的算法执行顺序进行了研究,提出了一种有效提升分类效果的软件缺陷预测模型(ASRAdaBoost)。该算法模型在根据对照实验确定数据预处理最优顺序后,采用特征选择卡方检验算法,再执行SMOTE过采样与简单采样方法,解决数据类不平衡和属性冗余同时存在的问题,最后结合AdaBoost集成算法,构建出软件缺陷预测模型ASRAdaBoost。实验均采用J48决策树作为基分类器,实验结果表明ASRAdaBoost算法模型有效地提高了软件缺陷预测的准确性,得到了更好的分类效果。 展开更多
关键词 软件缺陷预测 类不平衡数据 特征选择 集成算法
下载PDF
基于特征选择和支持向量机的异常检测 被引量:10
14
作者 肖海军 王小非 +1 位作者 洪帆 崔国华 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第3期99-102,共4页
为在提高检测率的同时保持较低的虚警率,提出一种不同于单一算法的基于特征选择和支持向量机的异常检测技术.首先用一个数据子集进行特征选择,通过构造函数来计算特征间的相似度,并在不失样本信息的前提下,完成会话样本的特征选择;然后... 为在提高检测率的同时保持较低的虚警率,提出一种不同于单一算法的基于特征选择和支持向量机的异常检测技术.首先用一个数据子集进行特征选择,通过构造函数来计算特征间的相似度,并在不失样本信息的前提下,完成会话样本的特征选择;然后对用于训练和测试的数据执行特征选择,剔除不必要的数据特征;最后利用支持向量机来判断入侵.仿真实验表明:与基于标准的支持向量机、基于tf×idf的支持向量机、基于tf×idf的神经网络及基于数据挖掘等的异常检测相比较,该方法具有更高检测率,同时其虚警率也更低. 展开更多
关键词 异常检测 特征选择 支持向量机 虚警率 检测率
下载PDF
基于联合分析的绿色产品属性选择偏好研究 被引量:10
15
作者 葛万达 盛光华 《干旱区资源与环境》 CSSCI CSCD 北大核心 2019年第8期49-54,共6页
绿色产品购买是缓解资源环境压力、推动社会经济可持续发展的现实需要。现有研究更多是从绿色产品的环保属性出发,探讨如何促进消费者对绿色产品的购买,忽略了消费者对绿色产品基本属性偏好的研究。文中选取产品价格、产品种类、产品品... 绿色产品购买是缓解资源环境压力、推动社会经济可持续发展的现实需要。现有研究更多是从绿色产品的环保属性出发,探讨如何促进消费者对绿色产品的购买,忽略了消费者对绿色产品基本属性偏好的研究。文中选取产品价格、产品种类、产品品牌和绿色程度四类影响消费者绿色购买的产品属性因素,运用联合分析法定量评估了消费者对绿色产品不同属性的偏好。研究结果表明:消费者最关注的绿色产品属性是产品价格,其次为产品种类和产品品牌,对绿色程度的偏好较低;消费者最优偏好的绿色产品属性水平组合是食品类、完全绿色、知名品牌、溢价20%的绿色产品。 展开更多
关键词 绿色产品 产品属性 联合分析 选择偏好
原文传递
基于数据挖掘的神经网络光伏发电预测研究 被引量:10
16
作者 杨洁 成珂 《激光杂志》 北大核心 2018年第8期59-62,共4页
在建立神经网络光伏发电预测模型时,可选择的输入变量较多,其中部分是重复或者与发电量密切度不高,引入这类变量会降低预测精度,因此需要选择合适的输入变量。为了提高神经网络光伏发电预测的精度,该研究首先应用数据挖掘分析可输入变... 在建立神经网络光伏发电预测模型时,可选择的输入变量较多,其中部分是重复或者与发电量密切度不高,引入这类变量会降低预测精度,因此需要选择合适的输入变量。为了提高神经网络光伏发电预测的精度,该研究首先应用数据挖掘分析可输入变量与预测日发电量的相关系数,进而建立神经网络模型,在分析比较的基础上最终确定合适的输入变量。研究结果表明合理选择输入变量,可有效提高神经网络光伏发电系统的预测性能,有利于减少光伏发电随机性对电力系统的影响。 展开更多
关键词 神经网络 光伏发电 预测模型 数据挖掘 属性选择
下载PDF
支持向量机在银行贷款客户分类中的应用研究 被引量:7
17
作者 郑启鹏 李秀 +1 位作者 刘文煌 李兵 《微计算机信息》 北大核心 2005年第11X期68-70,共3页
随着客户关系管理系统的不断发展和应用,使用先进的算法进行客户分析变得越来越重要。尤其是象银行这种以客户为导向的行业,客户分析是十分必要的。当前,支持向量机方法作为一种统计学习理论的分类方法已经发展的比较成熟而且成功应用... 随着客户关系管理系统的不断发展和应用,使用先进的算法进行客户分析变得越来越重要。尤其是象银行这种以客户为导向的行业,客户分析是十分必要的。当前,支持向量机方法作为一种统计学习理论的分类方法已经发展的比较成熟而且成功应用到了很多领域。文章解决的主要问题是对银行的客户数据根据其属性对客户进行分类,为银行的客户关系管理系统提供一种可靠的分类方法。文中主要介绍了银行的客户分类学习的过程和结果,如,客户数据清洗,数据预处理,SVM进行数据分类,多类分类处理,客户属性选择等问题。 展开更多
关键词 客户关系管理 支持向量机 数据挖掘 客户分类 属性选择
下载PDF
基于离散度的决策树构造方法 被引量:5
18
作者 亓常松 孙吉贵 于海鸿 《控制与决策》 EI CSCD 北大核心 2008年第1期51-55,共5页
在构造决策树的过程中,属性选择将影响到决策树的分类精度.对此,讨论了基于信息熵方法和WMR方法的局限性,提出了信息系统中条件属性集的离散度的概念.利用该概念在决策树构造过程中选择划分属性,设计了基于离散度的决策树构造算法DSD.DS... 在构造决策树的过程中,属性选择将影响到决策树的分类精度.对此,讨论了基于信息熵方法和WMR方法的局限性,提出了信息系统中条件属性集的离散度的概念.利用该概念在决策树构造过程中选择划分属性,设计了基于离散度的决策树构造算法DSD.DSD算法可以解决WMR方法在实际应用中的局限性.在UCI数据集上的实验表明,该方法构造的决策树精度与基于信息熵的方法相近,而时间复杂度则优于基于信息熵的方法. 展开更多
关键词 决策树 离散度 属性选择
下载PDF
基于粗糙集粒子群支持向量机的特征选择方法 被引量:9
19
作者 崔文岩 孟相如 +3 位作者 李纪真 王明鸣 陈天平 王坤 《微电子学与计算机》 CSCD 北大核心 2015年第1期120-123,共4页
将Filter型粗糙集属性约简方法与PSO-SVM方法相结合,提出一种新的粗糙集粒子群支持向量机(RSPSO-SVM)特征选择方法.给出了该方法的特征选择具体步骤,并对比分析了所提方法的性能.仿真实验表明:提出的RS-PSO-SVM特征选择方法是有效的,在... 将Filter型粗糙集属性约简方法与PSO-SVM方法相结合,提出一种新的粗糙集粒子群支持向量机(RSPSO-SVM)特征选择方法.给出了该方法的特征选择具体步骤,并对比分析了所提方法的性能.仿真实验表明:提出的RS-PSO-SVM特征选择方法是有效的,在保证所选特征集为最优情况下,极大地缩短所用时间,可以将其应用在多维数据的特征选择中. 展开更多
关键词 粗糙集 属性约简 粒子群支持向量机 特征选择
下载PDF
基于K-means聚类的软件定义网络异常流量分类研究 被引量:8
20
作者 王彬彬 《齐齐哈尔大学学报(自然科学版)》 2022年第2期50-55,90,共7页
考虑到软件定义网络异常流量分类受到网络复杂特性的影响,导致分类效果变差,提出了基于K-means聚类的软件定义网络异常流量分类研究。利用权重属性,划分了软件定义网络异常流量的频度,在网络异常流量的分布形式转化过程基础上,根据软件... 考虑到软件定义网络异常流量分类受到网络复杂特性的影响,导致分类效果变差,提出了基于K-means聚类的软件定义网络异常流量分类研究。利用权重属性,划分了软件定义网络异常流量的频度,在网络异常流量的分布形式转化过程基础上,根据软件定义网络异常节点出现的概率,计算了异常流量的特征值,提取出软件定义网络异常流量特征,根据软件定义网络异构值差的度量,初始化软件定义网络的参考向量值,通过更新分类属性的邻域半径,计算网络异常流量的参考向量,选择出软件定义网络异常流量分类属性,利用K-means聚类算法过滤软件定义网络异常流量,对软件定义网络异常流量进行检索,通过定义网络异常流量分类的目标函数,利用K-means聚类算法理论,构建软件定义网络异常流量的加权临界函数,结合对角矩阵的求解,设计了软件定义网络异常流量分类原理,实现了软件定义网络异常流量的分类。实验结果表明,文中分类方法的查全率、差准率较高,适应度以及收敛性能较好。 展开更多
关键词 K-MEANS聚类 软件定义网络 异常流量 分类方法 特征提取 属性选择
下载PDF
上一页 1 2 12 下一页 到第
使用帮助 返回顶部