期刊文献+
共找到322篇文章
< 1 2 17 >
每页显示 20 50 100
聚类边界过采样不平衡数据分类方法 被引量:31
1
作者 楼晓俊 孙雨轩 刘海涛 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2013年第6期944-950,共7页
针对传统SMOTE过采样方法在生成合成样本的过程中存在的盲目性,以及对噪声敏感且容易出现过拟合现象的问题,提出一种改进的聚类边界样本过采样(CB-SMOTE)方法,通过引入"聚类一致性系数"找到少数类样本的边界,利用边界样本的... 针对传统SMOTE过采样方法在生成合成样本的过程中存在的盲目性,以及对噪声敏感且容易出现过拟合现象的问题,提出一种改进的聚类边界样本过采样(CB-SMOTE)方法,通过引入"聚类一致性系数"找到少数类样本的边界,利用边界样本的最近邻密度来剔除噪声点和确定合成样本的数量,对SMOTE方法的新样本合成规则进行了优化.该方法是一种指导性的过采样方法,合成样本更加有利于分类器的学习.通过实验对比6种不同方法在UCI公共数据集上的分类性能,结果表明:CB-SMOTE方法对少数类样本和多数类样本都具有较高的分类准确率,且对过采样倍数的变化具有更高的稳定性. 展开更多
关键词 不平衡数据 过采样 聚类边界 最近邻密度 合成样本
下载PDF
不平衡数据分类方法综述 被引量:28
2
作者 杨明 尹军梅 吉根林 《南京师范大学学报(工程技术版)》 CAS 2008年第4期7-12,共6页
分类问题是机器学习领域的重要研究内容之一,现有的一些分类方法都已经相对成熟,用它们来对平衡数据进行分类一般都能取得较好的分类性能,但在现实世界中数据往往都是不平衡的,而现有的分类器的设计都是基于类分布大致平衡这一假设的,... 分类问题是机器学习领域的重要研究内容之一,现有的一些分类方法都已经相对成熟,用它们来对平衡数据进行分类一般都能取得较好的分类性能,但在现实世界中数据往往都是不平衡的,而现有的分类器的设计都是基于类分布大致平衡这一假设的,如果用这些方法来对不平衡数据进行分类就会导致分类器的性能下降,因而研究用于处理不平衡数据集的分类方法显得相当重要.为便于读者更清晰地了解数据不平衡分类问题的研究现状和未来研究的动向,本文对相关的研究进行了综述和展望. 展开更多
关键词 不平衡数据 过抽样 欠抽样 代价敏感 单分类器 特征选择 子空间
下载PDF
基于聚类融合的不平衡数据分类方法 被引量:28
3
作者 陈思 郭躬德 陈黎飞 《模式识别与人工智能》 EI CSCD 北大核心 2010年第6期772-780,共9页
不平衡数据分类问题目前已成为数据挖掘和机器学习的研究热点.文中提出一类基于聚类融合的不平衡数据分类方法,旨在解决传统分类方法对少数类的识别率较低的问题.该方法通过引入"聚类一致性系数"找出处于少数类边界区域和处... 不平衡数据分类问题目前已成为数据挖掘和机器学习的研究热点.文中提出一类基于聚类融合的不平衡数据分类方法,旨在解决传统分类方法对少数类的识别率较低的问题.该方法通过引入"聚类一致性系数"找出处于少数类边界区域和处于多数类中心区域的样本,并分别使用改进的SMOTE过抽样方法和改进的随机欠抽样方法对训练集的少数类和多数类进行不同的处理,以改善不同类数据的平衡度,为分类算法提供更好的训练平台.通过实验对比8种方法在一些公共数据集上的分类性能,结果表明该方法对少数类和多数类均具有较高的识别率. 展开更多
关键词 不平衡数据 聚类融合 过抽样 欠抽样
原文传递
不平衡分类的数据采样方法综述 被引量:28
4
作者 刘定祥 乔少杰 +4 位作者 张永清 韩楠 魏军林 张榕珂 黄萍 《重庆理工大学学报(自然科学)》 CAS 北大核心 2019年第7期102-112,共11页
如何获得更加精确的分类效果一直是机器学习领域的重要研究内容,现有大多数分类器都是针对平衡的数据集来设计的。虽然平衡的数据训练出来的分类模型能取得较好的正负样本分类正确率,但现实生活中的数据往往是不平衡的,不平衡的数据使... 如何获得更加精确的分类效果一直是机器学习领域的重要研究内容,现有大多数分类器都是针对平衡的数据集来设计的。虽然平衡的数据训练出来的分类模型能取得较好的正负样本分类正确率,但现实生活中的数据往往是不平衡的,不平衡的数据使得正样本分类正确率急剧下降,不能满足机器学习对分类效果的要求。针对这种情况,综述了当前主流不平衡分类的数据采样方法。首先,阐述了欠采样方法,包括基于聚类和基于整合的欠采样方法;其次,对过采样方法进行了总结,包括基于k近邻、基于聚类、基于半监督、基于深度神经网络和基于进化算法的过采样方法;再次,对混合采样方法进行了总结;最后,总结了不平衡分类问题研究的发展趋势。 展开更多
关键词 机器学习 不平衡数据 过采样 欠采样 混合采样
下载PDF
一种新型数字锁相放大器的设计及其优化算法 被引量:20
5
作者 李刚 张丽君 林凌 《天津大学学报》 EI CAS CSCD 北大核心 2008年第4期429-432,共4页
为了提高信号的检测准确度,简化数字锁相放大器(digital lock-in amplifier,DLIA)的构建电路,将过采样技术应用到DLIA中;并对过采样引发的大存储量和大运算量问题,提出一种算法,从而有效地减小了数据的存储量和运算量.结果表明,该方法... 为了提高信号的检测准确度,简化数字锁相放大器(digital lock-in amplifier,DLIA)的构建电路,将过采样技术应用到DLIA中;并对过采样引发的大存储量和大运算量问题,提出一种算法,从而有效地减小了数据的存储量和运算量.结果表明,该方法在不需要高性能微处理器支持的情况下,提高了DLIA的检测准确度和性价比,缩小了DLIA的体积,并可广泛应用于微弱信号的检测. 展开更多
关键词 过采样 数字锁相放大器 高准确度 优化算法
下载PDF
基于过采样技术提高数据采集精度的新方法 被引量:15
6
作者 张新刚 王泽忠 《电力系统自动化》 EI CSCD 北大核心 2004年第14期58-62,共5页
在变电站恶劣的电磁环境下,当前数据采集单元的抗混叠模拟低通滤波器不能充分抑制频谱混叠,从而使测控装置性能变差。基于过采样技术,提出一种能有效抑制频谱混叠的数据采集新方法;进而,紧密结合实际讨论了运用过采样技术设计数据采集... 在变电站恶劣的电磁环境下,当前数据采集单元的抗混叠模拟低通滤波器不能充分抑制频谱混叠,从而使测控装置性能变差。基于过采样技术,提出一种能有效抑制频谱混叠的数据采集新方法;进而,紧密结合实际讨论了运用过采样技术设计数据采集单元的相关问题;最后,通过实验对传统采样方法和过采样方法进行比较,验证了过采样方法的有效性。 展开更多
关键词 过采样 数据采集单元 混叠 低通滤波器 电磁兼容性
下载PDF
面向不平衡数据集的改进型SMOTE算法 被引量:24
7
作者 王超学 张涛 马春森 《计算机科学与探索》 CSCD 2014年第6期727-734,共8页
针对SMOTE(synthetic minority over-sampling technique)在合成少数类新样本时存在的不足,提出了一种改进的SMOTE算法GA-SMOTE。该算法的关键将是遗传算法中的3个基本算子引入到SMOTE中,利用选择算子实现对少数类样本有区别的选择,使... 针对SMOTE(synthetic minority over-sampling technique)在合成少数类新样本时存在的不足,提出了一种改进的SMOTE算法GA-SMOTE。该算法的关键将是遗传算法中的3个基本算子引入到SMOTE中,利用选择算子实现对少数类样本有区别的选择,使用交叉、变异算子实现对合成样本质量的控制。结合GA-SMOTE与SVM(support vector machine)算法来处理不平衡数据的分类问题。UCI数据集上的大量实验表明,GA-SMOTE在新样本的整体合成效果上表现出色,有效提高了SVM在不平衡数据集上的分类性能。 展开更多
关键词 不平衡数据集 分类 遗传算子 少数类样本合成过采样技术(SMOTE) SYNTHETIC MINORITY over-sampling technique (SMOTE)
下载PDF
高精度模数转换器ADS1256的原理和应用 被引量:21
8
作者 孙沁梅 卢益民 《计算机与数字工程》 2005年第3期94-97,共4页
∑ -△模数转换器可实现高分辨率模数转换 ,而且价格低 ,使用方便 ,因而近年来应用广泛。在简单介绍了ADS12 5 6的结构特点和工作原理的基础上 ,阐明如何应用该器件以及应用过程中需要注意的问题 ,为ADS12 5 6或类似器件的使用者提供参考。
关键词 ∑-△ADC 过采样 失调偏差 SPI串行数字接口
下载PDF
结合过采样技术和锯齿成形函数的微弱信号检测 被引量:20
9
作者 李刚 张丽君 +1 位作者 林凌 何峰 《电子学报》 EI CAS CSCD 北大核心 2008年第4期756-759,共4页
为充分利用现有模数转换器的速度来提高检测微弱信号的能力和简化电路、降低成本,本文采用叠加成形函数的方法,利用过采样技术实现对微弱信号检测.分析结果表明,用常规中分辨率ADC直接采样就可达到与现有高分辨率ADC直接采样才有的高精度.
关键词 锯齿成形函数 过采样 高精度 微弱信号检测 高分辨率
下载PDF
一种基于SMOTE的不平衡数据集重采样方法 被引量:19
10
作者 张天翼 丁立新 《计算机应用与软件》 北大核心 2021年第9期273-279,共7页
不平衡数据集是指在数据集中,某一类样本的数量远大于其他类样本的数量,其会影响分类结果,使基本分类器偏向多数类。合成少数样本过采样技术(SMOTE)是处理数据不平衡问题的一种经典过采样方法,以两个少数样本对应的线段为端点生成一个... 不平衡数据集是指在数据集中,某一类样本的数量远大于其他类样本的数量,其会影响分类结果,使基本分类器偏向多数类。合成少数样本过采样技术(SMOTE)是处理数据不平衡问题的一种经典过采样方法,以两个少数样本对应的线段为端点生成一个合成样本。提出一种基于SMOTE的少数群体过采样方法,改进生成新样本的方式,在合成样本的过程中参考两个以上的少数类样本,增加合成样本的多样性。实验结果表明,在不同的基本分类器下该方法可以获得更好的接收者操作特征曲线面积(ROC-AUC)和稳定性。 展开更多
关键词 不平衡数据集 过采样 样本合成 分类
下载PDF
过采样方法与提高ADC分辨率的研究 被引量:13
11
作者 于光平 张昕 《沈阳工业大学学报》 EI CAS 2006年第2期137-139,共3页
在噪声理论的基础上,论证了过采样方法可以实现使用低分辨率的ADC完成高分辨率的数据采集.并对过采样方法作了理论上的探索.有非常多的因素影响ADC的转换结果,如:热噪声、杂色噪声、电源噪声、参考电压波动、时钟不稳定以及量化误差等.... 在噪声理论的基础上,论证了过采样方法可以实现使用低分辨率的ADC完成高分辨率的数据采集.并对过采样方法作了理论上的探索.有非常多的因素影响ADC的转换结果,如:热噪声、杂色噪声、电源噪声、参考电压波动、时钟不稳定以及量化误差等.这些噪声的噪声功率是可以变化的,设计中可以通过多种措施来减小噪声,过采样技术会减小量化误差和获得与高分辨率ADC相同的信噪比,以增加被测数据的有效位数,从而提高ADC的分辨率.这要求被测信号中的噪声为白噪声或至少接近白噪声.实验证明,过采样技术能在一定范围内提高ADC的有效位数. 展开更多
关键词 过采样 信噪比 分辨率 白噪声 数模转换器
下载PDF
利用过采样技术提高ADC测量分辨率 被引量:14
12
作者 刘青兰 方志刚 邵志学 《现代电子技术》 2007年第12期74-76,79,共4页
针对目前单片机内嵌ADC分辨率较低,而外接高分辨率ADC成本又较高的情况,提出了用“过采样”技术使在有用的测量频带内的信噪比得到改善,从而提高ADC测量的分辨率。并利用Matlab对其结论进行仿真,且在TMS320LF2407 DSP上予以实现,结果表... 针对目前单片机内嵌ADC分辨率较低,而外接高分辨率ADC成本又较高的情况,提出了用“过采样”技术使在有用的测量频带内的信噪比得到改善,从而提高ADC测量的分辨率。并利用Matlab对其结论进行仿真,且在TMS320LF2407 DSP上予以实现,结果表明信噪比和测量分辨率明显提高。 展开更多
关键词 过采样 模/数转换器 数据采集 数字信号处理
下载PDF
一种改进的降噪自编码神经网络不平衡数据分类算法 被引量:16
13
作者 张成刚 宋佳智 +1 位作者 姜静清 裴志利 《计算机应用研究》 CSCD 北大核心 2017年第5期1329-1332,共4页
针对少数类样本合成过采样技术(synthetic minority over-sampling technique,SMOTE)在合成少数类新样本时会带来噪声问题,提出了一种改进降噪自编码神经网络不平衡数据分类算法(SMOTE-SDAE)。该算法通过SMOTE方法合成少数类新样本以均... 针对少数类样本合成过采样技术(synthetic minority over-sampling technique,SMOTE)在合成少数类新样本时会带来噪声问题,提出了一种改进降噪自编码神经网络不平衡数据分类算法(SMOTE-SDAE)。该算法通过SMOTE方法合成少数类新样本以均衡原始数据集,考虑到合成样本过程中会产生噪声的影响,利用降噪自编码神经网络算法的逐层无监督降噪学习和有监督微调过程,有效实现对过采样数据集的降噪处理与数据分类。在UCI不平衡数据集上实验结果表明,相比传统SVM算法,该算法显著提高了不平衡数据集中少数类的分类精度。 展开更多
关键词 神经网络 过采样 不平衡数据 分类
下载PDF
A method for satellite time series anomaly detection based on fast-DTW and improved-KNN 被引量:12
14
作者 Langfu CUI Qingzhen ZHANG +4 位作者 Yan SHI Liman YANG Yixuan WANG Junle WANG Chenggang BAI 《Chinese Journal of Aeronautics》 SCIE EI CAS CSCD 2023年第2期149-159,共11页
In satellite anomaly detection,there are some problems such as unbalanced sample distribution,fewer fault samples,and unobvious anomaly characteristics.These problems cause the extisted anomaly detection methods are d... In satellite anomaly detection,there are some problems such as unbalanced sample distribution,fewer fault samples,and unobvious anomaly characteristics.These problems cause the extisted anomaly detection methods are difficult to train accurate classification model,and the accuracy of anomaly detection is hard to improve.At the same time,the monitoring data of satellite has high dimension and is difficult to extract effective features.Based on the DTW over-sampling method,this paper realizes the over-sampling of fault samples in satellite time series,and constructs a distributed and balanced time series data set.The Fast-DTW method is applied to calculate the distance between different time series,which can improve the speed of similarity calculation.KNN(K-Nearest Neighbor)method is applied for classification and the best classification result is obtained by search the optimal hyper-parameters k.The results show that the proposed method has high anomaly detection accuracy and consumes short calculation time. 展开更多
关键词 Anomaly detection Fast-DTW KNN over-sampling SATELLITE Time series
原文传递
不均衡数据集中基于Adaboost的过抽样算法 被引量:13
15
作者 韩慧 王文渊 毛炳寰 《计算机工程》 CAS CSCD 北大核心 2007年第10期207-209,共3页
为了提高不均衡数据集中少数类的分类性能,该文融合了提升和过抽样的优点,提出了基于提升算法Adaboost的过抽样算法MCMO-Boost,并且将其与决策树算法C4.5、提升算法Adaboost和过抽样算法SMOTE进行了实验比较与分析。结果表明,MCMO-Boos... 为了提高不均衡数据集中少数类的分类性能,该文融合了提升和过抽样的优点,提出了基于提升算法Adaboost的过抽样算法MCMO-Boost,并且将其与决策树算法C4.5、提升算法Adaboost和过抽样算法SMOTE进行了实验比较与分析。结果表明,MCMO-Boost算法在少数类和数据集的总体分类性能方面都优于其它算法。 展开更多
关键词 不均衡数据集 过抽样 提升算法
下载PDF
一种基于SVM的非均衡数据集过采样方法 被引量:14
16
作者 张忠林 冯宜邦 赵中恺 《计算机工程与应用》 CSCD 北大核心 2020年第23期220-228,共9页
针对不平衡数据集分类结果偏向多数类的问题,重采样技术是解决此问题的有效方法之一。而传统过采样算法易合成无效样本,欠采样方法易剔除重要样本信息。基于此提出一种基于SVM的不平衡数据过采样方法SVMOM(Oversampling Method Based on... 针对不平衡数据集分类结果偏向多数类的问题,重采样技术是解决此问题的有效方法之一。而传统过采样算法易合成无效样本,欠采样方法易剔除重要样本信息。基于此提出一种基于SVM的不平衡数据过采样方法SVMOM(Oversampling Method Based on SVM)。SVMOM通过迭代合成样本。在迭代过程中,通过SVM得到分类超平面;根据每个少数类样本到分类超平面的距离赋予样本距离权重;同时考虑少数类样本的类内平衡,根据样本的分布计算样本的密度,赋予样本密度权重;依据样本的距离权重和密度权重计算每个少数类样本的选择权重,根据样本的选择权重选择样本运用SMOTE合成新样本,达到平衡数据集的目的。实验结果表明,提出的算法在一定程度上解决了分类结果偏向多数类的问题,验证了算法的有效性。 展开更多
关键词 不平衡数据 支持向量机(SVM) 过采样 样本权重 合成少数类过采样技术(SMOTE)
下载PDF
Σ-ΔADC原理及应用 被引量:7
17
作者 张静 罗丁利 《火控雷达技术》 2006年第3期10-13,共4页
Σ-ΔADC近年来得到了广泛的应用。文中分析了Σ-ΔADC的结构组成,从过采样、噪声整型、数字滤波和抽取等方面,阐述其工作原理,并简要介绍了Σ-ΔADC在实际工程中的应用。
关键词 Σ-ΔADC 过采样 Σ-Δ调制 数字滤波
下载PDF
不均衡数据集学习中基于初分类的过抽样算法 被引量:11
18
作者 韩慧 王路 +1 位作者 温明 王文渊 《计算机应用》 CSCD 北大核心 2006年第8期1894-1897,共4页
为了有效地提高不均衡数据集中少数类的分类性能,提出了基于初分类的过抽样算法。首先,对测试集进行初分类,以尽可能多地保留多数类的有用信息;其次,对于被初分类预测为少数类的样本进行再次分类,以有效地提高少数类的分类性能。使用美... 为了有效地提高不均衡数据集中少数类的分类性能,提出了基于初分类的过抽样算法。首先,对测试集进行初分类,以尽可能多地保留多数类的有用信息;其次,对于被初分类预测为少数类的样本进行再次分类,以有效地提高少数类的分类性能。使用美国加州大学欧文分校的数据集将基于初分类的过抽样算法与合成少数类过抽样算法、欠抽样方法进行了实验比较。结果表明,基于初分类的过抽样算法的少数类与多数类的分类性能都优于其他两种算法。 展开更多
关键词 不均衡数据集 过抽样 欠抽样
下载PDF
Over-sampling algorithm for imbalanced data classification 被引量:9
19
作者 XU Xiaolong CHEN Wen SUN Yanfei 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2019年第6期1182-1191,共10页
For imbalanced datasets, the focus of classification is to identify samples of the minority class. The performance of current data mining algorithms is not good enough for processing imbalanced datasets. The synthetic... For imbalanced datasets, the focus of classification is to identify samples of the minority class. The performance of current data mining algorithms is not good enough for processing imbalanced datasets. The synthetic minority over-sampling technique(SMOTE) is specifically designed for learning from imbalanced datasets, generating synthetic minority class examples by interpolating between minority class examples nearby. However, the SMOTE encounters the overgeneralization problem. The densitybased spatial clustering of applications with noise(DBSCAN) is not rigorous when dealing with the samples near the borderline.We optimize the DBSCAN algorithm for this problem to make clustering more reasonable. This paper integrates the optimized DBSCAN and SMOTE, and proposes a density-based synthetic minority over-sampling technique(DSMOTE). First, the optimized DBSCAN is used to divide the samples of the minority class into three groups, including core samples, borderline samples and noise samples, and then the noise samples of minority class is removed to synthesize more effective samples. In order to make full use of the information of core samples and borderline samples,different strategies are used to over-sample core samples and borderline samples. Experiments show that DSMOTE can achieve better results compared with SMOTE and Borderline-SMOTE in terms of precision, recall and F-value. 展开更多
关键词 imbalanced data density-based spatial clustering of applications with noise(DBSCAN) synthetic minority over sampling technique(SMOTE) over-sampling.
下载PDF
基于流形嵌入过采样的非平衡数据分类方法 被引量:11
20
作者 程健 杨凌凯 +1 位作者 崔宁 郭一楠 《中国矿业大学学报》 EI CAS CSCD 北大核心 2018年第6期1325-1333,共9页
工业监测数据中正常与异常状态数据一般存在非平衡性,而传统的过采样非平衡数据处理方法往往在解决非线性、高维含噪的非平衡问题时不能获得满意的模式分类效果.本文利用流形学习的非线性降维,提出一种流形嵌入过采样方法,为有机结合流... 工业监测数据中正常与异常状态数据一般存在非平衡性,而传统的过采样非平衡数据处理方法往往在解决非线性、高维含噪的非平衡问题时不能获得满意的模式分类效果.本文利用流形学习的非线性降维,提出一种流形嵌入过采样方法,为有机结合流形学习与过采样的非平衡数据模式分类方法提供了统一框架.研究结果表明:该方法采用过采样平衡数据在流形空间的低维嵌入数据直接完成模式分类,可以减小流形嵌入空间到原始数据空间反映射的计算代价和模式分类成本.另外,流形学习可以有效保持原始数据结构特性,在流形嵌入空间的过采样可以实现更符合原始数据特性的非线性插值.面向TE过程和矿山微震2种具有不同规模和特性的非平衡工业监测数据集,F1指标分别平均提升了21.94%和37.34%,AUC指标分别提升了37.85%和10.64%,从而验证了所提方法在解决较大数据规模的非平衡模式分类问题时,具有稳定良好的分类效果. 展开更多
关键词 流形学习 过采样 非平衡数据 模式分类 TE过程 矿山微震
原文传递
上一页 1 2 17 下一页 到第
使用帮助 返回顶部