-
题名融合簇边界移动与自适应合成的混合采样算法
被引量:4
- 1
-
-
作者
高雷阜
张梦瑶
赵世杰
-
机构
辽宁工程技术大学运筹与优化研究院
辽宁工程技术大学优化与决策研究所
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2022年第10期2517-2529,共13页
-
基金
辽宁省教育厅重点攻关项目(No.LJ2019ZL001)。
-
文摘
针对伪负采样算法(Pseudo-Negative Sampling,PNS)存在的类内子聚集和类别重叠问题,提出一种融合簇边界负样本移动策略(Cluster Boundary Negative Movement Strategy,CBNMS)与自适应正样本合成技术(Adaptive Pos⁃itive Synthesis Technology,ADPST)的改进混合采样算法(Improved Cluster Boundary Negative Movement Strategy,ICB⁃NMS),以提升非均衡数据的整体分类性能和正类识别精度.CBNMS策略采用凝聚层次聚类对正负类样本进行划分,并通过各局部样本间相似关系识别潜在负类中且与正类相关性较大的簇边界负样本,提高采样的局部精确性和时效性.为进一步加强CBNMS策略对正样本重叠区域的识别性能,ICBNMS算法在簇边界负样本移动均衡化基础上,引入ADPST技术,利用稀疏度与距离复合因子组合加权以自适应确定最优样本生成区域,从而有效削弱样本的重叠性且丰富样本的多样性.实验结果表明,相比其他采样算法,ICBNMS算法在10个非均衡数据集的多组实验中G-mean和Fmeasure等指标获得最优值,且时间效率比CDSMOTE和PNS算法分别提升了32.27%和27.88%,凸显出更优越的鲁棒性和泛化性.
-
关键词
非均衡数据分类
凝聚层次聚类
簇边界负样本移动
自适应正样本合成
混合采样
-
Keywords
imbalanced data classification
agglomerative hierarchical cluster
cluster boundary negative sample movement
adaptive positive sample synthesis
mixed-sampling
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
TP39
[自动化与计算机技术—控制科学与工程]
-