摘要
受大数据类别不平衡性影响,传统分类方法的分类性能会大幅度下降。针对上述问题,进行改进RF算法在高维不平衡大数据分类处理中的应用研究。首先针对不平衡大数据采用过采样技术,以增加少数类样本数量,实现大数据平衡化;然后利用主成分分析法提取大数据主成分特征,同时实现数据降维;最后利用粒子群算法改进RF算法构建改进RF分类模型,实现高维不平衡大数据分类处理。结果表明,与3种传统方法相比,基于改进RF的分类方法分类准确性更高,由此证明该方法的分类性能更强,更有利于处理高维不平衡大数据。
作者
劳雪松
郑健
LAO Xuesong;ZHENG Jian
出处
《桂林航天工业学院学报》
2024年第3期439-445,共7页
Journal of Guilin University of Aerospace Technology
基金
安徽省高校自然科学研究重点项目“基于Spring+SpringCloud云计算环境下分布式微服务CRP平台构建及实现”(KJ2018A0757)。