期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
一种处理不平衡大数据的并行随机森林算法 被引量:8
1
作者 秦静 钱雪忠 +2 位作者 王卫涛 谢国伟 宋威 《微电子学与计算机》 CSCD 北大核心 2017年第4期22-27,共6页
基于MapReduce机制的并行随机森林算法MR_RF在处理不平衡大数据时,由于数据本身正类密度低且算法又以全局最优标准选择分割点,而导致正类有误分为负类的趋势,降低了分类效率.本文提出了一种改进的并行随机森林算法(SBWMR_RF),该算法利... 基于MapReduce机制的并行随机森林算法MR_RF在处理不平衡大数据时,由于数据本身正类密度低且算法又以全局最优标准选择分割点,而导致正类有误分为负类的趋势,降低了分类效率.本文提出了一种改进的并行随机森林算法(SBWMR_RF),该算法利用分层自助抽样方法增大对少数类的抽样数量,同时考虑正负类不同的误分代价,动态计算每个分区的代价敏感矩阵,将其引入到构建基分类器的关键步骤,弱化数据偏置的影响.实验证明SBWMR_RF算法提高了对不平衡大数据的分类准确率,没有出现过拟合现象,在极不平衡环境下优势明显. 展开更多
关键词 不平衡大数据 MAPREDUCE 随机森林 代价敏感 分层自助抽样
下载PDF
云计算环境下不平衡大数据动态分类仿真 被引量:8
2
作者 包涵 范晓安 《计算机仿真》 北大核心 2020年第8期311-314,461,共5页
针对传统大数据分类方法未对数据的主要特征进行优化分类,导致准确率低、效率差等问题,提出基于随机森林算法的不平衡大数据动态分类。设计分类系统基本框架以及分类处理器的硬件结构,针对大数据时域特征中的瞬时能量,计算帧数及过零率... 针对传统大数据分类方法未对数据的主要特征进行优化分类,导致准确率低、效率差等问题,提出基于随机森林算法的不平衡大数据动态分类。设计分类系统基本框架以及分类处理器的硬件结构,针对大数据时域特征中的瞬时能量,计算帧数及过零率。依据得到的计算结果使用线性预测和梅尔频率倒谱系数两种方式,结合帧数大小构建不平衡大数据的主要特征函数。利用随机森林算法的表达函数,建立算法的基本框架,分别对其中的子模型优化分类。再获取决策树模型,对不平衡数据特征分裂处理,实现数据动态分类,并使用少数类和多数类评价指标,对结果进行理论检验。通过仿真表明,上述方法具有更高的数据分类准确率,更好的分类效果,可为今后的大数据动态分类工作提供良好的参考。 展开更多
关键词 云计算 不平衡大数据 动态分类 帧数 随机森林算法
下载PDF
基于优化模糊C-means算法的不平衡大数据分类研究
3
作者 卓柳俊 曾心怡 《信息技术》 2024年第10期14-21,29,共9页
针对不平衡大数据的分类问题,提出一种优化模糊C-means算法的不平衡大数据分类算法。先计算C-means模糊交叉算子,定义优化函数,并求解大数据不平衡增益。利用Spark分类平台,确定大数据样本压缩模糊近邻值的取值范围,再通过放大近邻值的... 针对不平衡大数据的分类问题,提出一种优化模糊C-means算法的不平衡大数据分类算法。先计算C-means模糊交叉算子,定义优化函数,并求解大数据不平衡增益。利用Spark分类平台,确定大数据样本压缩模糊近邻值的取值范围,再通过放大近邻值的处理方式,定义不平衡阈向量,从而完善整个分类流程,完成基于优化模糊C-means算法的不平衡大数据分类方法的设计。实验结果表明,上述分类方法的应用,可将正例信息、负例信息的取样长度区间完全分离开来,能有效解决因不平衡大数据分类不精准造成的信息样本混淆的问题,符合实际应用需求。 展开更多
关键词 优化模糊C-means算法 不平衡大数据 交叉算子 卡方检验 压缩模糊近邻值
下载PDF
基于无限深度神经网络的非平衡大数据集群匿名化调度算法 被引量:4
4
作者 张婷 《计算技术与自动化》 2022年第3期71-76,共6页
以提升非平衡大数据集群数据调度的高效性、准确性、安全性为目的,提出基于无限深度神经网络的非平衡大数据集群匿名化调度算法。数据采集模块利用传感器采集非平衡大数据集群中各节点服务器的数据信息,传输至数据分类模块的深度最小最... 以提升非平衡大数据集群数据调度的高效性、准确性、安全性为目的,提出基于无限深度神经网络的非平衡大数据集群匿名化调度算法。数据采集模块利用传感器采集非平衡大数据集群中各节点服务器的数据信息,传输至数据分类模块的深度最小最大概率机中,通过卷积神经网络的端对端方式,训练获得的非平衡大数据,提取原始大数据高级特征,以最小最大概率机作为分类器,实现非平衡大数据的分类;应用数据匿名化模块的K-匿名化算法匿名化处理分类后的数据信息,经数据调度模块中基于蚁群算法的负载均衡调度方法,进行非平衡大数据集群各节点、任务的实时调度。实验结果表明:该算法可提升非平衡大数据的分类准确度,降低信息损失率、泄密风险,并可充分调度优势节点与空闲节点实现任务的均衡分配,提升非平衡大数据集群的任务调度能力。 展开更多
关键词 无限深度神经网络 非平衡大数据 匿名化 卷积神经网络 最小最大概率机 负载均衡
下载PDF
基于深度卷积生成对抗网络的不平衡大数据监测与诊断 被引量:3
5
作者 林君萍 《重庆科技学院学报(自然科学版)》 CAS 2022年第1期99-103,共5页
针对不平衡数据集的在线监测与诊断问题,提出一种基于深度卷积生成对抗网络的算法模型。通过生成器与判别器之间的不断对抗,实现对数据训练网络参数的调整和优化,并得到近似分布数据,用以矫正数据集的不平衡性。利用深度卷积网络的转置... 针对不平衡数据集的在线监测与诊断问题,提出一种基于深度卷积生成对抗网络的算法模型。通过生成器与判别器之间的不断对抗,实现对数据训练网络参数的调整和优化,并得到近似分布数据,用以矫正数据集的不平衡性。利用深度卷积网络的转置卷积层替代池化层,在检测空间内实现上下同步采样,同时避免反复选择数据训练层参数而带来高成本计算。生成器的损失函数降低了生成数据与真实数据之间的差距。仿真实验结果显示,提出的算法具有较强的不平衡数据训练能力、分类能力和故障诊断性能。 展开更多
关键词 深度卷积 生成对抗网络 不平衡大数据 损失函数
下载PDF
分布式非平衡大数据兼容性云储存方法仿真 被引量:3
6
作者 康瑞华 《计算机仿真》 北大核心 2021年第6期339-342,347,共5页
针对传统的非平衡大数据云存储方法兼容性效果差、数据失真率较高等缺陷,提出一种分布式非平衡大数据兼容性云储存方法。首先根据分布式系统的数据存储原理,分析行式和列式储存的消耗情况,并针对消耗现象应用分类器处理正负两类样列,以... 针对传统的非平衡大数据云存储方法兼容性效果差、数据失真率较高等缺陷,提出一种分布式非平衡大数据兼容性云储存方法。首先根据分布式系统的数据存储原理,分析行式和列式储存的消耗情况,并针对消耗现象应用分类器处理正负两类样列,以获得较好的分类效果和几何均值;测评非平衡数据集分类效果,强化云存储方法兼容性;最后通过构建大数据访问局部性优化体制,实现分布式非平衡大数据兼容性云储存。经仿真验证,所提方法的兼容性优、失真率较低。 展开更多
关键词 分布式 非平衡大数据 兼容性 云储存
下载PDF
面向不平衡工业大数据集的SVM-tree分类算法研究 被引量:1
7
作者 林君萍 《长春师范大学学报》 2022年第2期40-46,共7页
针对不平衡率较高的工业大数据分类问题,提出一种基于SVM-tree的不平衡大数据分类算法研究。利用Tomek-links对清除系统噪声的影响,基于K-means算法对不平衡数据集做分簇处理,降低数据分类的复杂度,构建SVM-tree模型,将不平衡数据样本... 针对不平衡率较高的工业大数据分类问题,提出一种基于SVM-tree的不平衡大数据分类算法研究。利用Tomek-links对清除系统噪声的影响,基于K-means算法对不平衡数据集做分簇处理,降低数据分类的复杂度,构建SVM-tree模型,将不平衡数据样本映射到高维空间,根据数据集的规模和数据不平衡程度,调整SVM-tree的树形结构,在保证数据分类准确率的同时,也降低了算法模型的代价成本。实验分析结果表明,SVM-tree算法模型具有良好数据聚类性能,算法运行时间较短,且不平衡大数据分类准确率高。 展开更多
关键词 不平衡大数据 Tomek-links K-MEANS算法 SVM-tree模型
下载PDF
基于鲸鱼优化和深度学习的不平衡大数据分类算法 被引量:11
8
作者 孙二华 胡云冰 《西南师范大学学报(自然科学版)》 CAS 2021年第5期127-133,共7页
针对当前不平衡数据分类算法中存在的分类精度低和容易陷入局部最优状态的问题,提出一种基于鲸鱼优化和深度学习的不平衡大数据分类算法.该算法由特征选择、预处理和分类3个阶段组成:①为了提高分类精度,使用鲸鱼优化算法(whale optimiz... 针对当前不平衡数据分类算法中存在的分类精度低和容易陷入局部最优状态的问题,提出一种基于鲸鱼优化和深度学习的不平衡大数据分类算法.该算法由特征选择、预处理和分类3个阶段组成:①为了提高分类精度,使用鲸鱼优化算法(whale optimization algorithm,WOA)在不平衡数据中寻找最优特征子集,消除不相关和多余的特征;②采用局部敏感哈希的合成少数类过采样技术(locality sensitive hashing synthetic minority oversampling technique,LSH-SMOT)对数据集进行预处理,解决类不平衡问题;③使用基于WOA算法优化的双向递归神经网络(bidirectional recurrent neural networks,BRNN)对预处理后的数据集进行分类.实验结果表明:本文算法能够有效解决不平衡数据集的分类问题,相比于其他算法,本文算法在分类精度和局部最优避免率方面具有明显优势. 展开更多
关键词 不平衡大数据分类 鲸鱼优化算法 深度学习 合成少数类过采样技术
下载PDF
基于PSO-DBN结构的不平衡大数据分类研究 被引量:1
9
作者 谢晓丽 姚兴平 《长沙大学学报》 2024年第2期15-22,50,共9页
针对传统算法在分类处理不平衡大数据集时存在的精度差和效率低等问题,提出了一种基于PSO-DBN的分类算法。先采用融合渐进式的过采样模式改善大数据集的不均衡状况,并优化样本的类别与数量组合;设计了一种堆栈式的RBM结构,以当前RBM的... 针对传统算法在分类处理不平衡大数据集时存在的精度差和效率低等问题,提出了一种基于PSO-DBN的分类算法。先采用融合渐进式的过采样模式改善大数据集的不均衡状况,并优化样本的类别与数量组合;设计了一种堆栈式的RBM结构,以当前RBM的隐含层输出项作为下一个RBM的可见层输入项,提升DBN整体数据训练能力;基于PSO仿生算法改善初始状态下DBN权值的分布状态,并优选出最佳的学习因子、惯性权重等核心参数,实现算法在全局范围内的寻优,同时提高网络模型整体的数据训练能力和收敛速度。实验结果显示,提出算法在不同的不平衡比例下分类精度均具有较为明显的优势,同时分类效率加速比值被控制在1.05以下。 展开更多
关键词 PSO-DBN 不平衡大数据集 RBM结构 训练能力 分类精度
下载PDF
基于随机森林模型的不平衡大数据分类算法 被引量:2
10
作者 魏亚明 孟媛 《吉林大学学报(信息科学版)》 CAS 2023年第6期1079-1085,共7页
针对目前不平衡大数据分类算法分类效果较差的问题,提出基于随机森林模型的不平衡大数据分类算法。首先采用SVM(Support Vector Machine)支持向量机算法对不平衡大数据进行信息过滤,然后利用反k近邻法检测并消除离群点,通过增量主成分... 针对目前不平衡大数据分类算法分类效果较差的问题,提出基于随机森林模型的不平衡大数据分类算法。首先采用SVM(Support Vector Machine)支持向量机算法对不平衡大数据进行信息过滤,然后利用反k近邻法检测并消除离群点,通过增量主成分分析法去掉不平衡大数据中协方差矩阵存在的奇异性,并依据熵值法对其展开权重解析,进而提取不平衡大数据特征信息。将CART(Classification and Regression Trees)决策树当作不平衡大数据的基分类器,进而构建随机森林决策树分类器,最后将提取的不平衡大数据特征信息输入分类器中,实现不平衡大数据分类。实验结果表明,该算法对不平衡大数据的采样效果较好,并且分类精准度、稳定性和性能都较高。 展开更多
关键词 随机森林模型 不平衡大数据分类 SVM支持向量机 反k近邻法 CART决策树
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部