期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于深度学习的软件缺陷预测模型 被引量:4
1
作者 陈凯 邵培南 《计算机系统应用》 2021年第1期29-37,共9页
为了提高软件的可靠性,软件缺陷预测已经成为软件工程领域中一个重要的研究方向.传统的软件缺陷预测方法主要是设计静态代码度量,并用机器学习分类器来预测代码的缺陷概率.但是,静态代码度量未能充分考虑到潜藏在代码中的语义特征.根据... 为了提高软件的可靠性,软件缺陷预测已经成为软件工程领域中一个重要的研究方向.传统的软件缺陷预测方法主要是设计静态代码度量,并用机器学习分类器来预测代码的缺陷概率.但是,静态代码度量未能充分考虑到潜藏在代码中的语义特征.根据这种状况,本文提出了一种基于深度卷积神经网络的软件缺陷预测模型.首先,从源代码的抽象语法树中选择合适的结点提取表征向量,并构建字典将其映射为整数向量以方便输入到卷积神经网络.然后,基于GoogLeNet设计卷积神经网络,利用卷积神经网络的深度挖掘数据的能力,充分挖掘出特征中的语法语义特征.另外,模型使用了随机过采样的方法来处理数据分类不均衡问题,并在网络中使用丢弃法来防止模型过拟合.最后,用Promise上的历史工程数据来测试模型,并以AUC和F1-measure为指标与其他3种方法进行了比较,实验结果显示本文提出的模型在软件缺陷预测性能上得到了一定的提升. 展开更多
关键词 软件缺陷预测 抽象语法树 卷积神经网络 随机采样 丢弃法
下载PDF
基于不平衡电能数据的反窃电智能监测系统研究
2
作者 张爱梅 《电工技术》 2024年第4期134-136,共3页
面对电网中的窃电行为,设计一个基于不平衡电能数据的反窃电智能监测系统,完成用电负荷数据的预处理后,运用随机过采样—迭代决策树算法建立计量装置的异常监测和用户异常用电行为的智能分析数学模型,快速检测出异常用电客户,并在此基... 面对电网中的窃电行为,设计一个基于不平衡电能数据的反窃电智能监测系统,完成用电负荷数据的预处理后,运用随机过采样—迭代决策树算法建立计量装置的异常监测和用户异常用电行为的智能分析数学模型,快速检测出异常用电客户,并在此基础上开发嵌入式专家分析系统,实现用户的电能数据在线监测分析,自动展示异常用电数据,定位窃电用户。 展开更多
关键词 不平衡数据 随机采样 迭代决策树算法 反窃电系统
下载PDF
航段截尾油耗数据的区间估计方法
3
作者 陈静杰 梁国栋 刘家学 《计算机工程与设计》 北大核心 2023年第10期3103-3109,共7页
对航段截尾油耗数据进行区间估计时,数据分布的稀疏性及非正态性会导致传统基于单因素的油耗估计区间难以建立。针对上述问题,提出基于分类和沙普利加性解释(classification and Shapley additive explanations,C-SHAP)的改进分位数回... 对航段截尾油耗数据进行区间估计时,数据分布的稀疏性及非正态性会导致传统基于单因素的油耗估计区间难以建立。针对上述问题,提出基于分类和沙普利加性解释(classification and Shapley additive explanations,C-SHAP)的改进分位数回归森林区间估计(quantile regression forest,QRF)方法。通过C-SHAP方法,筛选全航程和各飞行阶段特征得到最优输入特征集;采用随机过采样算法增加训练集中截尾油耗样本的权值,提高QRF模型的估计性能;通过QRF估计给定上、下限油耗条件分位数,构建估计区间。实验结果表明,该方法的特征选择合理、估计区间质量较高。 展开更多
关键词 截尾数据 数据分布 分类 沙普利加性解释 随机采样 分位数回归森林 区间估计
下载PDF
基于机器学习的导弹干扰试验效果评估实证研究
4
作者 闫晓伟 曲豫宾 《海军航空工程学院学报》 2020年第6期445-450,482,共7页
针对复杂电磁环境下导弹干扰试验影响因素众多,难以量化,试验数据采集困难以及实验数据中普遍存在类不平衡等问题,基于机器学习创建导弹试验干扰效果评估模型,采用随机森林、支持向量机、朴素贝叶斯、多层感知机等常见模型对导弹试验干... 针对复杂电磁环境下导弹干扰试验影响因素众多,难以量化,试验数据采集困难以及实验数据中普遍存在类不平衡等问题,基于机器学习创建导弹试验干扰效果评估模型,采用随机森林、支持向量机、朴素贝叶斯、多层感知机等常见模型对导弹试验干扰效果进行评估。特别针对小数据样本中的类不平衡问题提出2阶段分类模型,采用过采样方式解决类不平衡问题并采用随机森林进行分类。基于开源的导弹干扰效果评估数据,通过实证研究说明,基于过采样的随机森林模型在干扰效果评估问题中具有较强的泛化能力和鲁棒性,在AUC指标上,该模型比多层感知机模型在中位数上最多提高60%,建议在后续的试验中采用该模型进行导弹干扰效果评估。 展开更多
关键词 机器学习 导弹干扰试验 实证研究 随机采样
下载PDF
采用混合模型的电信领域用户流失预测 被引量:9
5
作者 汪明达 周俏丽 蔡东风 《计算机工程与应用》 CSCD 北大核心 2019年第24期214-221,270,共9页
用户流失预测能够帮助公司减少客户的流失,对公司的营收和提高竞争力有重要意义。然而,由于电信领域数据的稀疏性和不平衡等问题,国内外对于电信领域的用户流失预测大多处于研究阶段,还没有真正应用到实际生产当中。提出了利用神经网络... 用户流失预测能够帮助公司减少客户的流失,对公司的营收和提高竞争力有重要意义。然而,由于电信领域数据的稀疏性和不平衡等问题,国内外对于电信领域的用户流失预测大多处于研究阶段,还没有真正应用到实际生产当中。提出了利用神经网络、机器学习与朴素随机过采样、投票相结合的混合模型来预测电信领域的流失用户。数据集使用的是KDD Cup 2009年比赛数据,该数据由法国电信运行商Orange公司提供。在十折交叉验证下,AdaBoost和Gradient Boosting一次投票分类后AUC值能够达到0.6771,利用其他模型对混合模型预测出的流失用户清单进行二次投票分类,前200名高危流失用户的预测准确率能够达到31.8%。实验结果表明,朴素随机过采样和投票相结合有效提升了模型的准确性。 展开更多
关键词 神经网络 机器学习 朴素随机采样 投票分类
下载PDF
基于ROSE和C5.0算法的打鼾者OSAHS初筛模型 被引量:3
6
作者 杜国栋 吕云辉 +4 位作者 马磊 相艳 邵党国 雷强 胡蓉 《计算机工程与应用》 CSCD 北大核心 2018年第3期250-254,共5页
使用医疗信息系统的数据进行睡眠呼吸暂停低通气综合征(OSAHS)预测和分析过程中,存在不平衡数据问题。为此,在现有临床研究的基础上,提出了一种基于ROSE(Random Over Sampling Examples)和C5.0算法的初筛模型。利用收集到的人体测量学... 使用医疗信息系统的数据进行睡眠呼吸暂停低通气综合征(OSAHS)预测和分析过程中,存在不平衡数据问题。为此,在现有临床研究的基础上,提出了一种基于ROSE(Random Over Sampling Examples)和C5.0算法的初筛模型。利用收集到的人体测量学指标数据,通过数据预处理,删除异常值并填补缺失值。然后采用ROSE算法对数据进行平衡,利用C5.0分类器对平衡后的数据构建筛查模型,通过十则交叉验证的方法检验模型的筛查效果。实验结果表明,使用该模型进行打鼾患者的OSAHS筛查,可以有效地提高筛查效率。 展开更多
关键词 不均衡数据 初筛模型 随机采样(ROSE) C5.0决策树
下载PDF
基于极限树机器学习算法的岩爆预测 被引量:1
7
作者 熊炎林 陈冠甫 刘晓丽 《地下空间与工程学报》 CSCD 北大核心 2023年第S02期908-919,共12页
随着地下工程向深部发展,岩爆预测变越得来越紧迫。机器学习的迅速发展使得越来越多的智能算法被用于预测岩爆。针对监督学习算法在岩爆预测中的缺陷,本文通过使用朴素随机过采样、特征权重分析、主成分分析、交叉验证和过拟合分析等方... 随着地下工程向深部发展,岩爆预测变越得来越紧迫。机器学习的迅速发展使得越来越多的智能算法被用于预测岩爆。针对监督学习算法在岩爆预测中的缺陷,本文通过使用朴素随机过采样、特征权重分析、主成分分析、交叉验证和过拟合分析等方法,建立了基于极限树(ET)算法的模型。收集246个岩爆案例建立数据库,数据库分为训练集(70%)和测试集(30%),选取8个特征值作为输入参数。通过对比三种过采样处理方法,最终采用朴素随机过采样的方法处理数据集以便获得均衡的数据集,与不均衡的数据集相比准确度提高了12%。为解释ET模型,引入排列重要性算法分析了8个特征值的相对重要性。结果表明弹性能指数是最重要的因素。通过主成分分析对数据进行可视化分析,发现经过过采样处理后的轻微岩爆和中等岩爆数据变得相对离散。使用交叉验证的方法确定ET中的超参数,并对模型的泛化性进行评价,结果表明ET模型具有较好的泛化性。 展开更多
关键词 岩爆 极限树 朴素随机采样 主成分分析 交叉验证
下载PDF
基于过采样和卫星图像多特征融合的街区品质评估
8
作者 郭茂祖 王偲佳 +2 位作者 王鹏跃 李阳 赵玲玲 《广西科学》 CAS 北大核心 2022年第4期652-659,共8页
城市街区的品质评估是城市规划中的重要步骤之一。针对已有街区品质评估模型中使用的街景图像采集位置和角度不统一造成的图像内容偏差问题,本文提出使用视角统一且易获取的卫星图像代替街景图像。同时考虑多种街区品质测度指标,将非图... 城市街区的品质评估是城市规划中的重要步骤之一。针对已有街区品质评估模型中使用的街景图像采集位置和角度不统一造成的图像内容偏差问题,本文提出使用视角统一且易获取的卫星图像代替街景图像。同时考虑多种街区品质测度指标,将非图像型数据与图像型数据进行特征融合,从多角度进行城市街区品质表达,然后针对小样本和数据不平衡场景,结合机器学习中的随机过采样和随机森林(Random Forest, RF),基于融合数据进行城市街区的品质评估。实验结果表明,本研究方法可以有效进行全面的城市街区品质表达,并有效降低过拟合,对比未使用过采样和多特征融合的方法,正确率提高约8个百分点。 展开更多
关键词 城市街区品质评估 特征融合 朴素随机采样 随机森林 卫星图像
下载PDF
面向不平衡数据的信用卡异常交易模型研究
9
作者 徐璐 唐大卫 《信息产业报道》 2024年第8期0160-0163,共4页
本研究针对金融交易数据中欺诈检测的挑战,特别是在类别不平衡问题上,提出了一套综合处理方案。通过实施随机欠采样和 SMOTE 过采样技术,有效平衡了欺诈与非欺诈交易的数据比例,优化了模型学习环境。然而,研究也揭示了过采样模型在欺诈... 本研究针对金融交易数据中欺诈检测的挑战,特别是在类别不平衡问题上,提出了一套综合处理方案。通过实施随机欠采样和 SMOTE 过采样技术,有效平衡了欺诈与非欺诈交易的数据比例,优化了模型学习环境。然而,研究也揭示了过采样模型在欺诈预测上的波动性,以及欠采样模型在增加假阴性预测上的局限性。因此,未来研究将聚焦于对过采样数据集进行异常值处理,以进一步提升模型精确度,并探索数据混洗对模型稳定性和预测性能的影响,为金融欺诈检测领域处理不平衡数据集提供了一个解决思路。 展开更多
关键词 信用卡欺诈 数据不平衡 随机采样采样 异常交易检测
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部