期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
基于概率阈值Bagging算法的不平衡数据分类方法 被引量:15
1
作者 张忠林 吴挡平 《计算机工程与科学》 CSCD 北大核心 2019年第6期1086-1094,共9页
类别不平衡问题广泛存在于现实生活中,多数传统分类器假定类分布平衡或误分类代价相等,因此类别不平衡数据严重影响了传统分类器的分类性能。针对不平衡数据集的分类问题,提出了一种处理不平衡数据的概率阈值Bagging分类方法—PT-Baggin... 类别不平衡问题广泛存在于现实生活中,多数传统分类器假定类分布平衡或误分类代价相等,因此类别不平衡数据严重影响了传统分类器的分类性能。针对不平衡数据集的分类问题,提出了一种处理不平衡数据的概率阈值Bagging分类方法—PT-Bagging。将阈值移动技术与Bagging集成算法结合起来,在训练阶段使用原始分布的训练集进行训练,在预测阶段引入决策阈值移动方法,利用校准的后验概率估计得到对不平衡数据分类的最大化性能测量。实验结果表明,PT-Bagging算法具有更好的处理不平衡数据的分类优势。 展开更多
关键词 不平衡数据 阈值移动 Bagging集成学习 后验概率
下载PDF
用于软件缺陷预测的集成模型 被引量:5
2
作者 胡梦园 黄鸿云 丁佐华 《计算机科学》 CSCD 北大核心 2019年第11期176-180,共5页
软件缺陷预测的目的是有效地识别出有缺陷的模块。对于类别平衡数据,传统的分类器具有较好的预测效果,但当数据类别比例分布不均衡时,传统的分类器往往偏向于多数类,易使得少数类模块被误分。但是,真实的软件缺陷预测中的数据往往是类... 软件缺陷预测的目的是有效地识别出有缺陷的模块。对于类别平衡数据,传统的分类器具有较好的预测效果,但当数据类别比例分布不均衡时,传统的分类器往往偏向于多数类,易使得少数类模块被误分。但是,真实的软件缺陷预测中的数据往往是类别不平衡的。为了处理软件缺陷中的这种类别不平衡问题,文中提出了基于改进的类权自适应、软投票与阈值移动的集成模型,该模型在不改变原始数据集的情况下,从训练阶段和决策阶段同时考虑处理类别不平衡的问题。首先,在类权值学习阶段,通过类权自适应学习得到不同类的最优权值;然后,在训练阶段,使用前一步得到的最优权值训练3个基分类器,并通过软集成的方法组合3个基分类器;最后,在决策阶段,根据阈值移动模型来做出决策,以得到最终预测类别。为了证明所提方法的有效性,实验采用NASA软件缺陷标准数据集和Eclipse软件缺陷标准数据集进行预测,并在相同的数据集上将其与近年提出的几种软件缺陷预测方法在召回率值Pd、假正例率值Pf和F 1度量值F-measure方面进行了对比。实验结果表明,所提方法的召回率Pd平均提高了0.09,在F 1度量值F-measure上平均提高了0.06。因此,文中提出的处理软件缺陷预测中类别不平衡问题的方法的整体性能优于其他软件缺陷预测方法,具有较好的预测效果。 展开更多
关键词 软件缺陷预测 类权自适应 软投票 集成学习 软集成 阈值移动
下载PDF
基于考虑气温影响的门限自回归移动平均模型居民日用电负荷预测 被引量:13
3
作者 孙玉芹 王亚文 +1 位作者 朱威 李彦 《电力建设》 CSCD 北大核心 2022年第9期117-124,共8页
由于气温突变点的影响,负荷序列存在门限效应,导致传统线性时间序列模型的负荷预测效果较差。将气温突变点作为门限,建立了以气温为协变量的门限自回归移动平均(threshold autoregressive moving average with exogenous variable,TARM... 由于气温突变点的影响,负荷序列存在门限效应,导致传统线性时间序列模型的负荷预测效果较差。将气温突变点作为门限,建立了以气温为协变量的门限自回归移动平均(threshold autoregressive moving average with exogenous variable,TARMAX)模型,提高了预测精度。首先,应用马尔科夫链蒙特卡洛(Markov chain Monte Carlo,MCMC)方法对气温突变点进行搜寻得到模型参数。然后,采用随机搜索变量的方法快速选择出最优模型,有效降低选择时间序列模型的计算量。最后,对不同季节下的居民日用电负荷进行预测。实例表明,与线性时间序列模型、长短期记忆网络(long short-term memory network,LSTM)和多层感知机(multilayer perceptron,MLP)相比,TARMAX模型提高了电力负荷的预测精度。 展开更多
关键词 居民日用电负荷预测 门限自回归移动平均(TARMA)模型 气温突变点 门限 协变量
原文传递
融合生成对抗网络和难例挖掘的产品质量预测模型
4
作者 李剑锋 柏雪 +3 位作者 赵春财 钱朋超 王洪涛 徐伟风 《计算机集成制造系统》 EI CSCD 北大核心 2024年第10期3698-3707,共10页
针对连续性工业生产特点,重点关注类别不平衡造成的不合格样本召回率低问题。为了从高维数据提取有效特征,结合one class F-score和最小冗余最大相关性在特征提取方面的优势,有效降低特征维度并提取有价值特征;利用Wasserstein生成对抗... 针对连续性工业生产特点,重点关注类别不平衡造成的不合格样本召回率低问题。为了从高维数据提取有效特征,结合one class F-score和最小冗余最大相关性在特征提取方面的优势,有效降低特征维度并提取有价值特征;利用Wasserstein生成对抗网络(WGAN)方法扩增不合格样本数量;通过类别权重优化Focal Loss函数以提高困难样本识别率;通过轻量级梯度提升机算法结合阈值移动策略,构建基于WGAN数据增强和难例挖掘技术的质量预测模型(WGAN_Focal Loss_LGB(TM))。将所提模型应用于开源SECOM数据集,验证了所提方法的有效性。 展开更多
关键词 高维数据 Wasserstein生成式对抗网络 Focal Loss函数 难例挖掘 轻量级梯度提升机算法 阈值移动 产品质量预测
下载PDF
塔克拉玛干沙漠塔中地区春夏季风蚀起沙研究 被引量:28
5
作者 杨兴华 何清 艾力.买买提明 《中国沙漠》 CSCD 北大核心 2010年第4期770-776,共7页
利用塔克拉玛干沙漠腹地塔中地区的观测资料,对塔中地区春夏季地表土壤风蚀起沙的临界摩擦速度及其变化特征和起沙风速进行了分析研究,并计算了2008年4月19日和7月19日两次沙尘暴天气过程沙漠地表的风蚀起沙量。结果表明:塔中地区春夏... 利用塔克拉玛干沙漠腹地塔中地区的观测资料,对塔中地区春夏季地表土壤风蚀起沙的临界摩擦速度及其变化特征和起沙风速进行了分析研究,并计算了2008年4月19日和7月19日两次沙尘暴天气过程沙漠地表的风蚀起沙量。结果表明:塔中地区春夏季地表起沙的临界摩擦速度为0.26m·s-1;2m高度的临界起沙风速约为4.1m·s-1;两次沙尘暴过程的顺风向沙粒通量和垂直尘粒通量的平均值分别为17.44×10-4kg·m-1·s-1、13.8×10-8kg·m-2·s-1、164.69×10-4kg·m-1·s-1和799.77×10-8kg·m-2·s-1;沙尘通量的变化与风速及摩擦速度的变化具有一致性。 展开更多
关键词 风蚀起沙 临界摩擦速度 起沙风速 沙尘通量 塔克拉玛干沙漠
原文传递
盐池地区沙尘暴期间风沙运动若干特征研究 被引量:22
6
作者 王鹏祥 孙兰东 +1 位作者 岳平 牛生杰 《中国沙漠》 CSCD 北大核心 2007年第6期1077-1079,共3页
通过沙尘暴期间的实际观测资料,对宁夏盐池地区沙尘暴期间风蚀起沙的几个相关特性进行了研究。结果表明:当地10m高度的临界起沙速度为5.0m·s^-1,临界摩擦速度为0.32m·s^-1;采用凌裕泉提出的“最大可能输沙量”计算方法,得出... 通过沙尘暴期间的实际观测资料,对宁夏盐池地区沙尘暴期间风蚀起沙的几个相关特性进行了研究。结果表明:当地10m高度的临界起沙速度为5.0m·s^-1,临界摩擦速度为0.32m·s^-1;采用凌裕泉提出的“最大可能输沙量”计算方法,得出盐池地区沙尘暴期间的输沙量为12.42kg·m^-1;当地沙尘气溶胶粒子传输距离为1.4×10^5~1.4×10^6km。 展开更多
关键词 沙尘暴 风蚀 临界起沙速度 临界摩擦速度
下载PDF
塔克拉玛干沙漠腹地起沙阈值计算解析 被引量:9
7
作者 周成龙 何清 +3 位作者 张爱强 刘厚勇 蒋新波 杨兴华 《沙漠与绿洲气象》 2014年第5期53-57,共5页
临界起沙风速是判别风沙活动能否发生的关键指标,其变化受到地表状况及大气环境的综合影响。为了进一步认识临界起沙风速在野外条件下的变化规律,选取塔克拉玛干沙漠腹地塔中作为研究区,在综合考虑地表土壤粒径、土壤湿度、空气密度等... 临界起沙风速是判别风沙活动能否发生的关键指标,其变化受到地表状况及大气环境的综合影响。为了进一步认识临界起沙风速在野外条件下的变化规律,选取塔克拉玛干沙漠腹地塔中作为研究区,在综合考虑地表土壤粒径、土壤湿度、空气密度等因素的基础上,利用经验公式计算了该地区每月的临界起沙风速。得出:(1)塔中地区2 m高度的临界摩擦速度值介于0.24~0.36 m/s,均值为0.31 m/s;(2)塔中地区2 m高度的临界起沙风速值介于3.9~5.9 m/s,均值为5.1 m/s;(3)塔中地区起沙阈值,最高值出现在夏季,次高值出现在冬季,春季最小。 展开更多
关键词 地表土壤含水率 临界摩擦速度 临界起沙风速
下载PDF
代价敏感的Boosting软件缺陷预测方法 被引量:7
8
作者 李莉 任振康 石可欣 《计算机工程》 CAS CSCD 北大核心 2022年第3期175-180,共6页
软件缺陷预测可以有效提高软件的可靠性,修复系统存在的漏洞。Boosting重抽样是解决软件缺陷预测样本数量不足问题的常用方法,但常规Boosting方法在处理领域类不平衡问题时效果不佳。为此,提出一种代价敏感的Boosting软件缺陷预测方法 C... 软件缺陷预测可以有效提高软件的可靠性,修复系统存在的漏洞。Boosting重抽样是解决软件缺陷预测样本数量不足问题的常用方法,但常规Boosting方法在处理领域类不平衡问题时效果不佳。为此,提出一种代价敏感的Boosting软件缺陷预测方法 CSBst。针对缺陷模块漏报和误报代价不同的问题,利用代价敏感的Boosting方法更新样本权重,增大产生第一类错误的样本权重,使之大于无缺陷类样本权重与第二类错误样本的权重,从而提高模块的预测率。采用阈值移动方法对多个决策树基分类器的分类结果进行集成,以解决过拟合问题。在此基础上,通过分析给出模型构建过程中权重和阈值的最优化设置。在NASA软件缺陷预测数据集上进行实验,结果表明,在小样本的情况下,与CSBKNN、CSCE方法相比,CSBst方法的BAL预测指标分别提升7%和3%,且时间复杂度降低一个数量级。 展开更多
关键词 软件缺陷预测 决策树 机器学习 阈值移动方法 BOOSTING方法
下载PDF
台特玛湖干涸湖盆区风蚀起沙研究 被引量:2
9
作者 鲁涛 刘维 +4 位作者 徐玉波 李本德 周楠 李平 陈龙 《干旱区资源与环境》 CSSCI CSCD 北大核心 2021年第11期119-126,共8页
利用台特玛湖干涸湖盆区设置的自动气象站观测的2016年6月至2019年11月气象资料,分析计算了台特玛湖干涸湖盆区的地表粗糙度、临界摩阻速度、临界起沙风速等风沙运动相关参数,结果如下:观测期间地表粗糙度平均值为0.346cm,临界摩阻速度... 利用台特玛湖干涸湖盆区设置的自动气象站观测的2016年6月至2019年11月气象资料,分析计算了台特玛湖干涸湖盆区的地表粗糙度、临界摩阻速度、临界起沙风速等风沙运动相关参数,结果如下:观测期间地表粗糙度平均值为0.346cm,临界摩阻速度平均值为0.440m/s, 10m高度临界起沙风速值为8.75m/s。并根据计算出的临界起沙风速值,分析了该区的风蚀起沙状况,研究区风向单一,风速大,风沙流呈"象鼻"效应,2017年最大可能工程输沙量为3.48m^(3)/(m·a),2018年为2.45m^(3)/(m·a)。研究区类似于戈壁的风沙流结构和风沙运动参数值,是该区地表残茬覆盖和土壤质地等因子共同作用的结果。 展开更多
关键词 干涸湖盆区 粗糙度 临界摩阻速度 临界起沙风速 风沙状况
原文传递
考虑动边界影响的低渗透油藏反九点水力压裂注采井网数值模拟研究 被引量:2
10
作者 刘文超 姚军 +2 位作者 陈掌星 孙致学 王建忠 《科学技术与工程》 北大核心 2014年第11期170-175,共6页
考虑低渗透地层中因启动压力梯度存在而产生动边界的影响,利用CMG三维三相黑油油藏数值模拟器对开发低渗透油藏的正方形反九点水力压裂注采井网进行了精确的数值模拟。数值模拟结果表明:相对于达西渗流模式等压面足够光滑、整个油藏区... 考虑低渗透地层中因启动压力梯度存在而产生动边界的影响,利用CMG三维三相黑油油藏数值模拟器对开发低渗透油藏的正方形反九点水力压裂注采井网进行了精确的数值模拟。数值模拟结果表明:相对于达西渗流模式等压面足够光滑、整个油藏区块均参与流动,低渗透油藏启动压力梯度为0.2 MPa/m下的等压面(油藏初始压力)空间分布有较大间断性,在远离注水井和生产井的部分区域仍保持了油藏的初始状态,该区域还未参与到油藏的渗流系统中;地层中存在随时间变化的动边界,会降低油田注水的油藏波及体积和原油采出程度。由饱和度的三维空间分布图可以看出:达西渗流模式下的压裂注水效果较好,油水分布比较集中,界面清晰,更接近于活塞式水驱油;而启动压力梯度的存在会使压裂注水井驱油效果变差,油水存在较大的油水混合渗流区域,油水分布比较分散,属于典型的非活塞式水驱油。由绘制的油田开发特征曲线可以得出:启动压力梯度越大,累计产油量越小,累计产油量随时间上升越慢,生产井含水上升越快,日产油量越低;启动压力梯度对低渗透油藏压裂注水开发效果影响显著。 展开更多
关键词 启动压力梯度 动边界 油藏数值模拟 反九点井网 水力压裂
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部