期刊文献+
共找到87篇文章
< 1 2 5 >
每页显示 20 50 100
基于大数据的跨境电商平台供应商信用评估研究 被引量:39
1
作者 荣飞琼 郭梦飞 《统计与信息论坛》 CSSCI 北大核心 2018年第3期100-107,共8页
跨境电商平台要实现其质量担保功能,必须对供应商进行有效信用评估。结合跨境电商交易模式及平台供应商的特点,充分考虑供应商信用评估数据的来源和处理方法,构建基于大数据的跨境电商平台供应商信用评价指标体系和基于BP神经网络的信... 跨境电商平台要实现其质量担保功能,必须对供应商进行有效信用评估。结合跨境电商交易模式及平台供应商的特点,充分考虑供应商信用评估数据的来源和处理方法,构建基于大数据的跨境电商平台供应商信用评价指标体系和基于BP神经网络的信用评估模型,并进行实证研究;在数据集基础上采用机器学习K-折交叉验证和混淆矩阵对模型进行评估,证明该模型具有较好的泛化能力和准确度。应用基于大数据的跨境电商平台供应商信用评估指标体系及评估模型,有助于实现跨境电商平台的质量担保功能,减少平台交易中出现的信息不对称问题。 展开更多
关键词 跨境电商 信用评估 大数据 BP神经网络 k-折交叉验证
下载PDF
一种确定径向基核函数参数的方法 被引量:28
2
作者 李晓宇 张新峰 沈兰荪 《电子学报》 EI CAS CSCD 北大核心 2005年第B12期2459-2463,共5页
径向基核函数在支撑向量机中应用最广,其参数取值直接影响着SVM分类器的性能.目前核函数参数选择广泛采用k-遍交叉验证法,该方法计算精度较高,但计算量很大.本文从径向基核函数构造的Gram矩阵的意义出发,定义了理想核函数所对应的... 径向基核函数在支撑向量机中应用最广,其参数取值直接影响着SVM分类器的性能.目前核函数参数选择广泛采用k-遍交叉验证法,该方法计算精度较高,但计算量很大.本文从径向基核函数构造的Gram矩阵的意义出发,定义了理想核函数所对应的Gram矩阵,并采用基于距离测度的方法确定其参数.通过对标准数据集进行实验表明,该方法计算精度与k-遍交叉验证法相当,而且计算量可以明显减少.为了进一步验证该方法的有效性,本文将其应用于中医舌色、苔色样本进行实验,实验结果也是令人满意的. 展开更多
关键词 支撑向量机 核函数 k-遍交叉验证法 矩阵相似性度量
下载PDF
基于改进随机森林模型的海底管道腐蚀预测 被引量:15
3
作者 张新生 蔡宝泉 《中国安全科学学报》 CAS CSCD 北大核心 2021年第8期69-74,共6页
为提高海底管道腐蚀速率预测精度,建立一种基于改进随机森林的海底管道腐蚀预测模型。首先,采用斯皮尔曼相关系数,分析实海挂片腐蚀数据的相关性,并采用因子分析降维;然后,设定K值为5的K折交叉验证,建立随机森林回归(RFR)模型,并输入降... 为提高海底管道腐蚀速率预测精度,建立一种基于改进随机森林的海底管道腐蚀预测模型。首先,采用斯皮尔曼相关系数,分析实海挂片腐蚀数据的相关性,并采用因子分析降维;然后,设定K值为5的K折交叉验证,建立随机森林回归(RFR)模型,并输入降维后的数据;最后,输出模型的交叉验证得分,并对比评价该模型与其他模型的最高得分预测结果。研究结果表明:改进RFR的五折交叉验证输出平均得分值为0.912,高于BP神经网络(BPNN)模型、支持向量回归(SVR)模型2种对比模型;五折交叉验证最高得分预测结果均方根误差(RMSE)、平均绝对误差(MAE)分别为1.441和1.3,均优于对比模型相应值。 展开更多
关键词 海底管道 腐蚀预测 随机森林回归(RFR)模型 斯皮尔曼相关系数 因子分析 k折交叉验证
下载PDF
基于多异学习器融合Stacking集成学习的窃电检测 被引量:12
4
作者 游文霞 李清清 +3 位作者 杨楠 申坤 李文武 吴泽黎 《电力系统自动化》 EI CSCD 北大核心 2022年第24期178-186,共9页
针对窃电检测中用户用电数据类别不平衡、采用投票法作为结合策略的集成学习方法无法充分发挥多个不同学习器优势等问题,提出一种利用Stacking集成学习融合多异学习器的模型应用于窃电检测。首先,从影响电量计量的因素出发,根据常见的5... 针对窃电检测中用户用电数据类别不平衡、采用投票法作为结合策略的集成学习方法无法充分发挥多个不同学习器优势等问题,提出一种利用Stacking集成学习融合多异学习器的模型应用于窃电检测。首先,从影响电量计量的因素出发,根据常见的5种窃电方法模拟6种窃电行为模式;其次,采用合成少数类过采样技术(SMOTE)对不平衡的用电数据进行处理,并利用K折交叉验证法对平衡后的训练集进行划分以缓解因重复学习造成的过拟合;然后,使用评价指标和多样性度量优选模型的不同初级学习器和元学习器,构建融合不同学习器优势和差异的Stacking集成学习窃电检测模型;最后,算例对比分析结果表明所提窃电检测模型能有效解决用电数据类别不平衡,充分发挥不同学习器的优势,评价指标良好。 展开更多
关键词 Stacking结合策略 集成学习 窃电检测 合成少数类过采样技术 k折交叉验证
下载PDF
基于K折交叉验证Beta分布的AUC度量的置信区间 被引量:12
5
作者 王钰 赵晓艳 +1 位作者 杨杏丽 李济洪 《系统科学与数学》 CSCD 北大核心 2020年第9期1564-1577,共14页
在统计机器学习研究中,基于K折交叉验证的AUC(Area Under ROC Curve)度量常常被用作分类算法性能的评价.然而,点估计显然没有考虑方差的信息,为此,基于正态假定的K折交叉验证t分布构造的AUC度量的通用对称置信区间(区间估计)被提出.但是... 在统计机器学习研究中,基于K折交叉验证的AUC(Area Under ROC Curve)度量常常被用作分类算法性能的评价.然而,点估计显然没有考虑方差的信息,为此,基于正态假定的K折交叉验证t分布构造的AUC度量的通用对称置信区间(区间估计)被提出.但是,这些对称置信区间往往表现出低的置信度或长的区间长度,从而容易导致激进的(liberal)统计推断结果.通过对AUC度量的理论分析,发现AUC度量的真实分布实际上是非对称的,此时简单使用对称分布去近似它显然是不合适的.因此,针对二类分类问题,本文提出了一种新的基于K折交叉验证Beta分布的AUC度量的非对称置信区间,在模拟和真实数据实验上验证了提出的置信区间相对于传统的基于K折交叉验证t分布的对称置信区间的优越性. 展开更多
关键词 AUC度量 置信区间 BETA分布 k折交叉验证
原文传递
EWT与GS-SVM在断路器机械故障诊断中的应用 被引量:10
6
作者 李兵 刘明亮 杨平 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2018年第8期1422-1430,共9页
针对高压断路器故障诊断中振动信号识别的难点,提出了经验小波变换与支持向量机相结合的故障诊断方法,并在k折交叉验证(k-fold cross-validation,k-CV)思想下采用网格搜索寻找SVM分类器的最优内部参数。首先通过EWT将原始多分量振动信... 针对高压断路器故障诊断中振动信号识别的难点,提出了经验小波变换与支持向量机相结合的故障诊断方法,并在k折交叉验证(k-fold cross-validation,k-CV)思想下采用网格搜索寻找SVM分类器的最优内部参数。首先通过EWT将原始多分量振动信号分解得到一组单分量的固有模态函数(intrinsic modal functions,IMF),然后结合希尔伯特变换与信息熵理论计算信号的特征熵向量,最后在训练集上利用GS与k-CV得到最佳SVM分类器,并用测试集评价该分类器,测试集识别率达100%。实验表明,相对于EWT-PSO-SVM、EMD-GS-SVM故障诊断模型,在小样本数据下EWT-GS-SVM具有模型健壮、识别率高、收敛速度快的综合性能。 展开更多
关键词 经验小波变换 支持向量机 网格搜索 k折交叉验证 粒子群优化 故障诊断
下载PDF
基于异质聚类与Stacking的双集成光伏发电功率预测 被引量:6
7
作者 武新章 王泽宇 +3 位作者 代伟 赵子巍 郭苏杭 张冬冬 《电网技术》 EI CSCD 北大核心 2023年第1期275-283,共9页
光伏功率预测是实现能源优化分配与电网稳定运行的关键基础。然而传统方法中数据预处理不精细以及预测算法对数据挖掘不到位的问题,往往致使准确率不足。针对上述问题,该文提出基于聚类集成和预测集成的双集成光伏功率预测方法,以异质... 光伏功率预测是实现能源优化分配与电网稳定运行的关键基础。然而传统方法中数据预处理不精细以及预测算法对数据挖掘不到位的问题,往往致使准确率不足。针对上述问题,该文提出基于聚类集成和预测集成的双集成光伏功率预测方法,以异质集成的方式提升了气象分类和功率预测的精度。首先,基于重标记法和投影法,构建了融合Kmeans、高斯混合模型(gaussian mixture model, GMM)、AGNES(agglomerative nesting)和BIRCH(balanced iterative reducing and clustering using hierarchies)4种异质算法的聚类集成框架,并依据滑动时间窗口筛选离群日,建立典型气象模型。其次,基于Stacking集成学习框架,在采用k折交叉验证法规避过拟合的基础上,构建由门控循环单元(gated recurrent unit,GRU)、随机森林(random forest,RF)、XGBoost和Light GBM组成的预测集成模型,深度挖掘光伏数据的潜在规律。最后以澳大利亚某光伏电站为例进行仿真,结果表明双集成功率预测的准确性比传统模型有较大提升,证明了聚类集成和预测集成的有效性。 展开更多
关键词 光伏功率预测 聚类集成 异质集成 STACkING k折交叉验证法
下载PDF
差分拉曼光谱结合支持向量机模型对便签纸的鉴别分析 被引量:8
8
作者 刘津彤 张岚泽 +3 位作者 姜红 陈相全 段斌 刘峰 《化学通报》 CAS CSCD 北大核心 2022年第2期259-263,246,共6页
基于差分拉曼光谱技术与支持向量机(SVM)模型,提出了一种对便签纸类检材的快速可视化鉴别方法。实验获取了40组不同品牌便签纸样本的差分拉曼光谱数据,利用BP神经网络和差分技术完成谱图的除噪与基线校正后,借助F检验与主成分分析提取... 基于差分拉曼光谱技术与支持向量机(SVM)模型,提出了一种对便签纸类检材的快速可视化鉴别方法。实验获取了40组不同品牌便签纸样本的差分拉曼光谱数据,利用BP神经网络和差分技术完成谱图的除噪与基线校正后,借助F检验与主成分分析提取谱段信息,构建出SVM分类模型。实验结果表明,当设置Linear为SVM模型的核函数时,可以实现对样本测试集的完全准确划分,K折交叉验证的结果理想。相比于传统聚类分析手段,本方法可以在原始高维光谱数据中筛选出有效特征矩阵,且SVM模型兼具高效性和准确性,为公安实践中纸张类物证的区分鉴别提供一种新思路。 展开更多
关键词 差分拉曼光谱 支持向量机 便签纸 F检验 k折交叉验证
原文传递
基于交叉验证的集成学习误差分析 被引量:3
9
作者 路佳佳 《计算机系统应用》 2023年第1期302-309,共8页
目前关于集成学习的泛化性能的研究已取得很大成功,但是关于集成学习的误差分析还需要进一步研究.考虑交叉验证在统计机器学习中对于模型性能评估有重要应用,为此,应用组块3×2交叉验证和k折交叉验证方法为每个样本点进行赋予权重... 目前关于集成学习的泛化性能的研究已取得很大成功,但是关于集成学习的误差分析还需要进一步研究.考虑交叉验证在统计机器学习中对于模型性能评估有重要应用,为此,应用组块3×2交叉验证和k折交叉验证方法为每个样本点进行赋予权重的预测值的集成,并进行误差分析.在模拟数据和真实数据上进行实验,结果表明基于组块3×2交叉验证的集成学习预测误差小于单个学习器的预测误差,并且集成学习的方差比单个学习器方差小.与基于k折交叉验证的集成学习方法相比,基于组块3×2交叉验证的泛化误差小于基于k折交叉验证的泛化误差,说明基于组块3×2交叉验证的集成学习模型稳定性好. 展开更多
关键词 k折交叉验证 组块3×2交叉验证 集成学习 回归算法 模拟实验 预测模型
下载PDF
北京油松人工林竞争指数的适用性评价 被引量:7
10
作者 李超 裴顺祥 +2 位作者 张连金 郭嘉 辛学兵 《浙江农林大学学报》 CAS CSCD 北大核心 2019年第6期1115-1124,共10页
为筛选北京油松Pinus tabulaeformis人工林的最适竞争指数,获取油松人工林科学经营管理的依据和理论支撑,以九龙山油松人工林内的1 054株油松对象木及4 216株竞争木为研究对象,通过Hegyi竞争指数、Bella竞争指数(CIOi)及基于交角的林木... 为筛选北京油松Pinus tabulaeformis人工林的最适竞争指数,获取油松人工林科学经营管理的依据和理论支撑,以九龙山油松人工林内的1 054株油松对象木及4 216株竞争木为研究对象,通过Hegyi竞争指数、Bella竞争指数(CIOi)及基于交角的林木竞争指数(d_α_CIi)进行生物量回归分析和k折交叉验证,筛选并分析油松人工林的最适竞争指数。结果显示:油松的径级分布呈略正偏的正态分布,88.24%的个体分布在10~25 cm径级内;油松生物量与d_α_CIi,Hegyi竞争指数服从幂函数关系,CIOi服从指数函数关系。d_α_CIi与油松生物量的决定系数(R2)、10次10折交叉验证R2值均最高,R2损失量最小,量化效果最好;Hegyi竞争指数次之,CIOi最差,说明d_α_CIi是量化北京典型油松人工林竞争强度的最佳指标。林木竞争受数量、大小和物种共同影响。随着油松对象木胸径的增大,竞争指数逐渐减小,其上方遮盖所占竞争指数比例也逐渐降低,甚至没有。当油松胸径不小于20 cm时(约总体前1/4),随径级增大其竞争指数变化不显著;据此对油松胸径小于20 cm的个体进行合理抚育间伐,能改善油松林结构。油松所受竞争主要来自种内,占总竞争强度的93.64%,种内竞争木数量、竞争强度随径级呈先增大后减小的趋势,而种间竞争木数量、竞争强度随径级总体上呈先减小后增大趋势,表明种内竞争大于种间及两者间的垂直空间分离是物种共存的重要条件。 展开更多
关键词 森林经理学 竞争指数 筛选 k折交叉检验 油松
下载PDF
基于DnCNN 的侵彻过载时频去噪方法
11
作者 郑宏亮 贾森清 +4 位作者 郭宇朋 薛颖杰 韩晶 赵河明 石志刚 《装备环境工程》 CAS 2024年第8期17-24,共8页
目的提高从侵彻过载中准确估计刚体过载信号的能力。方法提出一种基于前馈去噪卷积神经网络(DnCNN)的侵彻过载时频去噪方法,该方法首先应用短时傅里叶变换(STFT)提取侵彻过载信号的时频图像,使DnCNN能够充分利用时频图像信息,估计出刚... 目的提高从侵彻过载中准确估计刚体过载信号的能力。方法提出一种基于前馈去噪卷积神经网络(DnCNN)的侵彻过载时频去噪方法,该方法首先应用短时傅里叶变换(STFT)提取侵彻过载信号的时频图像,使DnCNN能够充分利用时频图像信息,估计出刚体过载时频图像。最后,通过逆STFT将时频图像转换回时域,得到估计的刚体过载信号。结果在5-Fold交叉验证中,所提方法在测试集上的平均绝对误差(MAE)为0.968%,Pearson相关系数(r)为90.35%。与低通滤波、总体经验模态分解(EEMD)和小波变换方法相比,所提方法的平均MAE分别降低了1.82%、1.00%、0.75%,平均相关系数r值分别提高了47.81%、17.48%、22.93%。结论所提方法可以从侵彻过载中准确估计出刚体过载信号,在去噪能力上优于低通滤波、EEMD和小波变换方法,且在去噪过程中,无需调整参数,能够自动完成去噪任务。 展开更多
关键词 硬目标侵彻 侵彻过载 前馈去噪卷积神经网络 信号去噪 时频分析 k-fold交叉验证
下载PDF
基于时频域融合和ECA-1DCNN的航空串联故障电弧检测
12
作者 闫锋 苏忠允 《科学技术与工程》 北大核心 2024年第5期1937-1945,共9页
为了快速准确地检测航空交流线路中出现的串联故障电弧,提出了一种基于时频域融合和加入高效注意力机制(efficient channel attention, ECA)的一维卷积神经网络(one-dimensional convolutional neural network, 1DCNN)的故障检测算法。... 为了快速准确地检测航空交流线路中出现的串联故障电弧,提出了一种基于时频域融合和加入高效注意力机制(efficient channel attention, ECA)的一维卷积神经网络(one-dimensional convolutional neural network, 1DCNN)的故障检测算法。首先,搭建航空交流电弧故障实验平台,负载选择多类型、多参数值进行电流信号的采集;其次,为了保留更多的故障信息,分析其特征频段,经过大量数据验证,航空串联电弧在发生时,1 000~4 000 Hz分量具有一定的占比,因此将原始信号与特征频段进行融合,融合后的一维数据作为模型输入;最后,搭建ECA-1DCNN检测模型,进行训练,并通过K折交叉验证模型的有效性,得到测试集平均准确率为97.96%。该方法网络层数较少,计算快速,避免了复杂时频域计算过程,较为智能,对航空串联电弧检测装置的研究提供了理论参考。 展开更多
关键词 串联电弧 高效注意力机制 特征频段 一维卷积神经网络 k折交叉验证
下载PDF
基于真实世界数据研究注射用伏立康唑致急性肾损伤的危险因素建立预测模型及验证
13
作者 王书波 焦婷婷 +2 位作者 董洪亮 王百聆 李辉 《中国药物警戒》 2024年第5期567-571,579,共6页
目的 基于真实世界数据,分析注射用伏立康唑发生急性肾损伤(AKI)的危险因素,建立预测模型并进行内部验证和外部验证,为临床安全用药提供参考。方法 收集2020年1月1日至2023年6月30日在某院注射用伏立康唑治疗≥3 d,且年龄≥18岁患者的... 目的 基于真实世界数据,分析注射用伏立康唑发生急性肾损伤(AKI)的危险因素,建立预测模型并进行内部验证和外部验证,为临床安全用药提供参考。方法 收集2020年1月1日至2023年6月30日在某院注射用伏立康唑治疗≥3 d,且年龄≥18岁患者的病历资料。其中2023年1月1日之前出院的患者作为建模组,之后的患者作为验证组。提取患者的基本信息、实验检查指标、临床诊断、联合用药等数据。根据是否发生AKI将患者分为AKI组和非AKI组。采用多因素Logistic回归法分析注射用伏立康唑致AKI的危险因素,并建立预测模型。通过受试者工作特征(ROC)、ROC曲线下面积(AUC)及Hosmer-Lemeshow检验(H-L检验)评估区分度和校准度,并进行内部验证和外部数据验证检验该模型的价值。结果 共625例(男性371例,女性254例)患者纳入研究。其中建模组489例(男性296例,女性193例),发生AKI 87例;验证组136例(男性75例,女性61例),发生AKI 32例。建模组多因素Logistic回归分析显示血流感染、肾脏疾病、心血管疾病、使用利尿剂是发生AKI危险因素,肌酐清除率(CrCl)和血清白蛋白(Alb)是保护因素。用上述影响因素建立Logistic回归方程,经变换后得到预测因子Y=0.735X_(1)+0.707X_(2)+0.701X_(3)+0.683X_(4)-0.062 X_(5)-0.008X_(6)。X_(1)~X_(6)分别表示使用利尿剂、心血管疾病、肾脏疾病、血流感染、Alb、CrCl。经ROC曲线分析验证,模型组AUC为0.750(95%CI:0.692~0.808,P<0.0 01),H-L检验χ^(2)值为7.535,P=0.480;验证组AUC为0.821(95%CI:0.749~0.893,P<0.001),H-L检验χ^(2)值为13.924,P=0.084,提示该模型具有较好的区分度。模型的约登指数最大值为0.389,对应ROC曲线切点最佳值为-0.976,敏感度为56.3%,特异度为82.6%。k折交叉验证提示该模型的准确率较好(Accuracy=0.823),一致性较低(Kappa=0.191)。结论 CrCl、Alb、血流感染、肾脏疾病、心血管疾病、利尿剂是注射用伏立康唑发生AKI 展开更多
关键词 伏立康唑 注射用 急性肾损伤 危险因素 真实世界数据 LOGISTIC回归 k折交叉验证 预测模型
下载PDF
基于RF-SA-SDCNN的涡扇发动机剩余寿命预测
14
作者 肖亮 曾云 《农业装备与车辆工程》 2024年第3期153-158,共6页
针对涡扇发动机现阶段预测精确度低的问题,提出了一种基于RF-SA-SDCNN相融合的涡扇发动机剩余寿命预测方法。首先,将多传感器长序列数据进行指数平滑和归一化处理,以减少由于量纲、取值范围不同和噪声波动引起的误差,并利用随机森林算... 针对涡扇发动机现阶段预测精确度低的问题,提出了一种基于RF-SA-SDCNN相融合的涡扇发动机剩余寿命预测方法。首先,将多传感器长序列数据进行指数平滑和归一化处理,以减少由于量纲、取值范围不同和噪声波动引起的误差,并利用随机森林算法对多元传感器信号进行重要性特征提取;然后,搭建基于随机森林算法和自注意机制与堆叠膨胀卷积神经网络相结合的预测模型,自注意机制通过对特征赋予不同权重分配加强贡献度,堆叠膨胀卷积通过扩大模型感受野提取时序特征用于回归分析,并利用GridSearch优化算法和StratifiedKFold交叉验证方法优化模型提升模型预测精度;最后,采用CMAPSS数据集验证验证所提方法的有效性。结果表明,所提方法可有效提高涡扇发动机剩余寿命预测精度。 展开更多
关键词 随机森林算法 自注意机制 堆叠神经网络 GridSearch k折交叉验证 指数平滑
下载PDF
基于机器学习技术的返乡发展人群预测模型研究与应用
15
作者 杜昭 谢国城 +1 位作者 陈静旋 张伟斌 《电信科学》 北大核心 2024年第5期131-140,共10页
随着经济的发展和一线城市生活压力的增大,越来越多的人迁移城市以及返回家乡发展,为了高效服务用户和提升用户产品使用体验,提出基于LightGBM、CatBoost等算法来预测返乡发展人群,并进行了异构模型融合。通过模型对比,所提融合模型有... 随着经济的发展和一线城市生活压力的增大,越来越多的人迁移城市以及返回家乡发展,为了高效服务用户和提升用户产品使用体验,提出基于LightGBM、CatBoost等算法来预测返乡发展人群,并进行了异构模型融合。通过模型对比,所提融合模型有更好的效果,可以为服务和产品提供依据,减少流失优化感知,提高市场保有率。 展开更多
关键词 LightGBM 特征工程 kNN k折交叉验证
下载PDF
基于正则化KL距离的交叉验证折数K的选择 被引量:5
16
作者 褚荣燕 王钰 +1 位作者 杨杏丽 李济洪 《计算机技术与发展》 2021年第3期52-57,共6页
在机器学习中,K折交叉验证方法常常通过把数据分成多个训练集和测试集来进行模型评估与选择,然而其折数K的选择一直是一个公开的问题。注意到上述交叉验证数据划分的一个前提假定是训练集和测试集的分布一致,但是实际数据划分中,往往不... 在机器学习中,K折交叉验证方法常常通过把数据分成多个训练集和测试集来进行模型评估与选择,然而其折数K的选择一直是一个公开的问题。注意到上述交叉验证数据划分的一个前提假定是训练集和测试集的分布一致,但是实际数据划分中,往往不是这样。因此,可以通过度量训练集和测试集的分布一致性来进行K折交叉验证折数K的选择。直观地,KL(Kullback-Leibler)距离是一种合适的度量方法,因为它度量了两个分布之间的差异。然而直接基于KL距离进行K的选择时,从多个数据实验结果发现随着K的增加KL距离也在增大,显然这是不合适的。为此,提出了一种基于正则化KL距离的K折交叉验证折数K的选择准则,通过最小化此正则KL距离来选择合适的折数K。进一步多个真实数据实验验证了提出准则的有效性和合理性。 展开更多
关键词 k折交叉验证 折数k的选择 kL(kullback-Leibler)距离 正则化 机器学习
下载PDF
基于粒子群优化算法的LightGBM超短期负荷预测研究 被引量:5
17
作者 周彬彬 蒋燕 +2 位作者 赵珍玉 段睿钦 刘力铭 《能源与节能》 2021年第2期2-6,共5页
针对当前超短期负荷预测模型的不足,提出了一种基于粒子群优化算法的LightGBM超短期负荷预测模型,实现了LightGBM模型参数的自适应调整,可针对不同时空下负荷的规律特点调整模型参数,提高了模型的可推广性。仿真结果表明,提出的模型能... 针对当前超短期负荷预测模型的不足,提出了一种基于粒子群优化算法的LightGBM超短期负荷预测模型,实现了LightGBM模型参数的自适应调整,可针对不同时空下负荷的规律特点调整模型参数,提高了模型的可推广性。仿真结果表明,提出的模型能有效提高负荷预测的准确度。 展开更多
关键词 粒子群优化算法 LightGBM k-fold交叉验证 超短期负荷预测
下载PDF
基于深度学习神经网络方法的中国大陆地震伤亡预测模型 被引量:4
18
作者 朱鹏宇 程佳 杜龙 《中国地震》 北大核心 2022年第4期651-661,共11页
对地震伤亡人口的预测需要同时考虑地震破裂特征本身、灾区人口及其生活环境等特征,其是一个典型的复杂预测系统。本文基于深度学习神经网络方法和1976—2020年间78次地震伤亡事件,构建了中国大陆地震伤亡预测模型,综合使用发震年代、... 对地震伤亡人口的预测需要同时考虑地震破裂特征本身、灾区人口及其生活环境等特征,其是一个典型的复杂预测系统。本文基于深度学习神经网络方法和1976—2020年间78次地震伤亡事件,构建了中国大陆地震伤亡预测模型,综合使用发震年代、发震时刻、发震季节、Ⅵ度及以上区域受灾面积、Ⅵ度及以上区域受灾人口数、震源深度、极震区烈度和震源机制类型等8个参数,对包括2008年汶川8.0级和2010年玉树7.1级地震在内的9次地震事件进行了预测检验。结果显示,该预测模型能够较好地反映出中小地震的伤亡人口特征,除汶川地震和玉树地震外的7次地震伤亡事件预测值与实际值误差均在一个数量级上,对于2008年汶川8.0级和2010年玉树7.1级地震,预测值明显小于实际伤亡人口;其中玉树地震发震断层位于玉树州府结古镇之下,造成了相对较多的人口伤亡数量;汶川地震的伤亡人口数量不仅由地震直接导致,还包括了地震滑坡等次生灾害引起的伤亡数量。 展开更多
关键词 深度学习神经网络 k折交叉验证 地震人口伤亡 极震区烈度
下载PDF
基于影像组学的肺癌分型预测 被引量:5
19
作者 梁伟 赵艳秋 +1 位作者 桂东奇 丁小凤 《解剖学报》 CAS CSCD 北大核心 2019年第4期495-500,共6页
目的基于影像组学特征对肺癌中的两大亚型分类(小细胞肺癌与非小细胞肺癌)进行分型预测。方法在131名小细胞肺癌与非小细胞肺癌患者中(其中训练集包含119人,测试集中包含12人),从手动分割的病灶区域提取107维组学特征,使用R统计学软件中... 目的基于影像组学特征对肺癌中的两大亚型分类(小细胞肺癌与非小细胞肺癌)进行分型预测。方法在131名小细胞肺癌与非小细胞肺癌患者中(其中训练集包含119人,测试集中包含12人),从手动分割的病灶区域提取107维组学特征,使用R统计学软件中的FSelector包对影像组学特征进行关键特征筛选,构建支持向量机模型和k折交叉验证模型对肺癌患者的病理进行表型分类和验证,通过绘制受试者工作特征曲线(ROC曲线)图和计算曲线下面积(AUC)数值来对训练集和测试集中的肺癌分型预测效果进行评估。结果挑选出20个主要的影像组学特征用于小细胞肺癌与非小细胞肺癌的分型鉴别,这些特征对于训练集和测试集中的小细胞肺癌与非小细胞肺癌均有较好的区分能力。在测试集中,预肺癌亚型分类的准确率为75%,组学特征的AUC结果为0. 69。结论通过构建独特的影像组学特征,以用作区分小细胞肺癌与非小细胞肺癌的诊断因素。这对实现非侵入性的肺癌病理有效分型预测,指导肺癌患者后续治疗方案的选择具有重要指导意义。 展开更多
关键词 影像组学 肺癌 支持向量机 k折交叉验证 分型预测
下载PDF
基于Bagging-SVM的股票趋势预测技术 被引量:5
20
作者 陈亚男 薛雷 《电子测量技术》 2019年第14期58-62,共5页
为了更准确地预测股价趋势,为股民提供股票投资指南,在传统的支持向量机模型的基础上融入了Bagging思想,提出了一种股票价格趋势的预测方法。具体讲,就是从原始训练集中利用Bootstrap方法随机子抽样出若干个子训练集,再利用每一个子训... 为了更准确地预测股价趋势,为股民提供股票投资指南,在传统的支持向量机模型的基础上融入了Bagging思想,提出了一种股票价格趋势的预测方法。具体讲,就是从原始训练集中利用Bootstrap方法随机子抽样出若干个子训练集,再利用每一个子训练集训练出各自的子SVM模型,然后在测试阶段每一个子SVM模型会给出一个预测股票涨跌的趋势,最后用投票法统计出票数最多的一个作为最终预测结果。实验数据为近3年的工商银行股票指数。实验结果表明,基于Bagging-SVM股票趋势预测模型比直接用SVM模型的性能更好,在项目和工程应用上具有一定的实用价值。 展开更多
关键词 股票趋势 Bagging-SVM模型 k折交叉验证法 BOOTSTRAP
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部