期刊文献+
共找到203篇文章
< 1 2 11 >
每页显示 20 50 100
基于交叉验证的BP算法的改进与实现 被引量:28
1
作者 韩萌 丁剑 《计算机工程与设计》 CSCD 北大核心 2008年第14期3738-3739,3742,共3页
针对BP算法存在的收敛速度慢等问题提出改进方案,修改其相关参数并且提出如何选择合适的隐藏层节点个数。同时针对学习样本数据的有限性、BP算法易陷入局部最小值和容易出现过拟合等问题进行了研究,提出了采用多重交叉验证的再改进BP算... 针对BP算法存在的收敛速度慢等问题提出改进方案,修改其相关参数并且提出如何选择合适的隐藏层节点个数。同时针对学习样本数据的有限性、BP算法易陷入局部最小值和容易出现过拟合等问题进行了研究,提出了采用多重交叉验证的再改进BP算法。仿真结果表明,交叉验证BP算法提高了网络学习的效率。 展开更多
关键词 神经网络 BP算法 交叉验证 过拟合 隐藏层 误差函数
下载PDF
改进的GA-BP神经网络在矿井突水水源判别中的应用 被引量:30
2
作者 李垣志 牛国庆 刘慧玲 《中国安全生产科学技术》 CAS CSCD 北大核心 2016年第7期77-81,共5页
矿井突水水源的判别是制定防治水措施的重要环节。通过对某矿含水层水化学特性的相关性分析,将PCA算法、K折交叉验证算法嵌入GA-BP神经网络,提出了一种新的GA-BP神经网络,将其应用于实例分析中,并与传统的方法进行比较。结果表明:针对... 矿井突水水源的判别是制定防治水措施的重要环节。通过对某矿含水层水化学特性的相关性分析,将PCA算法、K折交叉验证算法嵌入GA-BP神经网络,提出了一种新的GA-BP神经网络,将其应用于实例分析中,并与传统的方法进行比较。结果表明:针对水化学特性相近的含水层,PCA算法能够排除样本中的冗余信息,降低样本指标维度,简化BP神经网络结构;K折交叉验证算法能够提高GA算法对BP神经网络权值的寻优质量,使GA算法的进化方向更具合理性;二者的引入大大优化了传统GA-BP神经网络性能,其判别精度更高、适用性更强、结果更可靠,在矿井突水水源判别方面具有很好的应用前景。 展开更多
关键词 突水水源判别 GA-BP PCA算法 交叉验证
下载PDF
基于Stacking融合的短期风速预测组合模型 被引量:28
3
作者 李永刚 王月 +1 位作者 刘丰瑞 吴滨源 《电网技术》 EI CSCD 北大核心 2020年第8期2875-2882,共8页
大规模风电并网时,准确的风速预测对电网稳定运行具有重要意义。为提高风速预测精度及预测模型泛化能力,提出基于改进Stacking算法的风速组合预测模型。首先建立基于不同核函数的核岭回归模型;然后利用改进的萤火虫算法对模型关键参数... 大规模风电并网时,准确的风速预测对电网稳定运行具有重要意义。为提高风速预测精度及预测模型泛化能力,提出基于改进Stacking算法的风速组合预测模型。首先建立基于不同核函数的核岭回归模型;然后利用改进的萤火虫算法对模型关键参数进行选取,通过引入自适应参数、全局搜索及Levy飞行提高算法的全局搜索能力及收敛速度;最后通过Stacking算法将相互独立的各模型进行融合,以增强模型泛化性,并采用交叉验证进一步提高预测精度。选择不同风场、不同季节的实测数据对所提模型的预测效果进行仿真,通过对比分析验证了所提模型的预测精度和泛化能力。 展开更多
关键词 风速预测 核岭回归 改进萤火虫算法 Stacking算法 交叉验证
下载PDF
基于参数优化AdaBoost算法的酸性火山岩岩性分类 被引量:28
4
作者 杨笑 王志章 +4 位作者 周子勇 魏周城 曲康 王翔宇 王如意 《石油学报》 EI CAS CSCD 北大核心 2019年第4期457-467,共11页
岩性识别是火山岩油气藏勘探的基础,为提高长岭气田火山岩岩性识别的准确率,采用决策树、支持向量机、逻辑回归、AdaBoost-决策树、AdaBoost-支持向量机和AdaBoost-逻辑回归6种算法,对研究区酸性火山岩岩性进行分类与识别。通过分析研... 岩性识别是火山岩油气藏勘探的基础,为提高长岭气田火山岩岩性识别的准确率,采用决策树、支持向量机、逻辑回归、AdaBoost-决策树、AdaBoost-支持向量机和AdaBoost-逻辑回归6种算法,对研究区酸性火山岩岩性进行分类与识别。通过分析研究区火山岩不同岩性的测井响应特征,选取了对火山岩岩性、组构和孔隙结构反应灵敏的12种岩石物理测井参数作为分类特征量。选择3口井中岩心分析和岩矿录井资料完整的7 150个测井数据作为数据集,并从中随机选取70%的数据作为训练集建立岩性识别模型,剩余30%的数据作为测试集。对6种算法建立的模型通过交叉验证进行参数优化及模型评价,对比不同算法与录井剖面的结果表明,AdaBoost-决策树算法可作为长岭气田利用常规测井资料识别火山岩岩性的有效手段,准确率可达90%以上。 展开更多
关键词 火山岩 岩性识别 集成算法 ADABOOST算法 交叉验证
原文传递
极区海冰密集度AMSR-E数据反演算法的试验与验证 被引量:21
5
作者 苏洁 郝光华 +1 位作者 叶鑫欣 王维波 《遥感学报》 EI CSCD 北大核心 2013年第3期495-513,共19页
海冰密集度是极区海冰监测的重要参数,目前分辨率最高的微波海冰密集度产品为德国Bremen大学发布的针对AMSR-E89GHz频段数据利用ASI算法反演的网格数据。为实现中国极区遥感产品从无到有的战略步骤,本文针对AMSR-E89GHz频段微波数据的AS... 海冰密集度是极区海冰监测的重要参数,目前分辨率最高的微波海冰密集度产品为德国Bremen大学发布的针对AMSR-E89GHz频段数据利用ASI算法反演的网格数据。为实现中国极区遥感产品从无到有的战略步骤,本文针对AMSR-E89GHz频段微波数据的ASI算法,进行了插值算法、系点值和天气滤波器一系列试验。针对北极海区,着重对影响反演结果的主要参数——纯冰和纯水的亮温极化差异阈值,即系点值(P1和P0)进行了2009年全年的统计分析。研究表明,2009年北极纯冰和纯水的代表区域P1和P0年平均值分别为10.0K和46.67K;2K以上的系点值差异引起的海冰密集度差别较为显著;同样的系点值差异在不同极化差异P取值范围对海冰密集度的影响也不同。通过统计确定的系点值推算并修正了海冰密集度反演公式,对2009年全年北极海冰密集度进行了反演,并与Bremen大学产品进行了比较。继而对白令海和楚科奇海12个晴空下MODIS可见光样本数据进行反演,以验证AMSR-E冰密集度反演结果,并对误差原因进行了分析。本研究反演结果与MODIS样本比对的误差略小于Bremen大学的反演产品,空间平均误差为3.84%,空间平均绝对误差10.83%。 展开更多
关键词 AMSR—E 海冰密集度 反演算法 验证 极区
原文传递
Fengyun Meteorological Satellite Products for Earth System Science Applications 被引量:20
6
作者 Di XIAN Peng ZHANG +3 位作者 Ling GAO Ruijing SUN Haizhen ZHANG Xu JIA 《Advances in Atmospheric Sciences》 SCIE CAS CSCD 2021年第8期1267-1284,共18页
Following the progress of satellite data assimilation in the 1990s, the combination of meteorological satellites and numerical models has changed the way scientists understand the earth. With the evolution of numerica... Following the progress of satellite data assimilation in the 1990s, the combination of meteorological satellites and numerical models has changed the way scientists understand the earth. With the evolution of numerical weather prediction models and earth system models, meteorological satellites will play a more important role in earth sciences in the future. As part of the space-based infrastructure, the Fengyun (FY) meteorological satellites have contributed to earth science sustainability studies through an open data policy and stable data quality since the first launch of the FY-1A satellite in 1988. The capability of earth system monitoring was greatly enhanced after the second-generation polar orbiting FY-3 satellites and geostationary orbiting FY-4 satellites were developed. Meanwhile, the quality of the products generated from the FY-3 and FY-4 satellites is comparable to the well-known MODIS products. FY satellite data has been utilized broadly in weather forecasting, climate and climate change investigations, environmental disaster monitoring, etc. This article reviews the instruments mounted on the FY satellites. Sensor-dependent level 1 products (radiance data) and inversion algorithm-dependent level 2 products (geophysical parameters) are introduced. As an example, some typical geophysical parameters, such as wildfires, lightning, vegetation indices, aerosol products, soil moisture, and precipitation estimation have been demonstrated and validated by in-situ observations and other well-known satellite products. To help users access the FY products, a set of data sharing systems has been developed and operated. The newly developed data sharing system based on cloud technology has been illustrated to improve the efficiency of data delivery. 展开更多
关键词 Fengyun meteorological satellite sensor-dependent level 1 product inversion algorithm-dependent level 2 product product validation
下载PDF
一个新的聚类有效性分析指标 被引量:14
7
作者 李双虎 张风海 《计算机工程与设计》 CSCD 北大核心 2007年第8期1772-1774,共3页
聚类分析是无监督分类过程,其目的在于把目标对象划分为一系列有意义的组(或称类),使得每个组中的目标尽量“相似”或“接近”,而不同组的目标尽可能“相异”或“远离”。从而有助于发现目标的分布模式和目标间的相互关系。评估聚类质... 聚类分析是无监督分类过程,其目的在于把目标对象划分为一系列有意义的组(或称类),使得每个组中的目标尽量“相似”或“接近”,而不同组的目标尽可能“相异”或“远离”。从而有助于发现目标的分布模式和目标间的相互关系。评估聚类质量的问题,称为聚类有效性分析。介绍一些典型分类算法,并提出了一种新的聚类有效性分析指标。 展开更多
关键词 数据挖掘 聚类分析 算法 有效性 指标
下载PDF
高分遥感共性产品生成和真实性检验技术体系 被引量:14
8
作者 柳钦火 闻建光 +20 位作者 周翔 赵坚 李增元 李新 马明国 王维真 廖小罕 刘绍民 范闻捷 肖青 仲波 李静 辛晓洲 李丽 贾立 高志海 金家栋 梁师 邢进 廖楚江 吴一戎 《遥感学报》 EI CSCD 北大核心 2023年第3期544-562,共19页
随着高分辨率对地观测系统重大专项的成功实施,GF-1—GF-7七型卫星共19种主要载荷发射升空,形成了中国遥感卫星多谱段、多模式的观测能力,可为各种科研和行业遥感应用提供源源不断的高空间、高时间和高光谱分辨率的高质量遥感数据。如... 随着高分辨率对地观测系统重大专项的成功实施,GF-1—GF-7七型卫星共19种主要载荷发射升空,形成了中国遥感卫星多谱段、多模式的观测能力,可为各种科研和行业遥感应用提供源源不断的高空间、高时间和高光谱分辨率的高质量遥感数据。如何打通高分卫星遥感数据到信息的转换链,降低高分卫星数据应用门槛、提升高分卫星应用服务成效已成为急需破解的迫切问题。遥感定量产品的误差来源包括传感器成像、几何与辐射定标、数据预处理、定量反演与产品检验等各个环节,提高定量遥感产品精度是一个复杂的系统工程,各行业应用部门和多领域用户难以独立完成全流程数据处理、产品生产和检验。本文在分析高分卫星遥感产品体系的基础上,针对多用户共同需求,梳理了7大类共45种共性定量遥感产品;从全链条误差溯源和质量检验需要出发,提出了高分遥感共性产品生成和检验的技术体系,分析了算法测评—算法优化—产品生产—真实性检验等环节面临的关键技术;进而提出了高分遥感共性产品真实性检验平台与产品定型分系统的初步设计方案,并介绍了系统研发的最新进展;最后对高分共性产品应用前景进行了展望,构建高分遥感共性产品生成与真实性检验技术体系,对于保障高分卫星遥感共性产品精度和质量、提升高分卫星应用服务效益具有重要的意义。 展开更多
关键词 高分卫星 遥感反演 遥感共性产品 算法测评 像元真值 真实性检验
原文传递
FY-3C/VIRR海表温度产品及质量检验 被引量:14
9
作者 王素娟 崔鹏 +6 位作者 张鹏 杨忠东 胡秀清 冉茂农 刘健 林曼筠 邱红 《应用气象学报》 CSCD 北大核心 2020年第6期729-739,共11页
国家卫星气象中心FY-3C/VIRR(visibleandinfraredradiometer,可见光红外扫描辐射计)海表温度产品在云检测产品的基础上,采用多通道MCSST(multichannelSST)算法进行晴空区海温反演。该文详细介绍了海表温度产品算法、产品设计、质量控制... 国家卫星气象中心FY-3C/VIRR(visibleandinfraredradiometer,可见光红外扫描辐射计)海表温度产品在云检测产品的基础上,采用多通道MCSST(multichannelSST)算法进行晴空区海温反演。该文详细介绍了海表温度产品算法、产品设计、质量控制及质量检验方法。FY-3C/VIRR海表温度产品包括5min段原始投影海温和5km全球等经纬度投影海温。设计逐像元的海温质量标识,将海温像元分为优、良、差3个等级,用户可根据应用目标选择海温的质量等级。与日最优插值海温OISST(optimuminterpolationSST)相比,FY-3C/VIRR2015年1月—2019年12月的5 min段海温质量检验结果表明:质量等级为优的海温,白天和夜间的偏差分别为-0.18℃和-0.06℃,均方根误差分别为0.85℃和0.8℃;白天海温均方根误差有季节性波动,夏季有的月份均方根误差大于1℃(如2015年7月、2016年7月和2019年7月);在海温回归系数不变的条件下,夜间海温偏差的季节性波动与星上黑体温度相关显著。从一级数据质量、定位、业务运行状况等方面讨论引起海表温度产品异常的原因,为FY-3C/VIRR历史数据定位、定标和产品重处理及用户应用提供重要的参考信息。 展开更多
关键词 FY-3C 海表温度 回归算法 质量控制 质量检验
下载PDF
基于遗传算法优化支持向量回归机参数的供热负荷预测 被引量:14
10
作者 张佼 田琦 王美萍 《暖通空调》 北大核心 2017年第2期104-108,25,共6页
为了进一步提高供热负荷的预测精度,通过分析影响支持向量回归机(SVR)性能表现的参数,提出了基于遗传算法优化的SVR供热负荷预测模型。该方法利用交叉验证思想在模型性能评估和选择方面的优势,结合遗传算法的全局寻优能力,实现了参数的... 为了进一步提高供热负荷的预测精度,通过分析影响支持向量回归机(SVR)性能表现的参数,提出了基于遗传算法优化的SVR供热负荷预测模型。该方法利用交叉验证思想在模型性能评估和选择方面的优势,结合遗传算法的全局寻优能力,实现了参数的自动优选,并用由此得到的最佳模型进行供热负荷预测。应用某热源的实测数据进行了仿真实验,与其他算法的比较表明,该方法相对误差绝对值的平均值为4.33%,比传统SVR降低了10.77%,比小波神经网络降低了5.28%。 展开更多
关键词 遗传算法 支持向量回归机 供热负荷预测 参数优化 交叉验证
下载PDF
基于遗传算法的改进径向基支持向量机及其应用 被引量:8
11
作者 李良敏 温广瑞 王生昌 《系统仿真学报》 EI CAS CSCD 北大核心 2008年第22期6088-6092,6096,共6页
通过对径向基核函数进行分析后发现:根据样本各个特征的识别能力赋予其不同大小的核参数,可以提高支持向量机的推广能力。此结论基础上,提出了一种基于遗传算法的多核参数径向基支持向量机算法,通过遗传算法最小化验证误差,实现了根据... 通过对径向基核函数进行分析后发现:根据样本各个特征的识别能力赋予其不同大小的核参数,可以提高支持向量机的推广能力。此结论基础上,提出了一种基于遗传算法的多核参数径向基支持向量机算法,通过遗传算法最小化验证误差,实现了根据各个特征的识别能力赋予其不同大小的核参数。将该算法用于轴承故障诊断,实验结果表明,与传统支持向量机相比,多核参数径向基支持向量机具有更好的推广能力,同时,核参数的大小反映了对应特征识别能力的大小。 展开更多
关键词 多核参数径向基支持向量机 遗传算法 核参数 验证误差 推广能力 故障诊断
下载PDF
基于Trie树的词语左右熵和互信息新词发现算法 被引量:12
12
作者 郭理 张恒旭 +1 位作者 王嘉岐 秦怀斌 《现代电子技术》 北大核心 2020年第6期65-69,共5页
由于大量新词的出现,使得中文文本分析产生了较大的困难,因此新词发现成为目前中文自然语言处理中的热点和难点问题。为此,文中提出了一种基于Trie树的词语左右熵和互信息新词发现算法。先根据成词规则,筛选掉文本中的停用词和非中文字... 由于大量新词的出现,使得中文文本分析产生了较大的困难,因此新词发现成为目前中文自然语言处理中的热点和难点问题。为此,文中提出了一种基于Trie树的词语左右熵和互信息新词发现算法。先根据成词规则,筛选掉文本中的停用词和非中文字符,将每个字与其右邻的字组成二元组;然后利用左右信息熵和互信息进行成词概率的计算,根据计算到的成词概率和词频筛选出新词;并且设计了三个实验,验证了算法的有效性和可行性。实验结果表明,该新词发现算法成词准确率较高,比其他新词发现算法时间效率有较大的提高,对于中文分词结果的优化起到重要的作用。 展开更多
关键词 新词发现算法 左右熵 互信息 TRIE树 算法设计 对比验证
下载PDF
基于改进遗传算法的SVM参数优化研究 被引量:12
13
作者 马元良 裴生雷 《计算机仿真》 CSCD 北大核心 2010年第8期150-152,193,共4页
针对传统遗传算法的支持向量机参数选择方法易陷入局部极小点,导致过拟合或欠学习的问题,从而提出一种基于改进遗传算法的支持向量机参数选择方法,该方法在遗传算法初始化群体阶段采用加权深度优先搜索机制,克服了遗传算法局部搜索能力... 针对传统遗传算法的支持向量机参数选择方法易陷入局部极小点,导致过拟合或欠学习的问题,从而提出一种基于改进遗传算法的支持向量机参数选择方法,该方法在遗传算法初始化群体阶段采用加权深度优先搜索机制,克服了遗传算法局部搜索能力差的缺点,对支持向量机的径向基核参数进行优化,找出了具有较强推广能力的径向基核参数。将该算法用于3个基准数据集的仿真实验,结果表明该方法在保证分类精度前提下,大幅度缩短了训练建模时间,提高了运行效率。 展开更多
关键词 支持向量机 遗传算法 参数优化 交叉验证
下载PDF
基于DBN-ELM的聚丙烯熔融指数的软测量 被引量:11
14
作者 王宇红 狄克松 +2 位作者 张姗 尚超 黄德先 《化工学报》 EI CAS CSCD 北大核心 2016年第12期5163-5168,共6页
针对聚丙烯熔融指数软测量中预测精度不高的缺点,将基于深度置信网络-极限学习机(DBN-ELM)的软测量方法应用到熔融指数的软测量中。与传统深度置信网络(DBN)不同的是,该方法将极限学习机(ELM)算法运用到深度置信网络的训练中。首先用深... 针对聚丙烯熔融指数软测量中预测精度不高的缺点,将基于深度置信网络-极限学习机(DBN-ELM)的软测量方法应用到熔融指数的软测量中。与传统深度置信网络(DBN)不同的是,该方法将极限学习机(ELM)算法运用到深度置信网络的训练中。首先用深度置信网络对原始数据进行数值分析来提取特征,然后将提取的特征输入到极限学习机中进行训练,得到软测量模型。实验验证表明,与支持向量机和单纯的深度置信网络模型相比,该方法具有更高的测量精度。 展开更多
关键词 深度置信网络 算法 极限学习机 数值分析 特征提取 实验验证
下载PDF
快速路交通流异常数据判断算法研究及实证 被引量:10
15
作者 陈德旺 郑长青 章长彪 《中国安全科学学报》 CAS CSCD 2006年第7期122-127,共6页
对快速路交通流数据进行异常数据判断,有利于避免使用异常数据带来的损失,提高信息利用的有效性。笔者分别根据逻辑推理、交通流的重复性和连续性以及交通流变量之间的机理分析提出了3种判断快速路交通流异常数据的算法,并讨论了这3种... 对快速路交通流数据进行异常数据判断,有利于避免使用异常数据带来的损失,提高信息利用的有效性。笔者分别根据逻辑推理、交通流的重复性和连续性以及交通流变量之间的机理分析提出了3种判断快速路交通流异常数据的算法,并讨论了这3种算法之间的集成。利用北京快速路实测数据对算法进行了验证,验证结果表明该算法基本是有效的。 展开更多
关键词 快速路 交通流 异常数据 算法 验证
下载PDF
基于交叉验证的神经网络实现 被引量:7
16
作者 丁剑 韩萌 《大连民族学院学报》 CAS 2008年第5期422-424,共3页
针对神经网络BP算法存在收敛速度慢、学习数据有限和网络学习过程易陷入局部最小值等问题,提出对标准BP算法相关参数进行调整并选择合适的隐藏层个数的方法,然后采用交叉验证方法对BP算法做了再改进。仿真结果表明基于交叉验证的BP算法... 针对神经网络BP算法存在收敛速度慢、学习数据有限和网络学习过程易陷入局部最小值等问题,提出对标准BP算法相关参数进行调整并选择合适的隐藏层个数的方法,然后采用交叉验证方法对BP算法做了再改进。仿真结果表明基于交叉验证的BP算法优于传统的BP算法。 展开更多
关键词 神经网络 BP算法 交叉验证 隐藏层 误差函数
下载PDF
线状地理要素空间距离计算与算法优化 被引量:9
17
作者 邓振民 田方方 杨翠媛 《城市勘测》 2017年第6期63-66,70,共5页
基于建立与优化线状地理要素空间最小距离计算模型的目的,采用映射线状地理要素地物到空间几何概念范畴的方法,通过分析空间范围内两要素间距离的三维关系,推导计算两要素间最小空间距离的数学模型,把模型作为基本单元向外扩展得到空间... 基于建立与优化线状地理要素空间最小距离计算模型的目的,采用映射线状地理要素地物到空间几何概念范畴的方法,通过分析空间范围内两要素间距离的三维关系,推导计算两要素间最小空间距离的数学模型,把模型作为基本单元向外扩展得到空间范围内地理要素间最小距离计算的数学算法,利用空间范围的划分与计算流程的优化得到性能改善的算法,以管线实例验证算法的有效性,得出算法可用于线状地理要素空间距离计算场景的结论。 展开更多
关键词 线状地理要素 最小空间距离 空间范围划分 算法验证
下载PDF
复杂地表地表温度反演研究进展 被引量:9
18
作者 肖尧 马明国 +1 位作者 闻建光 于文凭 《遥感技术与应用》 CSCD 北大核心 2021年第1期33-43,共11页
地表温度是陆表过程研究的关键参数,卫星反演地表温度是获取区域及全球尺度辐射平衡、能量收支研究中地表温度参数的有效手段。目前,在平坦地表覆盖均一区域,基于热红外和微波遥感反演的地表温度已经被验证具有较好精度,尤其热红外遥感... 地表温度是陆表过程研究的关键参数,卫星反演地表温度是获取区域及全球尺度辐射平衡、能量收支研究中地表温度参数的有效手段。目前,在平坦地表覆盖均一区域,基于热红外和微波遥感反演的地表温度已经被验证具有较好精度,尤其热红外遥感地表温度产品精度可达1 K以内。但是针对复杂地表的温度反演研究仍面临较大挑战。系统总结了复杂地形区地表温度反演的局限性,包括反演模型病态问题、地形复杂性、水汽云雾厚重造成数据缺失、真实性检验不确定性。并在此基础上,对未来复杂地表温度反演精度提高提出了可能实现的途径。 展开更多
关键词 地表温度 复杂地表 反演方法 水汽 真实性检验
原文传递
On Splitting Training and Validation Set:A Comparative Study of Cross-Validation,Bootstrap and Systematic Sampling for Estimating the Generalization Performance of Supervised Learning 被引量:8
19
作者 Yun Xu Royston Goodacre 《Journal of Analysis and Testing》 EI 2018年第3期249-262,共14页
Model validation is the most important part of building a supervised model.For building a model with good generalization performance one must have a sensible data splitting strategy,and this is crucial for model valid... Model validation is the most important part of building a supervised model.For building a model with good generalization performance one must have a sensible data splitting strategy,and this is crucial for model validation.In this study,we con-ducted a comparative study on various reported data splitting methods.The MixSim model was employed to generate nine simulated datasets with different probabilities of mis-classification and variable sample sizes.Then partial least squares for discriminant analysis and support vector machines for classification were applied to these datasets.Data splitting methods tested included variants of cross-validation,bootstrapping,bootstrapped Latin partition,Kennard-Stone algorithm(K-S)and sample set partitioning based on joint X-Y distances algorithm(SPXY).These methods were employed to split the data into training and validation sets.The estimated generalization performances from the validation sets were then compared with the ones obtained from the blind test sets which were generated from the same distribution but were unseen by the train-ing/validation procedure used in model construction.The results showed that the size of the data is the deciding factor for the qualities of the generalization performance estimated from the validation set.We found that there was a significant gap between the performance estimated from the validation set and the one from the test set for the all the data splitting methods employed on small datasets.Such disparity decreased when more samples were available for training/validation,and this is because the models were then moving towards approximations of the central limit theory for the simulated datasets used.We also found that having too many or too few samples in the training set had a negative effect on the estimated model performance,suggesting that it is necessary to have a good balance between the sizes of training set and validation set to have a reliable estimation of model performance.We also found that systematic sampling method such a 展开更多
关键词 Cross-validation BOOTSTRAPPING Bootstrapped Latin partition Kennard-Stone algorithm SPXY Model selection Model validation Partial least squares for discriminant analysis Support vector machines
原文传递
基于SA-ELM的声学层析成像温度分布重建算法 被引量:8
20
作者 刘厦 刘石 任婷 《化工学报》 EI CAS CSCD 北大核心 2017年第6期2434-2446,共13页
在化工领域中,获取准确的温度分布信息具有极其重要的意义。声学层析成像(AT)具有非侵入传感、廉价等优点,因而被认为是一种具有广阔发展前景的可视化温度分布测量方法。将AT用于温度分布测量,提出一种SA-ELM算法改进重建质量。首先,利... 在化工领域中,获取准确的温度分布信息具有极其重要的意义。声学层析成像(AT)具有非侵入传感、廉价等优点,因而被认为是一种具有广阔发展前景的可视化温度分布测量方法。将AT用于温度分布测量,提出一种SA-ELM算法改进重建质量。首先,利用稳健估计建立了基于L1范数的目标泛函,采用模拟退火算法(SA)对目标泛函进行求解,得到粗网格下的温度分布;最后,采用极限学习机(ELM)来预测经细化网格后的温度分布。数值仿真和实验研究途径评估该方法的可行性与有效性,结果表明SA-ELM算法能够有效提高温度分布重建质量和鲁棒性,从而为AT反问题的求解提供了一种新的有效方法。 展开更多
关键词 声学层析成像 温度分布测量 模拟退火 极限学习机 算法 数值模拟 实验验证
下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部