期刊文献+
共找到190篇文章
< 1 2 10 >
每页显示 20 50 100
随机森林算法基本思想及其在生态学中的应用--以云南松分布模拟为例 被引量:149
1
作者 张雷 王琳琳 +3 位作者 张旭东 刘世荣 孙鹏森 王同立 《生态学报》 CAS CSCD 北大核心 2014年第3期650-659,共10页
通常来讲,生态学者对于解释生态关系、描述格局和过程、进行空间或时间预测比较感兴趣。这些工作可以通过模拟输出值(响应)与一些特征值(即解释变量)的关系来实现。然而,生态数据模拟遇到了挑战,这是因为响应变量和预测变量可能是连续... 通常来讲,生态学者对于解释生态关系、描述格局和过程、进行空间或时间预测比较感兴趣。这些工作可以通过模拟输出值(响应)与一些特征值(即解释变量)的关系来实现。然而,生态数据模拟遇到了挑战,这是因为响应变量和预测变量可能是连续变量或离散变量。需要解释的生态关系通常是非线性的,并且解释变量之间具有复杂的相互作用关系。响应变量和解释变量存在缺失值并不是不常有的现象,奇异值也经常出现在生态数据中。此外,生态学者通常希望生态模型即要易于建立又易要于解释。通常是利用多种统计方法来分析处理各种各样情景中出现的独特的生态问题,这些模型包括(多元)逻辑回归、线性模型、生存模型、方差分析等等。随机森林是一个可以处理所有这些问题的有效方法。随机森林可以用来做分类、聚类、回归和生存分析、评估变量的重要性、检测数据中的奇异值、对缺失数据进行插补等。鉴于随机森林本身在算法上的优势,将就随机森林在生态学中的应用进行总结,对建模过程进行概述,并以云南松分布模拟研究为例,对其主要功能特点进行案例展示。通过对随机森林的一般术语、概念和建模思想进行介绍,有利于读者掌握本方法的应用本质,可以预见随机森林在生态学研究中将得到更多的应用和发展。 展开更多
关键词 随机森林 分类回归树 变量重要性 多维数据 物种分布模拟
下载PDF
广义模型及分类回归树在物种分布模拟中的应用与比较 被引量:69
2
作者 曹铭昌 周广胜 翁恩生 《生态学报》 CAS CSCD 北大核心 2005年第8期2031-2040,共10页
比较3个应用较广的模拟物种地理分布模型:广义线性模型(GLM)、广义加法模型(GAM)与分类回归树(CART)对中国树种地理分布模拟的优劣,以提出更为合适的模拟物种地理分布模型,并用于预测气候变化对物种地理分布的影响。3个模型对中国15种... 比较3个应用较广的模拟物种地理分布模型:广义线性模型(GLM)、广义加法模型(GAM)与分类回归树(CART)对中国树种地理分布模拟的优劣,以提出更为合适的模拟物种地理分布模型,并用于预测气候变化对物种地理分布的影响。3个模型对中国15种树种地理分布的模拟研究表明:除对油松、辽东栎分布的模拟精度稍差外,对其余树种分布的模拟精度均较高,其中以GAM模型最好。结合地理信息系统(GIS),比较分析了这3个模型对青冈、木荷、红松和油松4种树种的地理分布模拟效果,结果亦表明:这3个模型均能很好模拟青冈和木荷的地理分布,而GLM模型对红松分布的模拟结果不太理想,3个模型对油松分布的模拟结果均不甚理想,其中以GLM模型最差。基于3个模型对未来气候变化下青冈与蒙古栎地理分布的预测表明:GLM模型与GAM模型对青冈分布的预测结果较为接近,青冈在未来气候变化情景下向西和向北扩展,而CART模型预测青冈在未来气候变化情景下除有向西、向北扩展趋势外,广东和广西南部的青冈分布区将消失;3个模型均预测蒙古栎在未来气候变化情景下向西扩展,扩展面积的大小为:模型的模拟面积>模型>模型。 展开更多
关键词 物种分布 广义线性模型 广义加法模型 分类回归树
下载PDF
基于分类回归树(CART)方法的统计解析模型的应用与研究 被引量:31
3
作者 张立彬 张其前 +1 位作者 胥芳 杜奖胜 《浙江工业大学学报》 CAS 2002年第4期315-318,共4页
分类回归树是基于统计理论的非参数的识别技术 ,它具有非常强大的统计解析功能 ,对输入数据和预测数据的要求可以是不完整的 ,或者是复杂的浮点数运算。而且 ,数据处理后的结果所包含的规则明白易懂。因此 ,分类回归树已成为对特征数据... 分类回归树是基于统计理论的非参数的识别技术 ,它具有非常强大的统计解析功能 ,对输入数据和预测数据的要求可以是不完整的 ,或者是复杂的浮点数运算。而且 ,数据处理后的结果所包含的规则明白易懂。因此 ,分类回归树已成为对特征数据进行建立统计解析模型的一个很好的方法。本文首先介绍了一种构建分类回归树的算法 ,并对其剪枝策略进行了简单的探讨 ,最后用统计解析软件S PLUS对一个应用实例进行了分析 。 展开更多
关键词 CART 分类回归树 二叉树 S-PLUS 统计解析模型 剪枝策略 数据处理 建模方法
下载PDF
基于R软件rpart包的分类与回归树应用 被引量:37
4
作者 谢益辉 《统计与信息论坛》 2007年第5期67-70,共4页
对于许多分类和回归问题,二叉树(Binary Tree)提供了有趣而又形象化的方式来研究数据,它主要是按照一定的规则拆分自变量,而完成对因变量的合理分类,进一步可以对未知分类进行预测。在主要介绍递归分割(Recursive Partitioning)和回归树... 对于许多分类和回归问题,二叉树(Binary Tree)提供了有趣而又形象化的方式来研究数据,它主要是按照一定的规则拆分自变量,而完成对因变量的合理分类,进一步可以对未知分类进行预测。在主要介绍递归分割(Recursive Partitioning)和回归树(Regression Tree)在R软件中应用的同时,对一前列腺癌数据使用生存分析和分类与回归树相结合的方法做出分析,并得到了对于疾病诊断和预防较有指导意义的结论。 展开更多
关键词 递归分割 分类与回归树 生存分析 R软件
下载PDF
重型颅脑损伤患者行去骨瓣减压术预后分析 被引量:34
5
作者 王建莉 金国良 袁紫刚 《中华急诊医学杂志》 CAS CSCD 北大核心 2014年第2期168-173,共6页
目的 探讨重型颅脑损伤患者单侧去骨瓣减压术后挫伤性脑出血增大的相关因素及与预后的关系.方法 本研究为前瞻性研究:对2008年1月至2011年12月期间浙江省绍兴市人民医院神经外科收治的行去骨瓣减压术的重型颅脑损伤患者(共291例,其中5... 目的 探讨重型颅脑损伤患者单侧去骨瓣减压术后挫伤性脑出血增大的相关因素及与预后的关系.方法 本研究为前瞻性研究:对2008年1月至2011年12月期间浙江省绍兴市人民医院神经外科收治的行去骨瓣减压术的重型颅脑损伤患者(共291例,其中56例因缺乏头颅CT数据等情况不纳入分析,最终研究对象为235例)进行随访观察,收集记录性别、年龄、致伤原因、术前情况(GCS评分,瞳孔状态,实验室检查和头颅CT数据)、术后血肿增加量、预后(GOS评分)指标,比较血肿增大组与血肿未增大组各参数差异(视数据特性进行t检验,x2检验和秩和检验),同时采用分类和回归树预测血肿是否增大,并进行Rotterdam CT评分与GOS相关性分析.结果 235例患者中血肿增大组120例,血肿未增大组115例,组间比较显示,年龄(t=2.034,p=0.043)、首次Rotterdam CT评分(Z=4.838,P<0.01)、GCS评分(Z =4.440,P<0.01)、瞳孔状态(Z=3.235,P=0.001)、外伤到开颅时间(Z=3.874,P<0.01)、血糖值(Z=3.880,P<0.01)和疝出幅度(Z=2.529,P=0.012)差异具有统计学意义;分类和回归树分析结果表明:最初头颅CT的Rotterdam评分、血糖值和外伤到开颅间隔时间是强有力的预测因子,年龄和骨瓣大小也对挫伤性脑出血是否增大产生有意义的影响,分类和回归树预测准确率为83.3%;相关性分析结果说明Rotterdam CT评分与GOS呈负相关(r=-0.333,P<0.01).结论 重型颅脑损伤患者头颅CT的严重程度、血糖值和外伤到开颅间隔时间可以预测去骨瓣减压术后脑挫伤出血增大的风险;Rotterdam CT评分与预后密切相关. 展开更多
关键词 创伤性脑损伤 创伤性脑出血 外伤性蛛网膜下腔出血 ROTTERDAM CT评分 去骨瓣减压术 预后 分类和回归树 Glasgow预后评分
原文传递
滑坡灾害危险性评价的3种统计方法比较-以深圳市为例 被引量:32
6
作者 司康平 田原 +2 位作者 汪大明 邬伦 朱亚林 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第4期639-646,共8页
采用Logistic回归模型、广义加法模型(GAM)和分类与回归树(CART)3种统计方法,对深圳市的研究区域进行了滑坡灾害的危险性评价;利用Kappa值和ROC曲线,结合危险性评价结果图对3种方法的效果进行了比较,并分析了3种方法在选取主控因子以及... 采用Logistic回归模型、广义加法模型(GAM)和分类与回归树(CART)3种统计方法,对深圳市的研究区域进行了滑坡灾害的危险性评价;利用Kappa值和ROC曲线,结合危险性评价结果图对3种方法的效果进行了比较,并分析了3种方法在选取主控因子以及确定因子影响程度等方面各自具有的特点。在研究区域的条件下,GAM的效果优于Logistic回归模型和CART,Logistic回归模型和CART的效果大致相当。Logistic回归模型和CART可自主选择主控因子,通过GAM可定量研究因子的影响程度以及变化趋势。 展开更多
关键词 滑坡灾害危险性评价 LOGISTIC回归 广义加法模型 分类与回归树
下载PDF
城市土地利用变化的不透水面覆盖度检测方法 被引量:25
7
作者 高志宏 张路 +2 位作者 李新延 廖明生 邱建壮 《遥感学报》 EI CSCD 北大核心 2010年第3期593-606,共14页
通过分析城市中不透水面数量和分布的变化与城市土地利用变化之间的对应关系,综合中、高分辨率遥感数据各自的优势,运用CART算法进行城市不透水面覆盖度(ISP)遥感估算,基于ISP制图结果对城市土地利用变化进行检测。以山东省泰安市为例... 通过分析城市中不透水面数量和分布的变化与城市土地利用变化之间的对应关系,综合中、高分辨率遥感数据各自的优势,运用CART算法进行城市不透水面覆盖度(ISP)遥感估算,基于ISP制图结果对城市土地利用变化进行检测。以山东省泰安市为例开展实验研究,结果表明,与传统的变化检测方法相比,基于ISP的变化检测方法,不仅能够反映土地利用类型转换的潜在信息,而且可以灵活地量化定义和解释城市用地变化情况。这种方法为城市土地利用变化信息的提取和分析提供了一种新的思路,可以作为现有变化检测方法的有益补充。 展开更多
关键词 不透水面 分类回归树 土地利用 变化检测
下载PDF
随机森林回归法在冬季路面温度预报中的应用 被引量:25
8
作者 王可心 包云轩 +2 位作者 朱承瑛 陈粲 袁成松 《气象》 CSCD 北大核心 2021年第1期82-93,共12页
基于宁宿徐高速公路三个交通气象站2015—2018年冬季逐10 min实时观测资料,使用随机森林回归模型预报这三个站的未来1 h冬季路面温度,分析了该模型在冬季路面温度预报中的可行性和适用性。研究结果表明:随机森林回归法可以被用来预报高... 基于宁宿徐高速公路三个交通气象站2015—2018年冬季逐10 min实时观测资料,使用随机森林回归模型预报这三个站的未来1 h冬季路面温度,分析了该模型在冬季路面温度预报中的可行性和适用性。研究结果表明:随机森林回归法可以被用来预报高速公路冬季路面温度,不同类型的交通气象站点的特征输入方案和参数调试标准存在差异;与简单特征相比,引入的复合特征能更好地补充解释交通气象站所处的环境和气象要素,且其对普通路面交通气象站和靠近桥梁、水体的交通气象站的区分度更高,故引入复合特征的随机森林回归模型可以被用来预报高速公路冬季路面温度,且其在对普通路面交通气象站和靠近水体、桥梁的交通气象站的预报效果较好,而对服务区交通气象站的预报效果略差;袋外误差率的降低并不代表预报精度的提高;引入复合特征的随机森林回归模型不论在何种天气状况下,均可用于各不同类型交通气象站冬季路面温度的预报,雨雪天时的预报效果最佳,阴天其次,晴天略差。 展开更多
关键词 冬季路面温度 机器学习 随机森林 CART回归树 预报效果评估
下载PDF
基于TM图像和夜间灯光数据的区域城镇扩张监测——以浙江省为例 被引量:24
9
作者 陈征 胡德勇 +1 位作者 曾文华 邓磊 《国土资源遥感》 CSCD 北大核心 2014年第1期83-89,共7页
以浙江省为研究区,利用收集到的Landsat TM图像、DMSP/OLS夜间灯光数据及其他辅助数据,开展区域城镇扩张监测方法的研究,并在此基础上分析了浙江省1995—2010年间城镇扩张的时空特征。结果表明:基于分类回归树算法,综合利用TM数据和DMSP... 以浙江省为研究区,利用收集到的Landsat TM图像、DMSP/OLS夜间灯光数据及其他辅助数据,开展区域城镇扩张监测方法的研究,并在此基础上分析了浙江省1995—2010年间城镇扩张的时空特征。结果表明:基于分类回归树算法,综合利用TM数据和DMSP/OLS夜间灯光数据,可精确稳定地提取城镇信息;1995—2010年间,浙江省城镇用地持续增加,除洞头县、庆元县、文成县、云和县、兰溪市、龙泉市和绍兴市等7个县市扩张加速度有所减缓外,全省其余市、县均处于加速扩张阶段;浙江省城镇扩张地域差异明显,表现为沿海地区的城市化水平整体高于内陆地区,地势平坦地区高于地形复杂地区,从而形成了杭州、绍兴、温州3大沿海城市群和以金华为中心的内陆地区中小城市带。 展开更多
关键词 LANDSAT TM 夜间灯光数据 城市扩张 分类回归树算法 浙江省
下载PDF
基于CART决策树的高分二号洞庭湖区湿地分类方法 被引量:21
10
作者 陈磊士 高霞霞 +2 位作者 廖玉芳 邓剑波 周碧 《测绘通报》 CSCD 北大核心 2021年第6期12-15,共4页
高分卫星遥感湿地分类的关键在于解决"同物异谱、异物同谱"难题。本文将当前应用前景广泛的亚米级国产高分二号(GF-2)影像和CART决策树面向对象分类算法相结合,以湖南沅江为例进行洞庭湖区典型湿地的分类提取工作,选取包括光... 高分卫星遥感湿地分类的关键在于解决"同物异谱、异物同谱"难题。本文将当前应用前景广泛的亚米级国产高分二号(GF-2)影像和CART决策树面向对象分类算法相结合,以湖南沅江为例进行洞庭湖区典型湿地的分类提取工作,选取包括光谱信息、几何特征、地形特征和纹理特征等多维对象特征对分类器进行训练,构建了多维特征湿地分类方法。试验区总体分类精度优于传统方法,可为基于GF-2影像的洞庭湖湿地分类提供技术参考。 展开更多
关键词 湿地 高分二号 CART决策树 面向对象 分类特征 洞庭湖区
下载PDF
639例重型颅脑损伤患者生存预测分析 被引量:20
11
作者 王建莉 金国良 郭京 《中华神经外科杂志》 CSCD 北大核心 2008年第2期95-97,共3页
目的建立一个关于重型颅脑损伤患者生存的简单、方便、准确率高的预测模型。方法采用分类和回归树(classification and regression tree,CART)分析方法,选择8个预后因子,对639例重型颅脑损伤患者的预后进行分析,预后以外伤后6个... 目的建立一个关于重型颅脑损伤患者生存的简单、方便、准确率高的预测模型。方法采用分类和回归树(classification and regression tree,CART)分析方法,选择8个预后因子,对639例重型颅脑损伤患者的预后进行分析,预后以外伤后6个月生存或死亡为标准。结果GCS评分是最好的预测因子,血糖、瞳孔情况是强有力的预测因子,头颅CT表现、年龄是有效的预测因子,白细胞计数也对预后产生有意义的影响。CART中的所有变量都与预后相关,预测生存的准确率达91.4%。结论CART预测模型能较好地预测重型颅脑损伤患者的生存,是简单有效、准确率高的预测方法。 展开更多
关键词 颅脑损伤 分类和回归树 预后 预测
原文传递
基于RS-CART决策树的航空发动机小样本故障诊断 被引量:19
12
作者 庞梦洋 索中英 +3 位作者 郑万泽 徐宇恒 包壮壮 黄林 《航空动力学报》 EI CAS CSCD 北大核心 2020年第7期1559-1568,共10页
针对CART(classification and regression tree)分类决策树构建过程中由于小样本集特征维数高及噪声等造成的过拟合问题,在CART决策树算法训练过程中引入基于互信息的粗糙集(rough sets,RS)属性约简,考虑信息熵与基尼(GINI)系数刻画样本... 针对CART(classification and regression tree)分类决策树构建过程中由于小样本集特征维数高及噪声等造成的过拟合问题,在CART决策树算法训练过程中引入基于互信息的粗糙集(rough sets,RS)属性约简,考虑信息熵与基尼(GINI)系数刻画样本集"纯净度"的相似关系,对历史故障数据进行属性约简,降低属性维度以优化训练集,在此基础上构建分类决策树,可视化输出规则。实验结果表明:将改进的CART决策树算法应用于某型航空发动机油液故障诊断,提取的规则可解释性强,能够减小冗余属性及噪声对决策的影响,与常用故障诊断算法相比,该模型的诊断准确率提升20%左右,AUC(area under curve)值高达92%,可以有效处理高维离散型航空发动机小样本故障问题。 展开更多
关键词 故障诊断 属性约简 分类与回归树 GINI系数 规则提取
原文传递
基于多源数据的中原黄泛区土壤盐分空间变异分析 被引量:19
13
作者 吴亚坤 刘广明 +1 位作者 杨劲松 余世鹏 《农业工程学报》 EI CAS CSCD 北大核心 2015年第5期115-120,共6页
为研究中原黄泛区土壤盐分空间变异,以河南省封丘县为研究区,综合考虑引起土壤盐渍化的土壤盐分、地形、地下水位及矿化度、植被情况及其他影响因素,基于遥感影像和磁感式探测获得的土壤表观电导率等多源数据建立了区域土壤盐分综合... 为研究中原黄泛区土壤盐分空间变异,以河南省封丘县为研究区,综合考虑引起土壤盐渍化的土壤盐分、地形、地下水位及矿化度、植被情况及其他影响因素,基于遥感影像和磁感式探测获得的土壤表观电导率等多源数据建立了区域土壤盐分综合评估模型,并对研究区分层土壤盐分空间变异进行评估。结果表明:对于0~60 cm土层利用多源数据进行模型构建中土壤表观电导率与光谱指数占主要比例,模型对于各层土壤盐分的评价精度0~60 cm土层优于≥60~120 cm土层。土壤盐分含量随着深度的增加而增大,变异系数在0.22~0.28之间,属中等变异强度。土壤盐分主要集中分布在研究区北部与东南部,尤其是东南角黄河沿线区域,且随着土壤剖面显示出从表现到深层逐渐增加的趋势。利用多源数据建立的分层土壤盐分综合评估模型对于区域土壤盐分解析具有较高精度。该研究为中原黄泛区土壤盐化消减与土壤质量提升提供了可靠新方法。 展开更多
关键词 土壤 模型 遥感 光谱指数 表观电导率 分类回归树
下载PDF
基于分类回归树和AdaBoost的眼底图像视网膜血管分割 被引量:18
14
作者 朱承璋 向遥 +3 位作者 邹北骥 高旭 梁毅雄 毕佳 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2014年第3期445-451,共7页
提出一种能有效分割眼底图像中视网膜血管的监督学习方法,为眼底图中的每个像素点构造一个包括局部特征、形态学特征和Gabor特征在内的39维特征向量,用以判定其是否为血管上的像素.在进行分类计算时,以分类回归树作为弱分类器对样本集分... 提出一种能有效分割眼底图像中视网膜血管的监督学习方法,为眼底图中的每个像素点构造一个包括局部特征、形态学特征和Gabor特征在内的39维特征向量,用以判定其是否为血管上的像素.在进行分类计算时,以分类回归树作为弱分类器对样本集分类,然后对AdaBoost分类器进行训练得到强分类器,并由此完成各个像素点的分类判定.基于国际公共数据库DRIVE的实验结果表明,该方法的平均精确度达到0.960 7,且敏感度和特异性均优于已有的基于监督学习的方法,适用于眼底图像的计算机辅助定量分析和疾病诊断. 展开更多
关键词 眼底图像 视网膜血管分割 分类回归树 ADABOOST
下载PDF
高血压危险因素分类树分析 被引量:10
15
作者 贾崇奇 赵仲堂 +5 位作者 王立华 郝风荣 冯月秋 王束玫 徐晓菲 贾存显 《中国公共卫生》 CAS CSCD 北大核心 2003年第6期684-685,共2页
目的 探讨高血压的主要危险因素与高危人群 ,为高血压的防制提供理论依据。方法 采用以社区人群为基础的病例对照研究 ;以某工厂人群中筛检出的、未经药物系统治疗的 1 1 6名高血压患者及 1 36名血压正常健康者为研究对象 ;运用分类... 目的 探讨高血压的主要危险因素与高危人群 ,为高血压的防制提供理论依据。方法 采用以社区人群为基础的病例对照研究 ;以某工厂人群中筛检出的、未经药物系统治疗的 1 1 6名高血压患者及 1 36名血压正常健康者为研究对象 ;运用分类树分析探讨高血压的主要危险因素与高危人群。结果 高血压的主要危险因素为 :超重、中心型肥胖、饮酒、吸烟、高血脂症、年龄与性别。高血压主要高危人群为 :(1 )超重 +中心型肥胖 +饮酒者 ;(2 )超重 +中心型肥胖 +高年龄及其男性吸烟者 ;(3)超重 +高血脂症者 ;(4)中心型肥胖 +饮酒 +吸烟者。上述高危人群病例数占总病例数的 82 76 %。以学习集的分类结果为 :灵敏度为 82 76 % ,特异度为 74 2 6 % ;以检验集的分类结果为 :灵敏度为 71 55 % ,特异度为 61 0 3 %。结论 对高血压不同高危人群应采取不同的防制措施 ;控制体重、饮酒、血脂水平。 展开更多
关键词 高血压 分类树 回归树 危险因素
下载PDF
An Embedded Feature Selection Method for Imbalanced Data Classification 被引量:16
16
作者 Haoyue Liu MengChu Zhou Qing Liu 《IEEE/CAA Journal of Automatica Sinica》 EI CSCD 2019年第3期703-715,共13页
Imbalanced data is one type of datasets that are frequently found in real-world applications, e.g., fraud detection and cancer diagnosis. For this type of datasets, improving the accuracy to identify their minority cl... Imbalanced data is one type of datasets that are frequently found in real-world applications, e.g., fraud detection and cancer diagnosis. For this type of datasets, improving the accuracy to identify their minority class is a critically important issue.Feature selection is one method to address this issue. An effective feature selection method can choose a subset of features that favor in the accurate determination of the minority class. A decision tree is a classifier that can be built up by using different splitting criteria. Its advantage is the ease of detecting which feature is used as a splitting node. Thus, it is possible to use a decision tree splitting criterion as a feature selection method. In this paper, an embedded feature selection method using our proposed weighted Gini index(WGI) is proposed. Its comparison results with Chi2, F-statistic and Gini index feature selection methods show that F-statistic and Chi2 reach the best performance when only a few features are selected. As the number of selected features increases, our proposed method has the highest probability of achieving the best performance. The area under a receiver operating characteristic curve(ROC AUC) and F-measure are used as evaluation criteria. Experimental results with two datasets show that ROC AUC performance can be high, even if only a few features are selected and used, and only changes slightly as more and more features are selected. However, the performance of Fmeasure achieves excellent performance only if 20% or more of features are chosen. The results are helpful for practitioners to select a proper feature selection method when facing a practical problem. 展开更多
关键词 classification and regression tree FEATURE selection imbalanced data WEIGHTED GINI INDEX (WGI)
下载PDF
基于CART决策树的冲压成形仿真数据挖掘 被引量:17
17
作者 王伟 黄宇星 余鸿敏 《工程科学学报》 EI CSCD 北大核心 2018年第11期1373-1379,共7页
油箱壳外形复杂,拉深成形过程中容易出现侧壁起皱和圆角处破裂的缺陷,成形工艺参数的确定非常重要.结合分类与回归决策树(classification and regression tree,CART)的人工智能技术和模型交叉验证方法,通过调用Python平台开源库Scikit... 油箱壳外形复杂,拉深成形过程中容易出现侧壁起皱和圆角处破裂的缺陷,成形工艺参数的确定非常重要.结合分类与回归决策树(classification and regression tree,CART)的人工智能技术和模型交叉验证方法,通过调用Python平台开源库Scikit-Learn对油箱壳拉深成形数值模拟结果进行知识挖掘,筛选出对油箱壳拉深成形影响大的工艺参数;以基尼指数(Gini index)最小化作为最优特征值及最优切分点选择的依据,构建了工艺参数与性能指标关系的CART决策树,提取出了可靠的工艺设计规则.油箱壳拉深实例表明,CART决策树理论的知识发现技术是实现板料成形过程数值模拟结果潜在知识挖掘的可行途径. 展开更多
关键词 知识发现 数据挖掘 数值仿真 分类与回归树 主成分分析
原文传递
基于多源遥感数据的复杂地形区农作物分类 被引量:16
18
作者 史飞飞 雷春苗 +2 位作者 肖建设 李甫 石明明 《地理与地理信息科学》 CSCD 北大核心 2018年第5期49-55,共7页
为准确获取中尺度复杂地形区西宁市内的农作物分布信息,该文利用HJ CCD和Landsat 8OLI影像数据提取研究区内农作物4-11月的NDVI时间序列数据,同时利用HJ-1A HSI高光谱数据,通过光谱特征变量提取和单因素方差分析后,选取5种光谱特征变量... 为准确获取中尺度复杂地形区西宁市内的农作物分布信息,该文利用HJ CCD和Landsat 8OLI影像数据提取研究区内农作物4-11月的NDVI时间序列数据,同时利用HJ-1A HSI高光谱数据,通过光谱特征变量提取和单因素方差分析后,选取5种光谱特征变量与NDVI时间序列数据组成多源数据集,并最终采用分类回归决策树(CART)和支持向量机(SVM)两种方法进行农作物分类。结果表明:1)采用多源数据集进行作物分类,最高分类精度达88.2%,明显高于采用单一时序NDVI数据的分类精度,表明在时间序列数据中融入高光谱数据能够提高作物的识别精度;2)采用CART决策树和支持向量机进行农作物识别,最优总体分类精度分别为88.2%和84.5%,表明基于CART方法的作物总体分类效果较优;3)在NDVI时间序列数据中融入高光谱数据能够提高生育期较为接近作物的识别精度。 展开更多
关键词 高光谱 作物分类 光谱特征变量 分类回归决策树 支持向量机
下载PDF
基于决策树的洪湖水生植物遥感信息提取 被引量:16
19
作者 张莹莹 蔡晓斌 +4 位作者 宋辛辛 索江瑞 王智 厉恩华 王学雷 《湿地科学》 CSCD 北大核心 2018年第2期213-222,共10页
以洪湖为研究对象,采用分类与回归树(classification and regression trees,CART)方法,根据训练样本数据集中挖掘分类规则,集成遥感影像的光谱特征、植被指数、水体指数、纹理特征等特征变量,建立研究区湿地信息提取的决策树模型;在... 以洪湖为研究对象,采用分类与回归树(classification and regression trees,CART)方法,根据训练样本数据集中挖掘分类规则,集成遥感影像的光谱特征、植被指数、水体指数、纹理特征等特征变量,建立研究区湿地信息提取的决策树模型;在此基础上,探究水体透明度对水生植物遥感信息提取的影响,依据特征变量有、无水体透明度,分别建立两类决策树,即有水体透明度参与的决策树(CART 14)和无透明度参与的决策树(CART 13);在训练样本和验证数据相同的情况下,对比采用CART 14、CART 13、支持向量机(support vector machine,SVM)和最大似然分类(maximum likelihood classification,MLC)4种方法的分类结果的精度。研究结果表明,洪湖中水生植物覆盖面积约占洪湖湿地总面积的47%,洪湖中的水生植物以沉水植物为主;采用有水体透明度参与的决策树分类结果的总体精度比采用支持向量机和最大似然分类方法的分别提高了7.78%和16.36%,Kappa系数则分别增大了0.12和0.20,无水体透明度参与的仅比有透明度参与的决策树分类结果的总体精度降低了2.77%,Kappa系数减小了0.04。水体透明度的参与能提高分类精度,而无水体透明度参与的决策树分类结果的总体精度也高于其它传统方法的分类精度。因此,在实际湿地分类中,若无水体透明度数据,但决策树的辅助分类变量足够多时,无水体透明度参与的决策树也能较好地进行分类,提取水生植物信息。 展开更多
关键词 洪湖湿地 分类与回归树 透明度 支持向量机 最大似然分类
原文传递
高速路交通流短时预测方法 被引量:16
20
作者 许岩岩 翟希 +1 位作者 孔庆杰 刘允才 《交通运输工程学报》 EI CSCD 北大核心 2013年第2期114-119,共6页
针对短时交通流变化的复杂性与非线性特点,分析了分类回归树模型的建立,包括模型的生长、分裂与剪枝,研究了模型在高速路交通流短时预测中的应用,并对美国波特兰州高速路网的真实交通流量数据进行分析建模。采用RMSE与MAPE误差分析法,... 针对短时交通流变化的复杂性与非线性特点,分析了分类回归树模型的建立,包括模型的生长、分裂与剪枝,研究了模型在高速路交通流短时预测中的应用,并对美国波特兰州高速路网的真实交通流量数据进行分析建模。采用RMSE与MAPE误差分析法,将试验结果与传统的交通流预测方法ARIMA模型与Kalman滤波预测模型进行比较。对比结果表明:分类回归树预测模型的RMSE比ARIMA模型与Kalman滤波预测模型分别降低了42.1%、13.1%。 展开更多
关键词 智能交通系统 交通流预测 数据挖掘 时间序列分析 分类回归树 KALMAN滤波器
原文传递
上一页 1 2 10 下一页 到第
使用帮助 返回顶部