机器学习模型广泛应用于区域性滑坡易发性分析。模型的选择关系到评价结果的可信度、准确率和稳定性。现有滑坡易发性分析模型对比研究侧重模型的预测精度。模型的稳定性和数据量敏感性对机器学习模型的性能评估同样非常重要。本文以福...机器学习模型广泛应用于区域性滑坡易发性分析。模型的选择关系到评价结果的可信度、准确率和稳定性。现有滑坡易发性分析模型对比研究侧重模型的预测精度。模型的稳定性和数据量敏感性对机器学习模型的性能评估同样非常重要。本文以福建省南平市蔡源流域为研究区,以四川省绵阳市北川县为验证区,从预测精度、稳定性和数据量敏感性3个方面深入对比BP(Back Propagation)人工神经网络模型和CART(Classification and Regression Tree)决策树模型在滑坡易发性分析中的效果,主要结论如下:①在逐渐增加一定数量训练样本的过程中,BP人工神经网络模型预测精度的增长率更高。在蔡源流域内,当训练样本数量增加10000时,BP人工神经网络模型的预测精度上升5.22%,CART决策树模型的预测精度上升2.11%。②BP人工神经网络的预测精度高于CART决策树模型,且较为稳定。在100组数据集上,BP人工神经网络模型验证集预测精度的均值和验证集滑坡样本预测精度的均值分别为81.60%和84.86%,高于CART决策树模型的72.97%和76.59%。与此同时,BP人工神经网络模型对应预测精度的标准差分别是0.32%和0.37%,小于CART决策树模型的0.35%和0.67%。③BP人工神经网络模型分析的滑坡易发区相比CART决策树模型,更接近实际滑坡的空间分布。最后,北川县的验证实验也出现了相同的现象。展开更多
湿地是生态系统的重要组成部分,及时、准确地获得湿地基础信息,对湿地的动态监测、保护与可持续利用及其它领域的研究具有重要意义。以三江平原东北部沼泽湿地为例,利用分类回归树(Classification and Regression Tree,CART)算法从训练...湿地是生态系统的重要组成部分,及时、准确地获得湿地基础信息,对湿地的动态监测、保护与可持续利用及其它领域的研究具有重要意义。以三江平原东北部沼泽湿地为例,利用分类回归树(Classification and Regression Tree,CART)算法从训练样本数据集中挖掘分类规则,集成遥感影像的光谱特征、纹理特征和地学辅助数据建立研究区湿地信息提取的决策树模型。用实测的GPS样本点对分类结果进行精度验证,并与最大似然监督分类方法(Maximum Likelihood Classi-fication,MLC)进行对比。结果表明,基于CART的决策树分类结果的总精度和Kappa系数分别为82.65%和0.7935,分类精度较MLC监督分类方法有明显提高,是内陆淡水沼泽湿地信息提取的有效手段。展开更多
目的利用决策树模型和Logistic回归分析模型分析清丰县居民高血压的危险因素,比较两种分析方法的不同。方法采取多阶段分层整群抽样的方法,在清丰县15~74岁人群中抽取4 087名常住居民进行调查。建立决策树与Logistic回归分析模型。结果...目的利用决策树模型和Logistic回归分析模型分析清丰县居民高血压的危险因素,比较两种分析方法的不同。方法采取多阶段分层整群抽样的方法,在清丰县15~74岁人群中抽取4 087名常住居民进行调查。建立决策树与Logistic回归分析模型。结果决策树和Logistic回归分析模型均显示高年龄、中心性肥胖、初中以下文化、农村、糖尿病、吸烟、饮酒和有高血压家族史为高血压危险因素。超重/肥胖变量被纳入决策树模型,在Logistic回归分析模型中被剔除,共线性诊断提示中心性肥胖和超重/肥胖两变量有较强的共线性。曲线下面积(Area Under the Curve, AUC)和综合判别改善指数(Integrated Discrimination Improvement, IDI)均提示决策树模型预测高血压效果的能力稍高于Logistic回归分析模型。结论决策树模型预测能力稍高于Logistic回归分析模型,在高血压危险因素的分析中可行、直观,同时不受变量间共线性的影响;Logistic回归分析模型可以充分展现自变量与因变量的数量依存关系,与决策树模型互为补充,可结合两者来描述高血压的危险因素。展开更多
文摘机器学习模型广泛应用于区域性滑坡易发性分析。模型的选择关系到评价结果的可信度、准确率和稳定性。现有滑坡易发性分析模型对比研究侧重模型的预测精度。模型的稳定性和数据量敏感性对机器学习模型的性能评估同样非常重要。本文以福建省南平市蔡源流域为研究区,以四川省绵阳市北川县为验证区,从预测精度、稳定性和数据量敏感性3个方面深入对比BP(Back Propagation)人工神经网络模型和CART(Classification and Regression Tree)决策树模型在滑坡易发性分析中的效果,主要结论如下:①在逐渐增加一定数量训练样本的过程中,BP人工神经网络模型预测精度的增长率更高。在蔡源流域内,当训练样本数量增加10000时,BP人工神经网络模型的预测精度上升5.22%,CART决策树模型的预测精度上升2.11%。②BP人工神经网络的预测精度高于CART决策树模型,且较为稳定。在100组数据集上,BP人工神经网络模型验证集预测精度的均值和验证集滑坡样本预测精度的均值分别为81.60%和84.86%,高于CART决策树模型的72.97%和76.59%。与此同时,BP人工神经网络模型对应预测精度的标准差分别是0.32%和0.37%,小于CART决策树模型的0.35%和0.67%。③BP人工神经网络模型分析的滑坡易发区相比CART决策树模型,更接近实际滑坡的空间分布。最后,北川县的验证实验也出现了相同的现象。
文摘目的利用决策树模型和Logistic回归分析模型分析清丰县居民高血压的危险因素,比较两种分析方法的不同。方法采取多阶段分层整群抽样的方法,在清丰县15~74岁人群中抽取4 087名常住居民进行调查。建立决策树与Logistic回归分析模型。结果决策树和Logistic回归分析模型均显示高年龄、中心性肥胖、初中以下文化、农村、糖尿病、吸烟、饮酒和有高血压家族史为高血压危险因素。超重/肥胖变量被纳入决策树模型,在Logistic回归分析模型中被剔除,共线性诊断提示中心性肥胖和超重/肥胖两变量有较强的共线性。曲线下面积(Area Under the Curve, AUC)和综合判别改善指数(Integrated Discrimination Improvement, IDI)均提示决策树模型预测高血压效果的能力稍高于Logistic回归分析模型。结论决策树模型预测能力稍高于Logistic回归分析模型,在高血压危险因素的分析中可行、直观,同时不受变量间共线性的影响;Logistic回归分析模型可以充分展现自变量与因变量的数量依存关系,与决策树模型互为补充,可结合两者来描述高血压的危险因素。