目的使用决策树中的分类方法CHAID模型和logistic回归模型分析影响生活饮用水水质的相关因素,并比较两种模型分析结果的异同。方法采用分层随机抽样的方法对渭南市2015-2017年452座集中式供水水厂的相关因素进行分析,并用受试者工作曲线...目的使用决策树中的分类方法CHAID模型和logistic回归模型分析影响生活饮用水水质的相关因素,并比较两种模型分析结果的异同。方法采用分层随机抽样的方法对渭南市2015-2017年452座集中式供水水厂的相关因素进行分析,并用受试者工作曲线(ROC)评价两种预测模型的效果。结果logistic回归分析结果显示,消毒方式、正式运营时间、总投资和供水覆盖人口是水质不合格的影响因素,工程不消毒、工程运营时间越长,水厂规模(总投资和供水覆盖人口)越小,水质不合格率越高。决策树CHAID模型分析结果显示,消毒方式、总投资、供水覆盖人口、正式运营时间、监测点类型是水质不合格的影响因素,工程不消毒是水质不合格的主要影响因素。决策树模型ROC曲线下面积稍大于logistic回归模型(0.725 vs 0.701,Z=3.623,P<0.001)。结论CHAID决策树模型在水质影响因素风险评估方面有一定的应用价值,与logistic回归模型结合应用可从不同方面对水质影响因素进行分析预测,为后期饮用水的监管工作提供一定的科学依据。展开更多
文摘目的使用决策树中的分类方法CHAID模型和logistic回归模型分析影响生活饮用水水质的相关因素,并比较两种模型分析结果的异同。方法采用分层随机抽样的方法对渭南市2015-2017年452座集中式供水水厂的相关因素进行分析,并用受试者工作曲线(ROC)评价两种预测模型的效果。结果logistic回归分析结果显示,消毒方式、正式运营时间、总投资和供水覆盖人口是水质不合格的影响因素,工程不消毒、工程运营时间越长,水厂规模(总投资和供水覆盖人口)越小,水质不合格率越高。决策树CHAID模型分析结果显示,消毒方式、总投资、供水覆盖人口、正式运营时间、监测点类型是水质不合格的影响因素,工程不消毒是水质不合格的主要影响因素。决策树模型ROC曲线下面积稍大于logistic回归模型(0.725 vs 0.701,Z=3.623,P<0.001)。结论CHAID决策树模型在水质影响因素风险评估方面有一定的应用价值,与logistic回归模型结合应用可从不同方面对水质影响因素进行分析预测,为后期饮用水的监管工作提供一定的科学依据。