针对智能电网大数据背景下传统密度聚类离群点检测方法在适应性和异常点样本获取成本上的不足,研究一种新的基于权值的密度聚类离群点检测算法,并用极限学习机来预测离群点判断的阈值。对海量历史报文数据进行数据预处理后,将其放入极...针对智能电网大数据背景下传统密度聚类离群点检测方法在适应性和异常点样本获取成本上的不足,研究一种新的基于权值的密度聚类离群点检测算法,并用极限学习机来预测离群点判断的阈值。对海量历史报文数据进行数据预处理后,将其放入极限学习机进行训练,并预测得到基于权值的局部离群因子(weight-based local outlier factor,WLOF)的阈值。应用预测的WLOF阈值对实时数据进行密度聚类,以实现高性能的离群点检测。最后,采用某电网公司的实际数据进行实验。实验结果表明,所提算法具有较高的检测准确率,尤其适用于阈值未知情况下的离群点检测。展开更多
文摘针对智能电网大数据背景下传统密度聚类离群点检测方法在适应性和异常点样本获取成本上的不足,研究一种新的基于权值的密度聚类离群点检测算法,并用极限学习机来预测离群点判断的阈值。对海量历史报文数据进行数据预处理后,将其放入极限学习机进行训练,并预测得到基于权值的局部离群因子(weight-based local outlier factor,WLOF)的阈值。应用预测的WLOF阈值对实时数据进行密度聚类,以实现高性能的离群点检测。最后,采用某电网公司的实际数据进行实验。实验结果表明,所提算法具有较高的检测准确率,尤其适用于阈值未知情况下的离群点检测。