文摘传统的基于主成分的冗余变量筛选算法最终计算所得的关键变量筛选指标需要结合专家经验进行判定,具有人为主观性,使得模型预测结果不稳定。因此,文中提出了一种结合主成分与熵权的关键变量筛选算法(Key Variable Screening Algorithm Combining Principal Component and Entropy Weight,KVSA-PCA-EP)。该算法,首先通过传统的基于主成分的冗余变量筛选算法计算第一个关键变量筛选指标;然后,通过各原始变量的方差和目标变量的熵值计算第二个关键变量筛选指标;最后,以第二个关键变量筛选指标与第一个关键变量筛选指标的比值作为最终的关键变量筛选指标。文中通过在公开数据集METERC上的实验,并与传统的基于主成分的冗余变量筛选算法作对比,F1分数方面提高约5%,充分验证了提出算法的优越性。