关联分类具有较高的分类精度和较强的扩展性,但是由于分类器是由高置信度的规则构成,因此有时会出现过拟合。因此考虑在fp-growth挖掘频繁项的基础上。计算频繁项与测试数据间的最小差异度,即分类规则与测试数据的匹配程度。将最小...关联分类具有较高的分类精度和较强的扩展性,但是由于分类器是由高置信度的规则构成,因此有时会出现过拟合。因此考虑在fp-growth挖掘频繁项的基础上。计算频繁项与测试数据间的最小差异度,即分类规则与测试数据的匹配程度。将最小差异度最小的类标号赋予测试数据。实验结果表明,该算法较先前算法有较高的精确度,如CBA (Classification-Based Association),CMAR (Classification based on Multiple Association Rules),CPAR(Classification based on Predictive Association Rules)。但是不足之处是精确度提高的代价是存储频繁项的矩阵过于庞大.系统开销不小。展开更多
基金国家重点基础研究发展规划(973)(the National Grand Fundamental Research 973 Program of China under Grant No.2004CB318108)安徽省自然科学基金(the Natural Science Foundation of Anhui Province of China under Grant No.0504200208)安徽省教育厅重点自然科学研究项目(No.2006KJ015A)。
文摘关联分类具有较高的分类精度和较强的扩展性,但是由于分类器是由高置信度的规则构成,因此有时会出现过拟合。因此考虑在fp-growth挖掘频繁项的基础上。计算频繁项与测试数据间的最小差异度,即分类规则与测试数据的匹配程度。将最小差异度最小的类标号赋予测试数据。实验结果表明,该算法较先前算法有较高的精确度,如CBA (Classification-Based Association),CMAR (Classification based on Multiple Association Rules),CPAR(Classification based on Predictive Association Rules)。但是不足之处是精确度提高的代价是存储频繁项的矩阵过于庞大.系统开销不小。
基金国家自然科学基金(the National Natural Science Foundation of China under Grant No.60475017No.60675031)+4 种基金国家重点基础研究发展规划(973)(the National Grand Fundamental Research973Program of China under Grant No.2004CB318108)安徽省教育厅重点自然科学研究项目(No.2006KJ015A)安徽省自然科学基金(the Natural Science Foundation of Anhui Province of China under Grant No.0504200208)安徽省教育厅自然科学研究项目(No.2005kj053)安徽大学211工程学术创新团队