提出类别属性数据流数据离群度量——加权频繁模式离群因子(weighted frequent pattern outlier factor,简称WFPOF),并在此基础上给出一种快速数据流离群点检测算法FODFP-Stream(fast outlier detection for high dimensional categoric...提出类别属性数据流数据离群度量——加权频繁模式离群因子(weighted frequent pattern outlier factor,简称WFPOF),并在此基础上给出一种快速数据流离群点检测算法FODFP-Stream(fast outlier detection for high dimensional categorical data streams based on frequent pattern).该算法通过动态发现和维护频繁模式来计算离群度,能够有效地处理高维类别属性数据流,并可进一步扩展到数值属性和混合属性数据流.对仿真数据集和真实数据集的实验检测均验证该算法具有良好的适用性和有效性.展开更多
针对Apriori算法存在效率低、内存损耗大等问题,提出一种基于遗传算法来寻找频繁项集的(GNA)算法。结合Apriori算法和遗传算法的特点,设计 k 步挖掘过程,利用交叉算子产生候选项集和变异算子筛选频繁项集,避免多次扫描数据库的同时,减...针对Apriori算法存在效率低、内存损耗大等问题,提出一种基于遗传算法来寻找频繁项集的(GNA)算法。结合Apriori算法和遗传算法的特点,设计 k 步挖掘过程,利用交叉算子产生候选项集和变异算子筛选频繁项集,避免多次扫描数据库的同时,减少冗余。实验结果表明,GNA算法相比Apriori算法,对稀疏数据集或稠密数据集,在挖掘频繁模式的数量及效率上都有显著提高。展开更多
文摘提出类别属性数据流数据离群度量——加权频繁模式离群因子(weighted frequent pattern outlier factor,简称WFPOF),并在此基础上给出一种快速数据流离群点检测算法FODFP-Stream(fast outlier detection for high dimensional categorical data streams based on frequent pattern).该算法通过动态发现和维护频繁模式来计算离群度,能够有效地处理高维类别属性数据流,并可进一步扩展到数值属性和混合属性数据流.对仿真数据集和真实数据集的实验检测均验证该算法具有良好的适用性和有效性.
文摘针对Apriori算法存在效率低、内存损耗大等问题,提出一种基于遗传算法来寻找频繁项集的(GNA)算法。结合Apriori算法和遗传算法的特点,设计 k 步挖掘过程,利用交叉算子产生候选项集和变异算子筛选频繁项集,避免多次扫描数据库的同时,减少冗余。实验结果表明,GNA算法相比Apriori算法,对稀疏数据集或稠密数据集,在挖掘频繁模式的数量及效率上都有显著提高。