期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
新型加权粗糙朴素贝叶斯算法及其应用研究 被引量:6
1
作者 王辉 刘淑芬 《计算机应用研究》 CSCD 北大核心 2015年第12期3668-3672,3692,共6页
待分类数据集中通常存在大量的冗余属性,会严重影响分类效率。为了达到在降低计算复杂度的同时提高分类准确率的目的。首先在朴素贝叶斯模型中引入粗糙集技术对数据集进行属性约简,获取最优属性子集;然后在此基础上以最大化数据集的对... 待分类数据集中通常存在大量的冗余属性,会严重影响分类效率。为了达到在降低计算复杂度的同时提高分类准确率的目的。首先在朴素贝叶斯模型中引入粗糙集技术对数据集进行属性约简,获取最优属性子集;然后在此基础上以最大化数据集的对数条件似然估计为标准对条件属性设定(近似)最优权值,进而提出一种新型加权粗糙朴素贝叶斯模型。通过在垃圾邮件过滤领域对该模型进行实际验证表明,贝叶斯模型的分类效率有明显提高,而且分类性能更加稳定,证明该方法不仅可以有效去除冗余属性,而且为条件属性赋予的权值较之传统加权方法更加合理。 展开更多
关键词 加权朴素贝叶斯 决策表 属性约简 对数条件似然估计 垃圾邮件过滤
下载PDF
基于特征项区分度的加权朴素贝叶斯邮件过滤方法 被引量:1
2
作者 王辉 刘淑芬 《计算机应用与软件》 CSCD 2015年第10期67-71,81,共6页
如何高效地特征提取和分类算法设计是衡量基于内容邮件过滤技术优缺点的关键。针对互信息MI(Mutual Information)特征提取算法和朴素贝叶斯分类算法,通过引入特征项区分度的概念,分析特征项在分类中区分能力之间的差异,进而提出一种兼... 如何高效地特征提取和分类算法设计是衡量基于内容邮件过滤技术优缺点的关键。针对互信息MI(Mutual Information)特征提取算法和朴素贝叶斯分类算法,通过引入特征项区分度的概念,分析特征项在分类中区分能力之间的差异,进而提出一种兼顾特征项区分度和互信息的特征提取算法。通过进一步将区分度添加到分类算法设计中,最终提出一种加权朴素贝叶斯算法,高效地解决基于内容邮件过滤问题。实验结果证明,改进后的算法在召回率、精确率和正确率上均有明显提高,且分类性能更加稳定。 展开更多
关键词 垃圾邮件 特征提取 特征项区分度 加权朴素贝叶斯
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部