期刊文献+
共找到869篇文章
< 1 2 44 >
每页显示 20 50 100
使用机器学习方法进行新闻的情感自动分类 被引量:107
1
作者 徐军 丁宇新 王晓龙 《中文信息学报》 CSCD 北大核心 2007年第6期95-100,共6页
本文主要研究机器学习方法在新闻文本的情感分类中的应用,判断其是正面还是负面。我们利用朴素贝叶斯和最大熵方法进行新闻及评论语料的情感分类研究。实验表明,机器学习方法在基于情感的文本分类中也能取得不错的分类性能,最高准确率... 本文主要研究机器学习方法在新闻文本的情感分类中的应用,判断其是正面还是负面。我们利用朴素贝叶斯和最大熵方法进行新闻及评论语料的情感分类研究。实验表明,机器学习方法在基于情感的文本分类中也能取得不错的分类性能,最高准确率能达到90%。同时我们也发现,对于基于情感的文本分类,选择具有语义倾向的词汇作为特征项、对否定词正确处理和采用二值作为特征项权重能提高分类的准确率。总之,基于情感的文本分类是一个更具挑战性的工作。 展开更多
关键词 计算机应用 中文信息处理 文本分类 情感分析 贝叶斯 最大熵
下载PDF
一种限定性的双层贝叶斯分类模型 被引量:44
2
作者 石洪波 王志海 +1 位作者 黄厚宽 励晓健 《软件学报》 EI CSCD 北大核心 2004年第2期193-199,共7页
朴素贝叶斯分类模型是一种简单而有效的分类方法,但它的属性独立性假设使其无法表达属性变量间存在的依赖关系,影响了它的分类性能.通过分析贝叶斯分类模型的分类原则以及贝叶斯定理的变异形式,提出了一种基于贝叶斯定理的新的分类模型D... 朴素贝叶斯分类模型是一种简单而有效的分类方法,但它的属性独立性假设使其无法表达属性变量间存在的依赖关系,影响了它的分类性能.通过分析贝叶斯分类模型的分类原则以及贝叶斯定理的变异形式,提出了一种基于贝叶斯定理的新的分类模型DLBAN(double-level Bayesian network augmented naive Bayes).该模型通过选择关键属性建立属性之间的依赖关系.将该分类方法与朴素贝叶斯分类器和TAN(tree augmented naive Bayes)分类器进行实验比较.实验结果表明,在大多数数据集上,DLBAN分类方法具有较高的分类正确率. 展开更多
关键词 朴素贝叶斯 TAN(tree AUGMENTED naive bayes) 叶斯定理 依赖关系
下载PDF
基于朴素贝叶斯的文本分类研究综述 被引量:70
3
作者 贺鸣 孙建军 成颖 《情报科学》 CSSCI 北大核心 2016年第7期147-154,共8页
文本自动分类是自然语言处理领域的重要分支之一,已经形成了大量的模型以及算法,其中基于朴素贝叶斯的相关研究是该领域持续的热点。本文对基于朴素贝叶斯的文本自动分类研究进行了系统的综述。探讨了多项式模型和多元伯努利模型等经典... 文本自动分类是自然语言处理领域的重要分支之一,已经形成了大量的模型以及算法,其中基于朴素贝叶斯的相关研究是该领域持续的热点。本文对基于朴素贝叶斯的文本自动分类研究进行了系统的综述。探讨了多项式模型和多元伯努利模型等经典的朴素贝叶斯分类方法。重点分析了经典的特征选择方法以及包括ALOFT等在内的多种改进的特征选择方法。论文还对从加权、避免平滑等视角的NB改进算法进行了梳理。最后,提出了进一步改进NB的主要思路。 展开更多
关键词 自动分类 朴素贝叶斯 特征选择 特征过滤
原文传递
一种新型朴素贝叶斯文本分类算法 被引量:51
4
作者 邸鹏 段利国 《数据采集与处理》 CSCD 北大核心 2014年第1期71-75,共5页
针对在文本分类中先验概率的计算比较费时而且对分类效果影响不大、后验概率的精度损失影响分类准确率的现象,对经典朴素贝叶斯分类算法进行了改进,提出了一种"先抑后扬"(抑制先验概率的作用,扩大后验概率的影响)的文本分类... 针对在文本分类中先验概率的计算比较费时而且对分类效果影响不大、后验概率的精度损失影响分类准确率的现象,对经典朴素贝叶斯分类算法进行了改进,提出了一种"先抑后扬"(抑制先验概率的作用,扩大后验概率的影响)的文本分类算法。算法中去掉了对先验概率的计算,并在后验概率的计算中引入了一个放大系数。实验结果表明,分类时不计算先验概率对分类精度影响甚微但可以明显加快分类的速度,在后验概率的计算中引入放大系数减少了误差传播的影响,提高了分类精度。 展开更多
关键词 文本分类 朴素贝叶斯 先验概率 后验概率
下载PDF
基于贝叶斯模型的移动环境下网络舆情用户情感演化研究——以新浪微博“里约奥运会中国女排夺冠”话题为例 被引量:39
5
作者 王晰巍 张柳 +1 位作者 文晴 王楠阿雪 《情报学报》 CSSCI CSCD 北大核心 2018年第12期1241-1248,共8页
了解和掌握移动环境下网络舆情用户情感演化规律及构建情感演化模型,对相关部门加强移动环境下网络舆情信息监管和正确引导网络舆情走向具有重要意义。本文基于朴素贝叶斯模型,以训练词向量、文本预处理、训练朴素贝叶斯、性能测评为处... 了解和掌握移动环境下网络舆情用户情感演化规律及构建情感演化模型,对相关部门加强移动环境下网络舆情信息监管和正确引导网络舆情走向具有重要意义。本文基于朴素贝叶斯模型,以训练词向量、文本预处理、训练朴素贝叶斯、性能测评为处理过程,从词频、地域和时间三个可视化维度构建基于移动环境下网络舆情用户评论情感分析模型;以新浪微博"里约奥运会中国女排夺冠"话题为例进行可视化分析情感演化过程研究。本文所构建的情感分析模型能有效运用于移动环境下网络舆情用户情感演化研究,实证研究结果表明新浪微博用户对"里约奥运会中国女排夺冠"话题主要呈现正向情感,同时直辖市、沿海省份等经济发达地区相比西南地区、东北地区等经济欠发达省份对话题态度更加乐观。 展开更多
关键词 移动环境 网络舆情用户 情感演化 朴素贝叶斯
下载PDF
WRSR与改进朴素贝叶斯融合的变压器故障诊断技术研究 被引量:39
6
作者 朱保军 咸日常 +3 位作者 范慧芳 刘兴华 高鸿鹏 陈蕾 《电力系统保护与控制》 CSCD 北大核心 2021年第20期120-128,共9页
电力变压器的运行状态评估及其故障准确定位,一直是制约电网运行安全和设备运维效率的技术瓶颈。建立一种基于加权秩和比(Weighted Rank Sum Ratio,WRSR)并结合改进朴素贝叶斯网络的诊断模型,用以评估电力变压器整体运行状态,确定故障... 电力变压器的运行状态评估及其故障准确定位,一直是制约电网运行安全和设备运维效率的技术瓶颈。建立一种基于加权秩和比(Weighted Rank Sum Ratio,WRSR)并结合改进朴素贝叶斯网络的诊断模型,用以评估电力变压器整体运行状态,确定故障位置及具体故障类型。首先从多个变电站收集变压器的历年故障数据,并将其作为训练集,在改进朴素贝叶斯网络中建立起特征参量与故障位置、故障类型之间的非线性映射关系。结合某电网的具体变压器运行状态信息与检测数据,利用WRSR模型对具体变压器整体运行状态进行评价,然后将状态性能较差的变压器故障检测数据作为测试集代入至改进朴素贝叶斯网络中来预测故障位置。最终结果表明,所提模型能够实现对电力变压器状态的合理评价,又可在预测故障部位及故障类型时保持较高的准确率。 展开更多
关键词 变压器 WRSR 朴素贝叶斯 状态评估 故障位置
下载PDF
基于相关系数的加权朴素贝叶斯分类算法 被引量:32
7
作者 张明卫 王波 +1 位作者 张斌 朱志良 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第7期952-955,共4页
朴素贝叶斯分类算法的条件独立性假设在很少情况下能够满足,为了克服该问题,提出了一种基于相关系数的加权朴素贝叶斯分类模型.通过计算条件属性和决策属性之间的相关系数,对不同的条件属性赋予不同的权重,从而在保持简单性的基础上有... 朴素贝叶斯分类算法的条件独立性假设在很少情况下能够满足,为了克服该问题,提出了一种基于相关系数的加权朴素贝叶斯分类模型.通过计算条件属性和决策属性之间的相关系数,对不同的条件属性赋予不同的权重,从而在保持简单性的基础上有效地提高了朴素贝叶斯算法的分类性能.首先给出了基于相关系数的属性权值求解方法,然后描述了相应的算法,并对算法原理进行了分析与证明.通过在中医小儿肺炎病例数据集和UCI数据集上的仿真实验,验证了该方法的有效性. 展开更多
关键词 数据挖掘 分类算法 朴素贝叶斯 加权朴素贝叶斯 相关系数
下载PDF
贝叶斯分类算法在冠心病中医临床证型诊断中的应用 被引量:26
8
作者 孙亚男 宁士勇 +1 位作者 鲁明羽 陆玉昌 《计算机应用研究》 CSCD 北大核心 2006年第11期164-166,共3页
在中医药临床个体化诊疗信息平台的基础上,使用中医证型的辨证相关因素,利用信息增益算法进行辨证属性选择,并分别采用朴素贝叶斯和强属性集贝叶斯网络算法建立了中医冠心病临床证型诊断模型。实验结果表明该分类算法在中医冠心病临床... 在中医药临床个体化诊疗信息平台的基础上,使用中医证型的辨证相关因素,利用信息增益算法进行辨证属性选择,并分别采用朴素贝叶斯和强属性集贝叶斯网络算法建立了中医冠心病临床证型诊断模型。实验结果表明该分类算法在中医冠心病临床诊断模型中具有良好的分类性能。 展开更多
关键词 朴素贝叶斯 贝叶斯网络 数据挖掘 中医诊疗 冠心病
下载PDF
分析师文本语调会影响股价同步性吗?--基于利益相关者行为的中介效应检验 被引量:30
9
作者 吴武清 赵越 +1 位作者 闫嘉文 汪寿阳 《管理科学学报》 CSSCI CSCD 北大核心 2020年第9期108-126,共19页
文章考察了分析师研究报告的文本语调对股价同步性的影响与作用机制.首先爬取2006年至2018年中国A股上市公司377644份分析师研究报告,随机选出10434句文本并人工分为积极、中性、消极三类形成语料库,以此训练11种机器学习方法并比较各... 文章考察了分析师研究报告的文本语调对股价同步性的影响与作用机制.首先爬取2006年至2018年中国A股上市公司377644份分析师研究报告,随机选出10434句文本并人工分为积极、中性、消极三类形成语料库,以此训练11种机器学习方法并比较各方法的预测准确性,最终选择朴素贝叶斯方法估计出分析师研究报告的文本语调.实证分析发现,分析师积极的文本语调显著降低了所追踪公司的股价同步性.这一结果与已有多数研究结论不同,但在做空机制欠发达的中国资本市场,个体选择性知觉理论为此提供了很好的解释.进一步地,中介效应检验结果表明,分析师积极的文本语调通过激励公司发布更多公告、引导机构投资者买入和吸引其他分析师发布研究报告,显著降低了股价同步性.该研究对于投资者关注研报语调指标、上市公司加强信息披露、政府部门完善资本市场制度均具有重要启示. 展开更多
关键词 分析师文本语调 股价同步性 朴素贝叶斯 选择性知觉 中介效应
下载PDF
一种融合了基于朴素贝叶斯算法与情境感知的协同推荐系统——以大学图书馆实体图书推荐为例 被引量:29
10
作者 程秀峰 范晓莹 杨金庆 《现代情报》 CSSCI 2019年第2期57-65,共9页
[目的/意义]将情境感知技术引入图书馆以提高服务的智能化,已成为数字图书馆的发展趋势之一。为了提高情境感知模型中推荐结果的准确度。[方法/过程]本文研究并提出了一种融合了朴素贝叶斯算法与情景感知功能的协同推荐模型,并通过实验... [目的/意义]将情境感知技术引入图书馆以提高服务的智能化,已成为数字图书馆的发展趋势之一。为了提高情境感知模型中推荐结果的准确度。[方法/过程]本文研究并提出了一种融合了朴素贝叶斯算法与情景感知功能的协同推荐模型,并通过实验对推荐效果进行了评估。具体为:首先,获取用户的当前任务和情景信息,同时提取历史信息库用户的行为偏好;其次基于属性加权贝叶斯算法计算用户的行为相似度,继而进行协同推荐;通过计算目标情景中所有情景属性对所推荐资源的影响的权值,对协同推荐所得评分进行加权处理,形成最终的预测预测;最后通过实验对模型进行检验。[结果/结论]结果表明:使用该模型得出的推荐结果优于传统的协同推荐结果。因此该模型能够更好地为为个性化信息服务提供支持。 展开更多
关键词 情景感知 朴素贝叶斯 协同推荐 图书馆
下载PDF
基于自训练EM算法的半监督文本分类 被引量:17
11
作者 张博锋 白冰 苏金树 《国防科技大学学报》 EI CAS CSCD 北大核心 2007年第6期65-69,共5页
为了提高计算效率,提出基于自训练的改进EM算法STEM。在每步迭代的E-step中,将中间分类器最有把握对其类别进行预测的未标注样本转移至标注样本集,并应用到M-step中进行下一个中间分类器的训练,从而引入了利用中间结果的自训练机制。文... 为了提高计算效率,提出基于自训练的改进EM算法STEM。在每步迭代的E-step中,将中间分类器最有把握对其类别进行预测的未标注样本转移至标注样本集,并应用到M-step中进行下一个中间分类器的训练,从而引入了利用中间结果的自训练机制。文本分类实验表明STEM算法在大部分情况下的分类准确性都高于EM,并通过减少迭代提高了分类器学习的计算效率。 展开更多
关键词 半监督学习 EM算法 自训练 文本分类 naive bayes
下载PDF
次同步振荡在线监测的同步提取变换和朴素贝叶斯方法 被引量:28
12
作者 赵妍 崔浩瀚 荣子超 《电力系统自动化》 EI CSCD 北大核心 2019年第3期187-192,共6页
目前基于相量测量单元(PMU)实现次同步振荡在线辨识和告警存在的问题有:参数辨识一般只辨识频率、幅值,不辨识衰减因子;告警阈值的确定需要人为经验,导致告警判据的快速性和可靠性难以保证。针对上述问题,提出将同步提取变换(SET)和机... 目前基于相量测量单元(PMU)实现次同步振荡在线辨识和告警存在的问题有:参数辨识一般只辨识频率、幅值,不辨识衰减因子;告警阈值的确定需要人为经验,导致告警判据的快速性和可靠性难以保证。针对上述问题,提出将同步提取变换(SET)和机器学习方法——朴素贝叶斯(NB)方法相结合的次同步振荡在线监测方法。SET可以快速、准确地辨识出次同步振荡的模态参数,而NB方法可以自动实现次同步振荡在线预警。首先,通过SET对已有的历史次同步振荡数据进行辨识,将辨识得到的频率和衰减因子交由NB方法学习,并生成NB分类器。然后,当有新的PMU上传的振荡信号数据时,先采用SET辨识出振荡的频率和衰减因子,再将这些参数交由NB分类器来判断是否发生次同步振荡,并准确预警,从而实现对次同步振荡的在线监测。通过IEEE第二标准模型验证了所提方法的有效性。 展开更多
关键词 次同步振荡 在线监测 机器学习 同步提取变换 朴素贝叶斯
下载PDF
基于Kmeans++聚类的朴素贝叶斯集成方法研究 被引量:26
13
作者 钟熙 孙祥娥 《计算机科学》 CSCD 北大核心 2019年第B06期439-441,451,共4页
朴素贝叶斯方法简单、计算高效、精确度高,且具有坚实的理论基础,得到了广泛应用。文中针对差异性是集成学习的关键条件,提出了基于Kmeans++聚类技术来提高朴素贝叶斯分类器集成差异性的方法,从而提升了朴素贝叶斯的泛化性能。首先,通... 朴素贝叶斯方法简单、计算高效、精确度高,且具有坚实的理论基础,得到了广泛应用。文中针对差异性是集成学习的关键条件,提出了基于Kmeans++聚类技术来提高朴素贝叶斯分类器集成差异性的方法,从而提升了朴素贝叶斯的泛化性能。首先,通过训练样本集训练出多个朴素贝叶斯基分类器模型;然后,为了增大基分类器之间的差异性,利用Kmeans++算法对基分类器在验证集上的预测结果进行聚类;最后,从每个聚类簇中选择泛化性能最佳的基分类器进行集成学习,最终结果由简单投票法得出。利用UCI标准数据集对该方法进行验证,结果表明该方法的泛化性能得到了较大的提升。 展开更多
关键词 朴素贝叶斯 差异性 Kmeans++聚类 集成学习
下载PDF
基于改进特征加权的朴素贝叶斯分类算法 被引量:24
14
作者 丁月 汪学明 《计算机应用研究》 CSCD 北大核心 2019年第12期3597-3600,3627,共5页
传统朴素贝叶分类算法没有根据特征项的不同对其重要程度进行划分,使得分类结果不准确。针对这一问题,引入Jensen-Shannon(JS)散度,用JS散度来表示特征项所能提供的信息量,并针对JS散度存在的不足,从类别内与类别间的词频、文本频以及... 传统朴素贝叶分类算法没有根据特征项的不同对其重要程度进行划分,使得分类结果不准确。针对这一问题,引入Jensen-Shannon(JS)散度,用JS散度来表示特征项所能提供的信息量,并针对JS散度存在的不足,从类别内与类别间的词频、文本频以及用变异系数修正过的逆类别频率这三个方面考虑,对JS散度进行调整修正,最后计算出每一特征项的权值,将权值代入到朴素贝叶斯的公式中。通过与其他算法的对比实验证明,基于JS散度并从词、文本、类别三方面改进后的朴素贝叶斯算法的分类效果最好。因此基于JS散度特征加权的朴素贝叶斯分类算法与其他分类算法相比,其分类性能有很大提高。 展开更多
关键词 文本分类 朴素贝叶斯 JS散度 词频 文本频率 类别频率
下载PDF
朴素贝叶斯算法的改进与应用 被引量:24
15
作者 赵文涛 孟令军 +1 位作者 赵好好 王春春 《测控技术》 CSCD 2016年第2期143-147,共5页
朴素贝叶斯算法是分类算法中最经典、最有影响的算法之一,但仍然存在一些不足之处。针对该算法中下溢问题,对算法基本公式进行了优化改进。针对NB算法中准确率问题,结合类别核心词思想和改进后的TFIDF算法,提出了一种基于类别核心词和... 朴素贝叶斯算法是分类算法中最经典、最有影响的算法之一,但仍然存在一些不足之处。针对该算法中下溢问题,对算法基本公式进行了优化改进。针对NB算法中准确率问题,结合类别核心词思想和改进后的TFIDF算法,提出了一种基于类别核心词和改进型TFIDF的朴素贝叶斯CIT-NB算法。将改进后的算法应用于新闻数据集文本分类,实验结果表明,CIT-NB算法的分类性能明显优于原始朴素贝叶斯算法和基于TFIDF的分类算法。 展开更多
关键词 朴素贝叶斯 下溢 核心关键词 TFIDF 文本分类
下载PDF
基于迁移学习的软件缺陷预测 被引量:23
16
作者 程铭 毋国庆 袁梦霆 《电子学报》 EI CAS CSCD 北大核心 2016年第1期115-122,共8页
传统软件缺陷预测方法在解决跨项目缺陷预测过程中适应能力不足,主要是因为源项目和目标项目之间存在不同的特征分布.为了解决这个问题,提出一种新的加权贝叶斯迁移学习算法,算法首先收集训练数据和测试数据的特征信息,然后计算特征差异... 传统软件缺陷预测方法在解决跨项目缺陷预测过程中适应能力不足,主要是因为源项目和目标项目之间存在不同的特征分布.为了解决这个问题,提出一种新的加权贝叶斯迁移学习算法,算法首先收集训练数据和测试数据的特征信息,然后计算特征差异,将不同项目数据之间差异转化为训练数据权重,最后基于这些权重数据建立预测模型.在8个开源项目数据集上进行实验比较,实验结果表明与其他方法相比本文方法显著提高跨项目缺陷预测性能. 展开更多
关键词 软件缺陷预测 迁移学习 机器学习 朴素贝叶斯
下载PDF
煤矿安全知识图谱构建及智能查询方法研究 被引量:22
17
作者 刘鹏 叶帅 +2 位作者 舒雅 鹿晓龙 刘明明 《中文信息学报》 CSCD 北大核心 2020年第11期49-59,共11页
煤矿企业正从信息化建设向智能化迈进,以大数据、人工智能为代表的网络新技术已促进了矿山领域的智能化发展。但是由于煤矿领域数据信息的繁杂性,难以对其进行统一而高效地收集、信息挖掘,进而促进深一步的特定领域研究和应用。将知识... 煤矿企业正从信息化建设向智能化迈进,以大数据、人工智能为代表的网络新技术已促进了矿山领域的智能化发展。但是由于煤矿领域数据信息的繁杂性,难以对其进行统一而高效地收集、信息挖掘,进而促进深一步的特定领域研究和应用。将知识图谱技术初步引入煤矿安全领域,对相关知识概念分类建模,并基于图数据库存储,用实体关系图的方式直观地描述各类概念及概念之间的关系,然后基于初步构建的知识图谱,提出了一种自然语言知识查询方法。实验证明,该文提出的方法具有较高的查全率和查准率,基于Spark的并行朴素贝叶斯问题分类方法可以在保证准确率的同时,显著提升训练效率。该文工作为煤矿安全知识图谱构建及智能查询做了初步有益探索。 展开更多
关键词 煤矿安全 知识图谱 实体识别 知识查询 SPARK 朴素贝叶斯
下载PDF
机器学习算法在疾病风险预测中的应用与比较 被引量:22
18
作者 黄光成 周良 +8 位作者 石建伟 黄蛟灵 杨燕 陈宁 刘茜 巩昕 王朝昕 唐岚 俞文雅 《中国卫生资源》 北大核心 2020年第4期432-436,共5页
就最适合应用于疾病风险预测的4种机器学习经典算法,即支持向量机、BP(back propagation)神经网络、随机森林和朴素贝叶斯,对其在疾病风险预测中的前沿应用、方法学特征、优势、缺陷和适用条件进行综述,以期为更合理地应用机器学习方法... 就最适合应用于疾病风险预测的4种机器学习经典算法,即支持向量机、BP(back propagation)神经网络、随机森林和朴素贝叶斯,对其在疾病风险预测中的前沿应用、方法学特征、优势、缺陷和适用条件进行综述,以期为更合理地应用机器学习方法预测疾病风险提供方法学支持。 展开更多
关键词 机器学习 疾病风险预测 支持向量机 BP神经网络 随机森林 朴素贝叶斯
下载PDF
基于代价敏感的朴素贝叶斯不平衡数据分类研究 被引量:21
19
作者 蒋盛益 谢照青 余雯 《计算机研究与发展》 EI CSCD 北大核心 2011年第S1期387-390,共4页
传统数据挖掘分类算法在不平衡数据集上分类效果不佳,可以将代价敏感思想与传统分类算法相结合解决不平衡数据分类问题.但在代价敏感学习中,代价的确定需要足够的先验知识,难以把握.针对上述不足,构造针对不平衡数据分布的自适应代价函... 传统数据挖掘分类算法在不平衡数据集上分类效果不佳,可以将代价敏感思想与传统分类算法相结合解决不平衡数据分类问题.但在代价敏感学习中,代价的确定需要足够的先验知识,难以把握.针对上述不足,构造针对不平衡数据分布的自适应代价函数,引进全局代价矩阵,对传统的朴素贝叶斯分类算法进行改进.在UCI数据集上的实验结果表明,提出的基于代价敏感的朴素贝叶斯分类算法对于不平衡数据分类是有效可行的. 展开更多
关键词 代价敏感 朴素贝叶斯 不平衡数据分类
下载PDF
改进的朴素贝叶斯算法在垃圾邮件过滤中的研究 被引量:20
20
作者 杨雷 曹翠玲 +1 位作者 孙建国 张立国 《通信学报》 EI CSCD 北大核心 2017年第4期140-148,共9页
提出了一种利用支持向量机改进的朴素贝叶斯算法——TSVM-NB算法。首先利用NB算法对样本集进行初次训练,利用支持向量机构造一个最优分类超平面,每个样本根据与其距离最近样本的类型是否相同进行取舍,这样既降低样本空间规模,又提高每... 提出了一种利用支持向量机改进的朴素贝叶斯算法——TSVM-NB算法。首先利用NB算法对样本集进行初次训练,利用支持向量机构造一个最优分类超平面,每个样本根据与其距离最近样本的类型是否相同进行取舍,这样既降低样本空间规模,又提高每个样本类别的独立性,最后再次用朴素贝叶斯算法训练样本集从而生成分类模型。仿真实验结果表明,该算法在样本空间进行取舍过程当中消除了冗余属性,可以快速得到分类特征子集,提高了垃圾邮件过滤的分类速度、召回率和正确率。 展开更多
关键词 邮件过滤 朴素贝叶斯 支持向量机 修剪策略
下载PDF
上一页 1 2 44 下一页 到第
使用帮助 返回顶部