期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
基于分类集成的钓鱼网站智能检测系统 被引量:8
1
作者 庄蔚蔚 叶艳芳 +1 位作者 李涛 姜青山 《系统工程理论与实践》 EI CSSCI CSCD 北大核心 2011年第10期2008-2020,共13页
近来,通过仿冒真实网站的URL地址及其页面内容的"钓鱼网站"已严重威胁到互联网用户的隐私和财产安全.为了应对这种威胁,该文通过对大量已知正常网站和钓鱼网站的学习,解析其对应的网页内容,提取相应的网页标题、网页关键字、... 近来,通过仿冒真实网站的URL地址及其页面内容的"钓鱼网站"已严重威胁到互联网用户的隐私和财产安全.为了应对这种威胁,该文通过对大量已知正常网站和钓鱼网站的学习,解析其对应的网页内容,提取相应的网页标题、网页关键字、网页描述信息等8种特征来描述这些网站,然后基于不同的特征表达方法构建了相应的分类器;对于待检测的网站,采用分类集成的方法综合各个分类模型的预测结果,达到对钓鱼网站智能检测的目标.基于上述方法,构建了钓鱼网站智能检测系统IPWDS,并将其集成于金山安全产品中.在大量、真实数据集的基础上,实验结果表明IPWDS系统对钓鱼网站的检测效果优于现有常见的钓鱼网站检测方法和常用的反钓鱼软件. 展开更多
关键词 钓鱼网站 分类器 分类集成
原文传递
基于多视图分类集成的高铁工况识别 被引量:3
2
作者 郭超 杨燕 +1 位作者 江永全 宋祎 《山东大学学报(工学版)》 CAS 北大核心 2017年第1期7-14,共8页
针对传统方法识别高铁工况存在特征提取不完备和识别性能不精确的问题,提出一种多视图分类集成的高铁工况识别方法(MVCE)。该方法结合多视图特征提取和分类集成技术,从信号本身特性、频域和时频域三个角度提取小波能量、频谱系数、聚合... 针对传统方法识别高铁工况存在特征提取不完备和识别性能不精确的问题,提出一种多视图分类集成的高铁工况识别方法(MVCE)。该方法结合多视图特征提取和分类集成技术,从信号本身特性、频域和时频域三个角度提取小波能量、频谱系数、聚合经验模态分解模糊熵,并使用Fisher比率对其频域特征进行特征选择,从而构建高铁振动信号三个视图的特征。使用最小二乘支持向量机和K最近邻分类器分别对每个视图的特征进行初步识别。最后采用分类熵投票策略对多个分类器输出结果进行集成。试验结果表明:该方法对仿真数据和实验室数据的平均识别率分别达到89.18%和90.87%。同时对比结果说明了该方法提取特征的完备性和具有多样性集成模型的有效性。 展开更多
关键词 多视图 分类集成 高速列车 工况识别 特征提取
原文传递
一种新的模糊多球分类算法及其集成方法 被引量:2
3
作者 顾磊 吴慧中 肖亮 《计算机科学》 CSCD 北大核心 2008年第6期183-185,共3页
本文提出了一种新的模糊多球分类算法。该算法在训练阶段为每一个模式类构造多个球,覆盖其所有的训练样本,并且在识别阶段利用一个模糊隶属函数来归类测试样本。此外,在提出的分类算法的基础上,还给出了它的集成方法。最后,我们采用了... 本文提出了一种新的模糊多球分类算法。该算法在训练阶段为每一个模式类构造多个球,覆盖其所有的训练样本,并且在识别阶段利用一个模糊隶属函数来归类测试样本。此外,在提出的分类算法的基础上,还给出了它的集成方法。最后,我们采用了四个真实数据集进行实验,实验结果表明本文提出的算法具有较好的分类性能,是一种行之有效的分类算法。 展开更多
关键词 模式分类 山峰函数 模糊隶属函数 分类集成
下载PDF
一种基于核的模糊多球分类算法及其集成 被引量:1
4
作者 顾磊 吴慧中 肖亮 《计算机工程与应用》 CSCD 北大核心 2007年第27期10-12,25,共4页
提出了一种基于核的模糊多球分类算法,该算法在训练阶段为每一个模式类构造多个最小球覆盖其所有的训练样本,并且在识别阶段算法利用一个模糊隶属函数来归类测试样本。此外,在提出的分类算法的基础上,还给出了它的集成方法。最后,采用了... 提出了一种基于核的模糊多球分类算法,该算法在训练阶段为每一个模式类构造多个最小球覆盖其所有的训练样本,并且在识别阶段算法利用一个模糊隶属函数来归类测试样本。此外,在提出的分类算法的基础上,还给出了它的集成方法。最后,采用了4个真实数据集进行实验,实验结果表明该文提出的算法具有较好的分类性能,是一种行之有效的分类算法。 展开更多
关键词 模式分类 核函数 山峰函数 模糊隶属函数 分类集成
下载PDF
基于增强特征判别性的典型相关分析和分类集成的助学金预测方法 被引量:1
5
作者 张芳娟 杨燕 杜圣东 《计算机应用》 CSCD 北大核心 2018年第11期3150-3155,共6页
针对高校资助管理办法效率低下、工作量大等问题,提出一种增强特征判别性的典型相关分析(ENDCCA)方法,并结合分类集成方法实现高校学生助学金预测。将学生在校多维度数据划分为两个不同视图,已有的各种多视图判别典型相关分析算法没有... 针对高校资助管理办法效率低下、工作量大等问题,提出一种增强特征判别性的典型相关分析(ENDCCA)方法,并结合分类集成方法实现高校学生助学金预测。将学生在校多维度数据划分为两个不同视图,已有的各种多视图判别典型相关分析算法没有综合考虑视图类别之间的相关性和视图组合特征的判别性两者因素。ENDCCA的优化目标在最大化类内相关的同时最小化类间相关,并且考虑了视图组合特征的判别性,进一步强化了属性的判别性能,更有利于分类预测。高校学生助学金预测的实现过程:首先,根据学生生活行为和学习表现将数据预处理为两个不同视图,然后用EN-DCCA方法对这两个视图数据进行特征学习,最后用分类集成方法完成预测。在真实的数据集上进行实验,所提方法的预测准确率达到90.01%,较增强视图组合特征判别性的典型相关分析(CECCA)的集成方法提高了2个百分点,实验结果表明,所提方法能有效实现高校助学金预测。 展开更多
关键词 分类集成 多视图 典型相关分析 增强视图特征判别性
下载PDF
一种不平衡数据流集成分类模型 被引量:23
6
作者 欧阳震诤 罗建书 +1 位作者 胡东敏 吴泉源 《电子学报》 EI CAS CSCD 北大核心 2010年第1期184-189,共6页
针对不平衡数据流的分类问题,结合基于权重的集成分类器与抽样技术,本文提出了一种处理不平衡数据流集成分类器模型.理论分析与实验验证表明,该集成分类器具有更低的计算复杂度,更能适应存在概念漂移的不平衡数据流挖掘分类,其整体分类... 针对不平衡数据流的分类问题,结合基于权重的集成分类器与抽样技术,本文提出了一种处理不平衡数据流集成分类器模型.理论分析与实验验证表明,该集成分类器具有更低的计算复杂度,更能适应存在概念漂移的不平衡数据流挖掘分类,其整体分类性能优于基于权重的集成分类器模型,能明显提升少数类的分类精度. 展开更多
关键词 分类 集成分类器 不平衡数据流 概念漂移
下载PDF
基于惩罚的SVM和集成学习的非平衡数据分类算法研究 被引量:6
7
作者 刘进军 《计算机应用与软件》 CSCD 北大核心 2014年第1期186-190,共5页
利用各类算法对非平衡数据进行处理已成为数据挖掘领域研究的热问题。针对非平衡数据的特点,在研究支持向量机的相关理论及K-SVM算法基础上,提出基于惩罚机制的PFKSVM(K-SVMbased on penalty factor)算法,克服K-SVM在最优分类面附近易... 利用各类算法对非平衡数据进行处理已成为数据挖掘领域研究的热问题。针对非平衡数据的特点,在研究支持向量机的相关理论及K-SVM算法基础上,提出基于惩罚机制的PFKSVM(K-SVMbased on penalty factor)算法,克服K-SVM在最优分类面附近易发生错分的问题;并提出由重构采样层、基本训练层和综合判定层组成的集成学习模型。利用UCI公共数据集的实验验证了PFKSVM算法及集成模型在处理非平衡数据分类时的优势。 展开更多
关键词 数据挖掘 支持向量机(SVM) 非平衡数据分类集成学习
下载PDF
基于MultiBoost的最小分类误差算法 被引量:2
8
作者 王元珍 乐树彬 《小型微型计算机系统》 CSCD 北大核心 2005年第11期1948-1950,共3页
基于MultiBoost分类组装技术,提出了一种用增量交叉验证技术求MultiBoost最小分类误差的算法,以使之在指定分类器数量T的范围内找出具有最小分类误差的合成分类器.
关键词 分类组装算法 最小分类误差 MultiBoost Wagging BAGGING ADABOOST
下载PDF
基于特征提取的分类集成在脾虚证诊断中的应用 被引量:4
9
作者 邹永杰 周继鹏 +2 位作者 王桂香 林传权 陈蔚文 《计算机应用与软件》 CSCD 2010年第3期22-25,共4页
数据挖掘技术在中医辅助诊断中被日益重视,计算机辅助诊断本质上是一个数据挖掘分类任务。针对中医临床数据的模糊性和不完整性,提出了一种基于特征提取的分类集成模型。这种模型能将扰动训练数据和扰动输入属性结合起来,生成精确且差... 数据挖掘技术在中医辅助诊断中被日益重视,计算机辅助诊断本质上是一个数据挖掘分类任务。针对中医临床数据的模糊性和不完整性,提出了一种基于特征提取的分类集成模型。这种模型能将扰动训练数据和扰动输入属性结合起来,生成精确且差异度大的个体分类器。与单个分类器和其他集成方法的对比实验,证明这种新模型在脾虚证辅助诊断上有更低的错误率。进一步的实验显示特征提取在这种新模型中对降低错误率有显著的作用。 展开更多
关键词 分类集成 特征提取 计算机辅助诊断 脾虚证
下载PDF
基于磁共振影像特征集成融合的AD诊断 被引量:2
10
作者 李勇明 吕洋 +4 位作者 李帆 王品 邱明国 刘书君 闫瑾 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2016年第2期271-276,共6页
为了得到更高更稳定的阿尔茨海默病(AD)诊断准确率,对脑磁共振影像纹理特征进行了集成融合,并用于AD分类诊断.首先,基于病理知识提取脑磁共振影像中左右脑相关解剖结构的体积、纹理特征;然后,采用链式智能体遗传算法与支持向量机相结合... 为了得到更高更稳定的阿尔茨海默病(AD)诊断准确率,对脑磁共振影像纹理特征进行了集成融合,并用于AD分类诊断.首先,基于病理知识提取脑磁共振影像中左右脑相关解剖结构的体积、纹理特征;然后,采用链式智能体遗传算法与支持向量机相结合的封装式特征选择分类集成模型,对提取的特征集进行特征选择,从而实现融合;最后,利用融合后的特征进行分类诊断,并将融合后的分类结果与融合前以及采用p值法特征选择的分类结果进行对比.实验结果表明,相比融合前的特征以及采用p值法进行选择的特征,利用所提算法融合后的特征具有更高且更稳定的分类准确率、灵敏度和特异度. 展开更多
关键词 磁共振影像 阿尔茨海默病 影像特征融合 特征选择分类集成模型 链式智能体遗传算法 支持向量机
下载PDF
一种不平衡数据集成分类方法 被引量:2
11
作者 王思晨 丁家满 《软件导刊》 2018年第8期76-80,84,共6页
不平衡数据在各个应用领域普遍存在。在处理不平衡数据时,破坏原始数据的分布特点和丢弃多数类样本的潜在信息都会降低分类精度,为此,提出一种不平衡数据集成分类方法。从多数类样本中依据计算得到的综合权重进行随机采样,并与少数类样... 不平衡数据在各个应用领域普遍存在。在处理不平衡数据时,破坏原始数据的分布特点和丢弃多数类样本的潜在信息都会降低分类精度,为此,提出一种不平衡数据集成分类方法。从多数类样本中依据计算得到的综合权重进行随机采样,并与少数类样本组成新的训练样本子集;为了保证基分类器的差异性,将投影得到的不同样本子集作为各个基分类器的训练样本,通过多分类器集成学习获得最终分类结果;在UCI数据集下进行实验。结果表明,该方法不仅能够提高少数类样本的分类性能,而且能够有效提高整体分类精度。 展开更多
关键词 不平衡数据 分类 集成学习 综合权重
下载PDF
金融危机预警模型与先导指标选择 被引量:13
12
作者 王克达 《金融监管研究》 CSSCI 北大核心 2019年第8期84-100,共17页
经济全球化和金融自由化的不断深入,加剧了金融危机的爆发频率和危害程度。全球金融危机后,金融危机早期预警成为必要且紧迫的问题。本文基于1970-2011年全球各国金融危机数据,分别使用Logit模型、二元分类树模型、Bagging和随机森林模... 经济全球化和金融自由化的不断深入,加剧了金融危机的爆发频率和危害程度。全球金融危机后,金融危机早期预警成为必要且紧迫的问题。本文基于1970-2011年全球各国金融危机数据,分别使用Logit模型、二元分类树模型、Bagging和随机森林模型,对系统性银行危机、货币危机和主权债务危机的预警进行了研究,比较和分析了不同模型的预警效果。结果表明:随机森林模型的预警效果最好,其后分别是Bagging、Logit模型和二元分类树;针对亚洲金融危机、阿根廷金融危机以及全球金融危机的样本外预测,随机森林模型的预测精度均优于Logit模型;随机森林能够有效识别金融危机先导指标。不同类型的金融危机,先导指标存在差异,但是关联性更强,因此危机的爆发可能不局限于单一形式。本文的研究为我国金融危机预警提供了参考,当前应警惕高杠杆问题逐步引发银行业系统性风险的问题。 展开更多
关键词 金融危机 预警模型 分类树组合 先导指标
下载PDF
基于神经网络集成的WEB文档分类研究 被引量:4
13
作者 周朴雄 《图书情报工作》 CSSCI 北大核心 2008年第7期110-112,共3页
将神经网络集戍思想引入Web文本分类领域,构造一个用于Web文本分类的多BP神经网络集成模型:详述模型的设计思路与结构框架,并分别在公有的英文数据集、实际的中文数据集上进行分类实验:与经典的SVM模型、KNN模型相比,神经网络集成模型... 将神经网络集戍思想引入Web文本分类领域,构造一个用于Web文本分类的多BP神经网络集成模型:详述模型的设计思路与结构框架,并分别在公有的英文数据集、实际的中文数据集上进行分类实验:与经典的SVM模型、KNN模型相比,神经网络集成模型具有更高的分类精度,且对于训练样本集规模具有更好的鲁棒性,不失为一种高效的文本分类新方法,研究其在文本分类领域的应用将是一个有前景的方向。 展开更多
关键词 文本分类 神经网络集成 精度
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部