期刊文献+
共找到46篇文章
< 1 2 3 >
每页显示 20 50 100
数据流挖掘分类技术综述 被引量:41
1
作者 王涛 李舟军 +1 位作者 颜跃进 陈火旺 《计算机研究与发展》 EI CSCD 北大核心 2007年第11期1809-1815,共7页
数据流挖掘作为从连续不断的数据流中挖掘有用信息的技术,近年来正成为数据挖掘领域的研究热点,并有着广泛的应用前景.数据流具有数据持续到达、到达速度快、数据规模巨大等特点,因此需要新颖的算法来解决这些问题.而数据流挖掘的分类... 数据流挖掘作为从连续不断的数据流中挖掘有用信息的技术,近年来正成为数据挖掘领域的研究热点,并有着广泛的应用前景.数据流具有数据持续到达、到达速度快、数据规模巨大等特点,因此需要新颖的算法来解决这些问题.而数据流挖掘的分类技术更是当前的研究热点.综述了当前国际上关于数据流挖掘分类算法的研究现状,并从数据平稳分布和带概念漂移两个方面对这些方法进行了系统的介绍与分析,最后对数据流挖掘分类技术当前所面临的问题和发展趋势进行了总结和展望. 展开更多
关键词 数据流 挖掘 分类 稳态分布 概念漂移
下载PDF
混合式朴素贝叶斯分类模型 被引量:8
2
作者 董立岩 刘光远 +2 位作者 苑森淼 李永丽 孙铭会 《吉林大学学报(信息科学版)》 CAS 2007年第1期57-61,共5页
为了降低朴素贝叶斯分类模型的独立性假设约束,提出一种混合式朴素贝叶斯分类模型(MBN:Mixed Naive Bayes)。通过分析贝叶斯定理,把条件属性集合划分成若干个独立的属性子集,用树增广朴素贝叶斯分类对属性子集分别进行分类学习,通过公... 为了降低朴素贝叶斯分类模型的独立性假设约束,提出一种混合式朴素贝叶斯分类模型(MBN:Mixed Naive Bayes)。通过分析贝叶斯定理,把条件属性集合划分成若干个独立的属性子集,用树增广朴素贝叶斯分类对属性子集分别进行分类学习,通过公式进行整合。将该模型算法与朴素贝叶斯及树增广朴素贝叶斯进行实验比较,实验结果表明MBN分类器在多数数据集上具有较高的分类正确率。 展开更多
关键词 贝叶斯定理 朴素贝叶斯 数据挖掘 分类
下载PDF
面向不平衡数据分类的KFDA-Boosting算法 被引量:9
3
作者 王来 樊重俊 +1 位作者 杨云鹏 袁光辉 《计算机应用研究》 CSCD 北大核心 2019年第3期807-811,共5页
数据分布的不平衡性和数据特征的非线性增加了分类的困难,特别是难以识别不平衡数据中的少数类,从而影响整体的分类效果。针对该问题,结合KFDA(kernel Fisher discriminant analysis)能有效提取样本非线性特征的特性和集成学习中Boostin... 数据分布的不平衡性和数据特征的非线性增加了分类的困难,特别是难以识别不平衡数据中的少数类,从而影响整体的分类效果。针对该问题,结合KFDA(kernel Fisher discriminant analysis)能有效提取样本非线性特征的特性和集成学习中Boosting算法的思想,提出了KFDA-Boosting算法。为了验证该算法对不平衡数据分类的有效性和优越性,以G-mean值、少数类的查准率与查全率作为分类效果的评价指标,选取了UCI中10个数据集测试KFDA-Boosting算法性能,并与支持向量机等六种分类算法进行对比实验。结果表明,对于不平衡数据分类,尤其是对不平衡度较大或呈非线性特征的数据,相比于其他分类算法,KFDA-Boosting算法能有效地识别少数类,并且在整体上具有显著的分类效果和较好的稳定性。 展开更多
关键词 核费希尔判别分析 集成学习 不平衡数据 分类
下载PDF
基于数据挖掘的入侵检测技术研究 被引量:6
4
作者 邹宏 陈海 魏勍颋 《计算机与现代化》 2005年第4期39-41,共3页
数据挖掘方法可以处理庞大的日志审计和网络数据,并能更快地提取入侵模式。提取网络入侵模式所用的主要有分类算法、关联规则算法和序列规则算法等。本文对基于数据挖掘的入侵检测的基本思想和技术等作了讨论,介绍了一个基于数据挖掘的... 数据挖掘方法可以处理庞大的日志审计和网络数据,并能更快地提取入侵模式。提取网络入侵模式所用的主要有分类算法、关联规则算法和序列规则算法等。本文对基于数据挖掘的入侵检测的基本思想和技术等作了讨论,介绍了一个基于数据挖掘的入侵检测实例,提出了今后入侵检测的研究方向。 展开更多
关键词 入侵检测 数据挖掘 分类 关联规则 序列规则
下载PDF
基于支持向量数据描述的数据约简 被引量:6
5
作者 郑晓星 吴今培 《现代电子技术》 2007年第2期74-76,共3页
提出了一种基于支持向量数据描述(SVDD)的数据约简方法,该方法利用一类学习算法SVDD的特性,通过迭代优化运算有效地实现了对原始训练样本数据的约简。实验数据的结果表明,该方法简单易行,具有稳定性和准确性,能大大缩减原始训练集规模... 提出了一种基于支持向量数据描述(SVDD)的数据约简方法,该方法利用一类学习算法SVDD的特性,通过迭代优化运算有效地实现了对原始训练样本数据的约简。实验数据的结果表明,该方法简单易行,具有稳定性和准确性,能大大缩减原始训练集规模的同时保持原分类问题的识别精度。 展开更多
关键词 支持向量机 支持向量数据描述 数据约简 分类
下载PDF
维度汇总性问题及其对策 被引量:4
6
作者 陆昌辉 刘青宝 +1 位作者 邓苏 张维明 《国防科技大学学报》 EI CAS CSCD 北大核心 2006年第4期83-87,共5页
在联机分析处理中,为了提高查询的响应速度,预聚合是一种常用的方法,但在已有的研究中,关于维度汇总性的研究还相当少。从维度汇总性的基本概念及其分类出发,对维度汇总性的判断方法进行了研究,最后还给出了处理维度汇总性问题时的一些... 在联机分析处理中,为了提高查询的响应速度,预聚合是一种常用的方法,但在已有的研究中,关于维度汇总性的研究还相当少。从维度汇总性的基本概念及其分类出发,对维度汇总性的判断方法进行了研究,最后还给出了处理维度汇总性问题时的一些对策。 展开更多
关键词 数据仓库 OLAP 汇总 分类 判断方法 对策
下载PDF
一种基于ALO-SVM算法的入侵检测方法 被引量:6
7
作者 陈卓 单欣欣 《现代电子技术》 北大核心 2020年第10期79-82,共4页
入侵检测一直是网络安全领域的热点研究方向,为了提高网络入侵检测的速度和准确性,提出一种在PCA降维的基础上,基于蚁狮优化算法(The Ant Lion Optimizer,ALO)和支持向量机(Support Vector Machine,SVM)相结合的入侵检测方法。该算法首... 入侵检测一直是网络安全领域的热点研究方向,为了提高网络入侵检测的速度和准确性,提出一种在PCA降维的基础上,基于蚁狮优化算法(The Ant Lion Optimizer,ALO)和支持向量机(Support Vector Machine,SVM)相结合的入侵检测方法。该算法首先利用主成分分析法(Principal Component Analysis,PCA)对数据进行降维处理以去除冗余数据,并利用ALO算法优化SVM的参数,然后根据优化后的SVM建立入侵检测模型,最后利用由PCA处理过的KDDCUP99数据集验证检测模型。实验结果表明,所提方法相较于简单的ALO优化SVM和PSO-SVM算法,在提高正确率的基础上,检测速度有显著提高。 展开更多
关键词 入侵检测 数据处理 检测模型建立 蚁狮优化算法 支持向量机 分类测试
下载PDF
自组织神经网络在CRM中的应用 被引量:4
8
作者 韩毅 陈建 +2 位作者 吕英华 谷文祥 张靖波 《东北师大学报(自然科学版)》 CAS CSCD 北大核心 2006年第1期31-35,共5页
提出了一种利用自组织神经网络来进行海量数据的挖掘和分类归纳的方法,该网络实现简单,反应速度较快,而且分类准确,冗余性强,对企业决策具有指导意义.
关键词 数据分类 神经网络 自组织神经网络 CRM
下载PDF
基于MSP430单片机的数据分离器设计 被引量:4
9
作者 唐松柏 席隆 《国外电子测量技术》 2012年第7期48-51,共4页
介绍了面向空间科学应用的实验机柜内数据分离器的设计方案。该方案使用MSP430单片机的中断优先级及低功耗特性和串口技术,通过制定相应的通信协议,设计出了一种数据分离系统。该系统实现了离心机上位机对离心机和步进电机的有效控制。... 介绍了面向空间科学应用的实验机柜内数据分离器的设计方案。该方案使用MSP430单片机的中断优先级及低功耗特性和串口技术,通过制定相应的通信协议,设计出了一种数据分离系统。该系统实现了离心机上位机对离心机和步进电机的有效控制。该控制器已经应用于实验机柜内。经实验证明,该数据分离器可以对离心机的转速、步进电机的位移量等参数进行控制和调整。 展开更多
关键词 数据分离 串口通信 低功耗 MSP430单片机
下载PDF
数据挖掘技术在特色资源库中的应用 被引量:3
10
作者 蔡璐 《计算技术与自动化》 2018年第3期137-140,共4页
提出了一种基于数据挖掘技术的文献自动推荐系统架构,分析了系统实现的关键技术,并完成了系统模块化设计和算法实现。经实践验证,该推荐系统在特色资源库中具有良好的文献推荐效果和广阔的应用前景。
关键词 数据挖掘 关联规则 分类规则 个性化服务
下载PDF
一种基于并行免疫网络的大数据分类算法 被引量:3
11
作者 范大鹏 张凤斌 《江苏大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第5期581-585,共5页
为了解决数据量增加时串行免疫网络算法难以实现大数据处理的问题,提出了并行免疫网络训练和分类模型,并在Spark并行框架下设计了并行免疫网络分类算法.给出了入侵检测大数据背景知识;建立了Ainet并行算法框架,详述了并行免疫网络分类... 为了解决数据量增加时串行免疫网络算法难以实现大数据处理的问题,提出了并行免疫网络训练和分类模型,并在Spark并行框架下设计了并行免疫网络分类算法.给出了入侵检测大数据背景知识;建立了Ainet并行算法框架,详述了并行免疫网络分类算法步骤;采用cup99入侵检测数据集进行了试验,进而将并行Ainet算法同其他算法做了比较.试验结果表明:较串行Ainet算法,并行Ainet算法训练时间下降了11/12,检测时间降低了19/20,准确率提高了10%,同时检测率提高了5%,而误报率降低了20%,可见并行Ainet算法各方面都取得较好的效果;试验验证了分类效果对训练数据集数量敏感的特点;并行Ainet算法在准确率、检测率和误报率方面优于其他算法,但运行时间较长. 展开更多
关键词 大数据 并行运算 免疫网络 分类 入侵检测
下载PDF
基于AM系统的船舶产品数据管理 被引量:2
12
作者 宁建江 梁润标 《广东造船》 2010年第3期27-30,共4页
本文主要介绍在AVEVA公司最新的三维船舶产品设计平台AM(AVEVA MARINE)系统上,如何进行电气舾装方面的产品数据管理。并着重介绍船舶电气专业如何在AM及PDM平台上进行产品设计,如何进行数据提取和二次开发,以及PDM上的主要功能:如数据管... 本文主要介绍在AVEVA公司最新的三维船舶产品设计平台AM(AVEVA MARINE)系统上,如何进行电气舾装方面的产品数据管理。并着重介绍船舶电气专业如何在AM及PDM平台上进行产品设计,如何进行数据提取和二次开发,以及PDM上的主要功能:如数据管理,托盘划分,报表输出,设计变更等。 展开更多
关键词 AM GLS—PDM 数据管理 托盘划分 设计变更 数据提取 创建模型
下载PDF
多概念层次上基于赋范划分距离的分类算法
13
作者 许骏 柳泉波 《计算机工程》 CAS CSCD 北大核心 2001年第7期67-68,117,共3页
应用知识发现理论与方法从大型考生信息数据库中提取隐含的、前所未知的、对决策有潜在价值的知识和规则,是当前计算机教育 应用的新课题。根据网上远程考试与评价系统的特点,讨论了挖掘的目标规则类型及其挖掘算法。针对算法的不足,... 应用知识发现理论与方法从大型考生信息数据库中提取隐含的、前所未知的、对决策有潜在价值的知识和规则,是当前计算机教育 应用的新课题。根据网上远程考试与评价系统的特点,讨论了挖掘的目标规则类型及其挖掘算法。针对算法的不足,提出了一种新的分ID3类算法多概念层次上基于赋范划分距离的分类算法,简要介绍了在知识发现过程中的应用。 展开更多
关键词 知识发现 数据挖掘 赋范划分距离 分类算法 数据库 远程考试系统 INTERNET
下载PDF
分类挖掘方法在银行不良贷款信用风险评估中的应用 被引量:1
14
作者 李勇 赵金涛 《工业工程》 2008年第6期125-129,共5页
针对我国商业银行面临的不良贷款信用风险问题,提出了一种基于数据挖掘技术的决策树模型方法,对不良贷款信用风险问题进行预测分类。详细介绍了决策树模型的建立方法并且用实例结果表明该模型在预测银行不良贷款信用风险中的实用价值。
关键词 银行 信用风险 数据挖掘 预测分类
下载PDF
保险管理信息系统中决策模型的设计与实现 被引量:1
15
作者 杜左强 《哈尔滨商业大学学报(自然科学版)》 CAS 2006年第4期80-83,87,共5页
研究如何用数据挖掘方法获得营销管理决策模型,并简要介绍了为分析、预测保险公司的营销目标,系统所提供的辅助决策模型和采用的加权熵决策树分类算法的设计与实现.
关键词 数据挖掘 决策树 分类算法 加权熵
下载PDF
基于改进KNN的消费者评价信息情感分类研究 被引量:2
16
作者 刘晓菲 丁香乾 +2 位作者 石硕 李林春 李忠态 《微型机与应用》 2014年第24期81-83,86,共4页
面对大数据时代消费者评价的海量信息,为了识别消费者评价信息的情感倾向,及时掌握消费者的评价信息反馈,采用K-近邻(KNN)算法对消费者评价信息进行情感分类,但是该算法在文本分类过程中因文本特征向量的维度高,使得算法的时间复杂度和... 面对大数据时代消费者评价的海量信息,为了识别消费者评价信息的情感倾向,及时掌握消费者的评价信息反馈,采用K-近邻(KNN)算法对消费者评价信息进行情感分类,但是该算法在文本分类过程中因文本特征向量的维度高,使得算法的时间复杂度和空间复杂度较高,计算的开销很大。针对这一问题,通过对获取信息的文本结构以及情感表达特点的分析,采用一种改进的KNN算法进行文本情感分类。在对消费者评价信息进行分类时,先由潜在语义分析算法对文本特征向量进行降维处理,然后利用加权KNN算法进行分类。实验结果表明,该方法在提高文本分类速度的同时保持了良好的分类效果。 展开更多
关键词 大数据 特征降维 LSA算法 KNN算法 情感分类
下载PDF
自然资源数据资源目录编制研究 被引量:2
17
作者 刘皓宇 吴洪涛 +3 位作者 周俊杰 张子平 贾萍 周舟 《自然资源信息化》 2022年第5期52-57,共6页
本文旨在为自然资源行业开展自然资源数据资源调查、摸清数据资源家底、编制统一的自然资源数据资源目录提供思路。通过分析自然资源数据现状和借鉴自然资源领域相关数据现行分类标准规范,研究提出了符合自然资源数据资源特性的线性分... 本文旨在为自然资源行业开展自然资源数据资源调查、摸清数据资源家底、编制统一的自然资源数据资源目录提供思路。通过分析自然资源数据现状和借鉴自然资源领域相关数据现行分类标准规范,研究提出了符合自然资源数据资源特性的线性分类方法并构建形成覆盖自然资源数据全集的大类、中类、小类自然资源数据资源分类体系,明确了自然资源数据资源目录元数据编制内容,为加快构建形成统一的自然资源数据资源目录体系提供了重要基础。 展开更多
关键词 自然资源 数据资源 分类 编码 目录
下载PDF
基于豆瓣影评的文本情感分析 被引量:2
18
作者 李俊华 程婉玉 《汉江师范学院学报》 2021年第6期80-86,共7页
大数据时代产生了大量的文本数据,由于数据源的不同以及产生数据过程的复杂性,造成了大量的数据具有异质结构.将几种最新的机器学习方法与分层技术结合,针对具有异质结构的文本数据的算法.提高文本分类的精准率.实证数据分析表明我们提... 大数据时代产生了大量的文本数据,由于数据源的不同以及产生数据过程的复杂性,造成了大量的数据具有异质结构.将几种最新的机器学习方法与分层技术结合,针对具有异质结构的文本数据的算法.提高文本分类的精准率.实证数据分析表明我们提出的算法在提高分类精确度上有很显著的效果. 展开更多
关键词 文本数据 分类 机器学习 分层抽样
下载PDF
新的聚类中心构造算法及类别判定方法 被引量:1
19
作者 令狐大智 李陶深 《计算机工程与设计》 CSCD 北大核心 2008年第9期2320-2323,共4页
从解决数据集合对应的图形不规则性问题出发,提出虚拟数字实体化观点,并在此基础上提出基于相互约束的4点中心-边界算法和基于弹性理论的数据归类判定方法。对比实验结果表明:4点中心-边界算法提高了核心数据对原有类别数据的代表性,较... 从解决数据集合对应的图形不规则性问题出发,提出虚拟数字实体化观点,并在此基础上提出基于相互约束的4点中心-边界算法和基于弹性理论的数据归类判定方法。对比实验结果表明:4点中心-边界算法提高了核心数据对原有类别数据的代表性,较好地缓解了数据集合的图形不规则性问题;基于弹性理论的数据归类判定方法充分利用4点中心-边界算法的结果,获得较好的数据归类能力。 展开更多
关键词 实体化 聚类中心 数据归类 判定方法 弹性理论 边界算法
下载PDF
视听资料的分编工作浅探 被引量:2
20
作者 杨琳 《洛阳大学学报》 2001年第3期95-96,共2页
视听资料图书分编过程中的分类规则、特点 ,著录信息源的选择、载体形态的细节著录。
关键词 视听资料 分类规则 分编工作 分类标准 著录信息源 载体形态 图书馆
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部