期刊文献+
共找到300篇文章
< 1 2 15 >
每页显示 20 50 100
基于决策树分类技术的遥感影像分类方法研究 被引量:107
1
作者 申文明 王文杰 +3 位作者 罗海江 张峰 刘小曼 熊文成 《遥感技术与应用》 CSCD 2007年第3期333-338,共6页
以河北唐山为研究区,应用Landsat ETM+影像数据和GIS数据,对决策树分类技术和传统计算机自动分类方法进行了比较。研究表明:决策树与传统自动分类方法相比,分类精度提高了18.29%,Kappa系数提高0.1878。在地形起伏的山区,应用DEM及其衍... 以河北唐山为研究区,应用Landsat ETM+影像数据和GIS数据,对决策树分类技术和传统计算机自动分类方法进行了比较。研究表明:决策树与传统自动分类方法相比,分类精度提高了18.29%,Kappa系数提高0.1878。在地形起伏的山区,应用DEM及其衍生数据等GIS数据作为辅助数据可以提高分类精度19.52%,Kappa系数提高0.281;反射率影像分类效果比原始DN值影像的分类效果好,分类精度提高15.86%;缨帽变换在压缩数据量的同时,分类精度有所降低。 展开更多
关键词 遥感影像 决策树 计算机自动分类 空间数据挖掘 土地利用/土地覆盖
下载PDF
用Naive Bayes方法协调分类Web网页 被引量:53
2
作者 范焱 郑诚 +2 位作者 王清毅 蔡庆生 刘洁 《软件学报》 EI CSCD 北大核心 2001年第9期1386-1392,共7页
WWW上的信息极大丰富 ,如何从巨量的信息中有效地发现有用的信息 ,是亟待解决的问题 ,而 Web网页的正确分类正是其中的核心问题 .针对超文本结构中的结构特征 ,提出了用 Naive Bayes方法协调分别利用超文本页面中的文本信息和结构信息... WWW上的信息极大丰富 ,如何从巨量的信息中有效地发现有用的信息 ,是亟待解决的问题 ,而 Web网页的正确分类正是其中的核心问题 .针对超文本结构中的结构特征 ,提出了用 Naive Bayes方法协调分别利用超文本页面中的文本信息和结构信息进行分类的方法 .经实验验证 ,与只用单种方法对超文本进行分类的方法相比 ,综合分类法有效地提高了分类的正确率 . 展开更多
关键词 超文本 Web 机器学习 互联网 数据挖掘 信息检索 WWW 网页 NaiveBayes方法
下载PDF
数据挖掘中决策树算法的最新进展 被引量:47
3
作者 韩慧 毛锋 王文渊 《计算机应用研究》 CSCD 北大核心 2004年第12期5-8,共4页
概述了传统决策树方法的基本原理和优越性,指出了该方法应用于超大数据集的数据挖掘环境时的局限性;着重分五个方面概括了近年来决策树方法在数据挖掘中的主要进展,并讨论了决策树方法面临的挑战及其发展趋势。
关键词 决策树 分类 数据挖掘
下载PDF
基于粗糙集理论的分类规则发现 被引量:28
4
作者 印勇 曹长修 张邦礼 《重庆大学学报(自然科学版)》 CAS CSCD 2000年第1期63-65,73,共4页
研究了利用粗糙集理论中核的概念,求取信息系统的最小简化策略,给出了从数据库中发现分类规则的方法。
关键词 粗糙集 分类规则 数据采掘 数据库知识发现
下载PDF
一类光滑支持向量机新函数的研究 被引量:42
5
作者 熊金志 胡金莲 +2 位作者 袁华强 胡天明 李广明 《电子学报》 EI CAS CSCD 北大核心 2007年第2期366-370,共5页
光滑函数在支持向量机中起着重要作用,本文研究如何得到一类新的光滑函数.用插值函数的方法导出了一个重要的递推公式,得到了一类新的光滑函数,从而解决了长期困扰人们的一个问题,即如何寻求性能更好的光滑函数问题.还证明了该类函数的... 光滑函数在支持向量机中起着重要作用,本文研究如何得到一类新的光滑函数.用插值函数的方法导出了一个重要的递推公式,得到了一类新的光滑函数,从而解决了长期困扰人们的一个问题,即如何寻求性能更好的光滑函数问题.还证明了该类函数的若干性能,其逼近精度比Sigmoid函数的积分函数高一个数量级,也明显高于一阶和二阶光滑多项式,为支持向量机提供了一类新的光滑函数. 展开更多
关键词 分类 支持向量机 数据挖掘 插值 光滑
下载PDF
基于AdaBoost组合学习方法的岩爆分类预测研究 被引量:43
6
作者 葛启发 冯夏庭 《岩土力学》 EI CSCD 北大核心 2008年第4期943-948,共6页
针对岩爆等级划分问题,考虑了岩爆灾害发生的多种主要影响因素,采用新的数据挖掘方法AdaBoost(即Adaptive Boosting)的组合学习方法,结合流行的人工神经网络BP算法,构建了集成神经网络AdaBoost—ANN(简称AB—ANN)的岩爆等级多分类预测... 针对岩爆等级划分问题,考虑了岩爆灾害发生的多种主要影响因素,采用新的数据挖掘方法AdaBoost(即Adaptive Boosting)的组合学习方法,结合流行的人工神经网络BP算法,构建了集成神经网络AdaBoost—ANN(简称AB—ANN)的岩爆等级多分类预测模型。该模型克服了单一弱分类器的不稳定性,提高了分类器精度,实验结果表明,预测的结果与实际值比较吻合,证明了该方法的可行性。 展开更多
关键词 岩爆 等级分类 数据挖掘 ADABOOST 神经网络
下载PDF
GIS辅助下的Bayes法遥感影像分类 被引量:24
7
作者 游代安 蒋定华 余旭初 《测绘科学技术学报》 北大核心 2001年第2期113-117,共5页
介绍了Bayes分类器 ,提出了从GIS空间数据库中挖掘知识用以辅助进行遥感影像分类的方法。文中以规则的形式表示遥感影像的解译知识 ,并使用其它地理辅助数据 ,从遥感影像处理、地理辅助数据、专家知识一体化的角度出发 ,使用基于知识的... 介绍了Bayes分类器 ,提出了从GIS空间数据库中挖掘知识用以辅助进行遥感影像分类的方法。文中以规则的形式表示遥感影像的解译知识 ,并使用其它地理辅助数据 ,从遥感影像处理、地理辅助数据、专家知识一体化的角度出发 ,使用基于知识的方法进行了分类研究 ,改善了分类精度。实验表明这是一种较好的分类方法。 展开更多
关键词 影像分类 空间数据挖掘 贝叶斯分类器
下载PDF
The UCR Time Series Archive 被引量:42
8
作者 Hoang Anh Dau Anthony Bagnall +5 位作者 Kaveh Kamgar Chin-Chia Michael Yeh Yan Zhu Shaghayegh Gharghabi Chotirat Ann Ratanamahatana Eamonn Keogh 《IEEE/CAA Journal of Automatica Sinica》 SCIE EI CSCD 2019年第6期1293-1305,共13页
The UCR time series archive–introduced in 2002,has become an important resource in the time series data mining community,with at least one thousand published papers making use of at least one data set from the archiv... The UCR time series archive–introduced in 2002,has become an important resource in the time series data mining community,with at least one thousand published papers making use of at least one data set from the archive.The original incarnation of the archive had sixteen data sets but since that time,it has gone through periodic expansions.The last expansion took place in the summer of 2015 when the archive grew from 45 to 85 data sets.This paper introduces and will focus on the new data expansion from 85 to 128 data sets.Beyond expanding this valuable resource,this paper offers pragmatic advice to anyone who may wish to evaluate a new algorithm on the archive.Finally,this paper makes a novel and yet actionable claim:of the hundreds of papers that show an improvement over the standard baseline(1-nearest neighbor classification),a fraction might be mis-attributing the reasons for their improvement.Moreover,the improvements claimed by these papers might have been achievable with a much simpler modification,requiring just a few lines of code. 展开更多
关键词 data mining TIME SERIES classification UCR TIME SERIES ARCHIVE
下载PDF
基于Rough Set的空间数据分类方法 被引量:25
9
作者 石云 263.net +1 位作者 孙玉芳 左春 《软件学报》 EI CSCD 北大核心 2000年第5期673-678,共6页
近来 ,数据采掘的研究已从关系型和事务型数据库扩展到空间数据库 .空间数据采掘是一个很有发展前景的领域 ,其中空间数据分类的研究尚处在起步阶段 .该文分析和比较了现有的几个空间数据分类方法的利和弊 ,提出利用 Rough Set的三阶段... 近来 ,数据采掘的研究已从关系型和事务型数据库扩展到空间数据库 .空间数据采掘是一个很有发展前景的领域 ,其中空间数据分类的研究尚处在起步阶段 .该文分析和比较了现有的几个空间数据分类方法的利和弊 ,提出利用 Rough Set的三阶段空间分类过程 .实验结果表明 。 展开更多
关键词 ROUGHSET 分类 数据采掘 空间数据 空间数据库
下载PDF
分类方法的新发展:研究综述 被引量:20
10
作者 张丽娟 李舟军 《计算机科学》 CSCD 北大核心 2006年第10期11-15,共5页
分类是数据挖掘的重要任务之一,也是机器学习、模式识别和人工智能等相关领域广泛研究的问题。分类在实际中有广泛的应用,包括医疗诊断、信用评估、选择购物等。近年来,随着相关领域中新技术的不断涌现,分类方法也得到了新发展。本文对... 分类是数据挖掘的重要任务之一,也是机器学习、模式识别和人工智能等相关领域广泛研究的问题。分类在实际中有广泛的应用,包括医疗诊断、信用评估、选择购物等。近年来,随着相关领域中新技术的不断涌现,分类方法也得到了新发展。本文对这些新发展进行了较详细的归纳,总结了分类方法发展的趋势。 展开更多
关键词 分类 数据挖掘 人工智能 机器学习
下载PDF
分类挖掘技术在金融客户关系管理中的应用 被引量:8
11
作者 康健 梁允荣 《北京理工大学学报》 EI CAS CSCD 北大核心 2003年第2期207-211,共5页
探讨数据挖掘技术在企业实际工作中的应用方式与应用领域 ,分析金融客户分类的必要性 .针对具体的项目论述对金融客户进行分类的方法 .改进了传统的决策树分类挖掘算法即 ID3算法 ,提出了进行数据挖掘结果可视化展现的两层软件结构 .该... 探讨数据挖掘技术在企业实际工作中的应用方式与应用领域 ,分析金融客户分类的必要性 .针对具体的项目论述对金融客户进行分类的方法 .改进了传统的决策树分类挖掘算法即 ID3算法 ,提出了进行数据挖掘结果可视化展现的两层软件结构 .该方法在银行客户关系管理系统中投入实际运行 ,获得了较好的用户反映 ,对企业的决策支持产生了积极的影响 . 展开更多
关键词 分类挖掘 决策树 客户关系管理
下载PDF
基于信息熵的决策属性分类挖掘算法及应用 被引量:18
12
作者 舒红平 游志胜 蒋建民 《计算机工程与应用》 CSCD 北大核心 2004年第1期186-189,共4页
在利用判定树进行分类挖掘时,需事先知道属性的分类。对不具体的或未知的属性分类,利用“高类聚、低耦合”原理对属性进行最优分类。在属性分类的基础上,利用基于信息熵的属性期望信息及对应的信息增益理论选择最佳分类决策属性,并按最... 在利用判定树进行分类挖掘时,需事先知道属性的分类。对不具体的或未知的属性分类,利用“高类聚、低耦合”原理对属性进行最优分类。在属性分类的基础上,利用基于信息熵的属性期望信息及对应的信息增益理论选择最佳分类决策属性,并按最佳分类决策属性引出分枝形成判定树。该文对属性的最优分类理论及算法进行了描述,并讨论了选择最佳决策属性构造判定树的算法,结合具体应用实例进行了验证并构造了判定树。 展开更多
关键词 属性 分类 数据挖掘 信息熵 判定树
下载PDF
关联规则衡量标准的研究 被引量:13
13
作者 罗可 吴杰 《控制与决策》 EI CSCD 北大核心 2003年第3期277-280,284,共5页
关联规则采掘是数据采掘中重要的研究课题。针对当前关联规则采掘中可能产生许多无效关联规则的问题 ,分析其原因 ,提出在衡量标准中增加有效度 ,并给出了有效度的定义。根据有效度的大小 ,将关联规则分为正关联规则、无效关联规则、负... 关联规则采掘是数据采掘中重要的研究课题。针对当前关联规则采掘中可能产生许多无效关联规则的问题 ,分析其原因 ,提出在衡量标准中增加有效度 ,并给出了有效度的定义。根据有效度的大小 ,将关联规则分为正关联规则、无效关联规则、负关联规则 ,提出了新衡量标准采掘关联规则的算法 ,并用 Visual Fox Pro进行了试验。实验表明 ,新方法能明显减少无效关联规则的数目。 展开更多
关键词 数据采掘 关联规则 有效度 算法
下载PDF
一种基于遗传算法的优化分类器的方法 被引量:6
14
作者 季文赟 周傲英 +1 位作者 张亮 金文 《软件学报》 EI CSCD 北大核心 2002年第2期245-249,共5页
提出了一种通过遗传算法(GA)对单个分类器进行优化以及对多个分类器进行组合优化的方法.该方法使用叠加(stacking)的策略.经典的叠加策略分为两步,该方法将遗传算法作为叠加策略的第2步.实验结果表明,遗传算法可以较好地完成优化任务,... 提出了一种通过遗传算法(GA)对单个分类器进行优化以及对多个分类器进行组合优化的方法.该方法使用叠加(stacking)的策略.经典的叠加策略分为两步,该方法将遗传算法作为叠加策略的第2步.实验结果表明,遗传算法可以较好地完成优化任务,同单个分类器比较,它可以提高分类的精度.在对分类器进行组合优化方面,它得到比单个分类器更高的精度以及使分类结果具有更好的可理解性. 展开更多
关键词 遗传算法 优化 机器学习 数据挖掘 分类规则 分类器 人工智能
下载PDF
基于情感特征聚类的半监督情感分类 被引量:23
15
作者 李素科 蒋严冰 《计算机研究与发展》 EI CSCD 北大核心 2013年第12期2570-2577,共8页
情感分类是观点挖掘的一个重要的方面.提出了一种基于情感特征聚类的半监督式情感分类方法,该方法只需要对少量训练数据实例进行情感类别标注.首先从消费者评论中提取普通分类特征和情感特征,普通分类特征可以用来训练一个情感分类器.... 情感分类是观点挖掘的一个重要的方面.提出了一种基于情感特征聚类的半监督式情感分类方法,该方法只需要对少量训练数据实例进行情感类别标注.首先从消费者评论中提取普通分类特征和情感特征,普通分类特征可以用来训练一个情感分类器.然后使用spectral聚类算法把这些情感特征映射成扩展特征.普通分类特征和扩展特征一起通过训练得到另一个情感分类器.2个分类器再从未标签数据集中选择实例放入到训练集合中,并通过训练得到最终的情感分类器.实验结果表明,在同样的数据集上该方法的情感分类准确度比基于self-learning SVM的方法和基于co-training SVM的方法的情感分类准确度要高. 展开更多
关键词 半监督式学习 情感特征聚类 情感分类 观点挖掘 WEB挖掘 数据挖掘
下载PDF
基于增量式遗传算法的粗糙集分类规则挖掘 被引量:9
16
作者 何明 冯博琴 +1 位作者 马兆丰 傅向华 《西安交通大学学报》 EI CAS CSCD 北大核心 2004年第6期579-582,共4页
从规则获取和优化两个方面研究了基于遗传算法(GA)的增量式粗糙集分类规则挖掘方法.通过研究决策表和决策规则系数,建立了基于粗糙集表示和度量的知识理论,将GA和粗糙集分类规则挖掘算法相结合,在保持原有知识完备的前提下,利用GA对以... 从规则获取和优化两个方面研究了基于遗传算法(GA)的增量式粗糙集分类规则挖掘方法.通过研究决策表和决策规则系数,建立了基于粗糙集表示和度量的知识理论,将GA和粗糙集分类规则挖掘算法相结合,在保持原有知识完备的前提下,利用GA对以增量形式获得的分类规则进行优化,获取最优分类规则.试验结果表明,执行增量式GA所需时间较执行一般GA所需时间要少,可有效完成分类规则优化的任务,同时还可提高分类的精度,使分类结果具有更好的可理解性. 展开更多
关键词 粗糙集 数据挖掘 增量式遗传算法 分类规则
下载PDF
基于谱聚类的城市轨道站点分类方法 被引量:22
17
作者 余丽洁 李岩 陈宽民 《交通信息与安全》 2014年第1期122-125,129,共5页
为明确城市轨道站点的功能与定位,以对站点的设计与建设提供指导,建立了基于谱聚类算法的城市轨道站点分类方法。在确立影响轨道站点属性因素参数的基础上,应用西安地铁2号线现状及规划特征年的数据分别对快速聚类法及非规格化谱聚类算... 为明确城市轨道站点的功能与定位,以对站点的设计与建设提供指导,建立了基于谱聚类算法的城市轨道站点分类方法。在确立影响轨道站点属性因素参数的基础上,应用西安地铁2号线现状及规划特征年的数据分别对快速聚类法及非规格化谱聚类算法、SM算法、NJW算法等谱聚类算法的站点分类效果进行评述。结果显示谱聚类算法中的NJW算法,能够抓住站点的特征进行分类,且能准确反映随着轨道线网和城市发展,站点特性的变化。 展开更多
关键词 城市交通 站点分类 谱聚类 城市轨道站点 站点属性 数据挖掘
下载PDF
一种文本分类数据挖掘的技术 被引量:10
18
作者 杨斌 孟志青 《湘潭大学自然科学学报》 CAS CSCD 2001年第4期34-37,共4页
挖掘的理论和应用研究是数据挖掘领域一个新的重要分支 ,介绍了一种文本数据挖掘方法 .首先 ,论述了文本挖掘的意义和重要性 ,探讨了文本挖掘的定义和文本分类的一些形式 ,然后讨论了一个以数据预处理、特征提取、特征表示和特征匹配等... 挖掘的理论和应用研究是数据挖掘领域一个新的重要分支 ,介绍了一种文本数据挖掘方法 .首先 ,论述了文本挖掘的意义和重要性 ,探讨了文本挖掘的定义和文本分类的一些形式 ,然后讨论了一个以数据预处理、特征提取、特征表示和特征匹配等文本分类的一些关键理论问题 ,并给出了一个基于该方法的文本分类系统的实验结果 。 展开更多
关键词 文本挖掘 文本分类 数据挖掘 VSM
下载PDF
基于可拓集的可拓分类知识获取研究 被引量:17
19
作者 杨春燕 蔡文 《数学的实践与认识》 CSCD 北大核心 2008年第16期184-191,共8页
以可拓集理论为依据,给出基于可拓变换的可拓分类知识的定义,并在信息元集和评价信息元集的基础上,探讨可拓分类知识的获取方法,包括质变域知识的获取、量变域知识的获取和有关拓界的知识的获取.这是可拓数据挖掘的主要内容之一,为从数... 以可拓集理论为依据,给出基于可拓变换的可拓分类知识的定义,并在信息元集和评价信息元集的基础上,探讨可拓分类知识的获取方法,包括质变域知识的获取、量变域知识的获取和有关拓界的知识的获取.这是可拓数据挖掘的主要内容之一,为从数据库中获取变化的分类知识提供了新的思路. 展开更多
关键词 可拓集 关联函数 可拓分类 可拓数据挖掘
原文传递
一种基于关联性度量的决策树分类方法 被引量:11
20
作者 王大玲 于戈 +1 位作者 鲍玉斌 王国仁 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2001年第5期481-484,共4页
在介绍了一些典型的决策树分类算法的基础上 ,论述了所开发的面向先进制造企业的综合数据挖掘系统ScopeMiner中的决策树分类算法 ,该算法集中了ID3、C4 5和MedGen等典型算法的思想 ,并进行了改进·在建立决策树过程中采用关联性度... 在介绍了一些典型的决策树分类算法的基础上 ,论述了所开发的面向先进制造企业的综合数据挖掘系统ScopeMiner中的决策树分类算法 ,该算法集中了ID3、C4 5和MedGen等典型算法的思想 ,并进行了改进·在建立决策树过程中采用关联性度量的计算来确定划分条件属性的顺序 ,通过阈值设定和处理简化了决策树的剪枝和优化过程 ,准确性高 ,分类速度快·系统已在某大型企业质量控制中得到了应用 ,取得了一定的经济和社会效益·文章详述了算法的执行过程、应用于冶金企业中的实例以及正确性证明和时间复杂性分析· 展开更多
关键词 决策树 分类规则 数据挖掘 关联性度量 先进制造企业 ScopeMiner系统 质量控制
下载PDF
上一页 1 2 15 下一页 到第
使用帮助 返回顶部