期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
面向流数据的决策树分类算法并行化 被引量:16
1
作者 季一木 张永潘 +2 位作者 郎贤波 张殿超 王汝传 《计算机研究与发展》 EI CSCD 北大核心 2017年第9期1945-1957,共13页
随着云计算、物联网等技术的兴起,流数据作为一种新型的大数据形态广泛存在于电信、互联网、金融等领域.与传统静态数据相比,大数据环境下的流数据具有快速、连续和随时间变化等特点.同时数据流的隐含分布变化会带来概念漂移问题.为了... 随着云计算、物联网等技术的兴起,流数据作为一种新型的大数据形态广泛存在于电信、互联网、金融等领域.与传统静态数据相比,大数据环境下的流数据具有快速、连续和随时间变化等特点.同时数据流的隐含分布变化会带来概念漂移问题.为了适应大数据环境下流数据分类算法的要求,必须对传统的静态离线数据分类算法进行改进,提出基于分布式计算平台Storm的P-HT并行化算法.算法在满足Storm流处理平台要求基础上,通过滑动窗口机制、替代子树机制和并行化处理,提高了算法的灵活性和通用性,并且能良好地适应数据流的概念漂移.最后通过实验验证该算法的有效性和高效性,结果表明在与传统C4.5算法相比精度没有降低的情况下,改进的P-HT算法具有更大的吞吐量和更快的处理速度. 展开更多
关键词 流数据 分类算法 Storm平台 滑动窗口 c4.5算法 并行化算法
下载PDF
具有容噪特性的C4.5算法改进 被引量:10
2
作者 王伟 李磊 张志鸿 《计算机科学》 CSCD 北大核心 2015年第12期268-271,287,共5页
针对有噪声的高维数据引起决策树预测准确率下降的问题,利用容噪主成分分析(Noise-free Principal Component Anlysis,NFPCA)算法思想对C4.5算法改进而形成NFPCA-in-C4.5算法。该算法一方面将高维数据噪声控制问题转化为拟合数据特征与... 针对有噪声的高维数据引起决策树预测准确率下降的问题,利用容噪主成分分析(Noise-free Principal Component Anlysis,NFPCA)算法思想对C4.5算法改进而形成NFPCA-in-C4.5算法。该算法一方面将高维数据噪声控制问题转化为拟合数据特征与控制平滑度相结合的最优化问题,从而获得主成分空间;另一方面在决策树自顶向下构建新节点的过程中,再将主成分空间恢复到原始数据空间来避免降维过程中属性特征信息永久消失。实验结果表明NFPCA-in-C4.5算法兼具降维和容噪功能,避免了降维中由特征信息损失和噪声残留造成的预测模型准确率大幅降低的问题。 展开更多
关键词 高维数据噪声 容噪 主成分分析 c4.5算法
下载PDF
数据挖掘在生产过程质量管理中的应用 被引量:7
3
作者 宋建聪 戴青云 +1 位作者 付品欣 钟润阳 《现代制造工程》 CSCD 北大核心 2013年第9期12-16,共5页
针对离散型制造业生产过程的产品质量管理只注重事后处理,缺少对质量数据做进一步分析的情况,采用事先预警的管理理念,利用决策树C4.5算法,对大量生产加工与检验数据进行数据挖掘,建立一种生产过程质量分析模型。该模型结合生产过程产... 针对离散型制造业生产过程的产品质量管理只注重事后处理,缺少对质量数据做进一步分析的情况,采用事先预警的管理理念,利用决策树C4.5算法,对大量生产加工与检验数据进行数据挖掘,建立一种生产过程质量分析模型。该模型结合生产过程产品质量关键影响因素,为质量管理提供数据支持。采用该算法对某公司制造数据的挖掘结果进行分析发现,所建模型提高了产品质量,降低了生产的不合格率,为企业持续改进质量提供决策支持。 展开更多
关键词 质量管理 数据挖掘 决策树 c4 5算法
下载PDF
C4.5算法在移动通信行业客户流失分析中的应用 被引量:5
4
作者 邹竞 谢鲲 《计算技术与自动化》 2009年第3期98-101,共4页
稳定客户和吸引客户是移动通信企业提高竞争力的关键。基于大量实验数据将数据挖掘的决策树方法引入移动通信行业客户流失分析中,通过对数据的预处理,利用C4.5算法创建决策树,通过测试流失的与未流失的客户,平均正确识别率为91.6%。决... 稳定客户和吸引客户是移动通信企业提高竞争力的关键。基于大量实验数据将数据挖掘的决策树方法引入移动通信行业客户流失分析中,通过对数据的预处理,利用C4.5算法创建决策树,通过测试流失的与未流失的客户,平均正确识别率为91.6%。决策树体现的规则与经验基本一致,为移动通信企业建立客户流失的预警机制提供了决策支持。 展开更多
关键词 数据挖掘 决策树 c4.5算法 客户流失
下载PDF
改进的C4.5算法在期货数据挖掘中的研究 被引量:6
5
作者 陈磊 何国辉 《计算机工程与应用》 CSCD 北大核心 2017年第11期161-166,共6页
在利用现有C4.5算法构建期货预测决策树时,往往出现预测准确率低的弊端,导致预测模型很难使用,为此提出了一种面向期货数据的C4.5-K算法。该算法的主要思想是通过在C4.5算法中引进新的参数K,调整属性度量标准信息增益率的取值范围,进而... 在利用现有C4.5算法构建期货预测决策树时,往往出现预测准确率低的弊端,导致预测模型很难使用,为此提出了一种面向期货数据的C4.5-K算法。该算法的主要思想是通过在C4.5算法中引进新的参数K,调整属性度量标准信息增益率的取值范围,进而构建决策树预测模型进行预测。通过实验表明,该改进算法能有效提高期货预测能力。 展开更多
关键词 c4.5算法 决策树 期货预测 数据挖掘
下载PDF
基于约简矩阵和C4.5决策树的故障诊断方法 被引量:6
6
作者 徐曌 张斌 《计算机技术与发展》 2018年第2期40-44,共5页
现阶段由于智能装备的结构和功能不断完善,机械故障预兆和故障特征也不断复杂化,导致了故障诊断难度大大增加。由于机器学习和数据挖掘技术的不断革新,基于数据挖掘的故障诊断系统快速发展,提高了故障诊断效率,减少了因诊断延迟造成的... 现阶段由于智能装备的结构和功能不断完善,机械故障预兆和故障特征也不断复杂化,导致了故障诊断难度大大增加。由于机器学习和数据挖掘技术的不断革新,基于数据挖掘的故障诊断系统快速发展,提高了故障诊断效率,减少了因诊断延迟造成的损失。对此,提出一种基于辨识约简矩阵的决策树故障诊断方法,实现了故障样本决策表的高效生成并保证诊断的正确性。首先采用粗糙集的决策树方法建立故障诊断决策表,然后离散化处理特征数据;接着采用可辨别矩阵约简算法进行属性约简,删除冗余信息,形成精简的决策表;最后使用C4.5算法构造出最终决策树,并用该方法与直接使用C4.5算法所生成决策树进行对比分析。实验结果表明,该方案有一定的容错能力,并且是一种快速、可靠的故障诊断方法。 展开更多
关键词 粗糙集 可辨识矩阵 c4.5算法 决策树 故障诊断
下载PDF
决策树算法在实际中的应用 被引量:4
7
作者 吴逍 刘启兵 汪飞 《工业控制计算机》 2017年第12期120-121,共2页
通过实例详细地说明了数据挖掘中关于决策树算法在实际中的应用,并将ID.3和C4.5两个算法进行比较,表明各个算法的优势。
关键词 数据挖掘 决策树 ID3算法 c4.5算法
下载PDF
数据挖掘C4.5算法在市政工程造价的应用研究 被引量:4
8
作者 傅则恒 《计算机与现代化》 2018年第1期27-31,共5页
首先对C4.5算法做了介绍,然后针对案例工程对算法提出一些优化措施,运用C4.5算法对案例市政道路工程工程量清单费用进行建模与分析研究,提取分类规则,最后随机验证分类规则的普遍适用性。通过随机验证可知该分类规则具有普遍适用性,可... 首先对C4.5算法做了介绍,然后针对案例工程对算法提出一些优化措施,运用C4.5算法对案例市政道路工程工程量清单费用进行建模与分析研究,提取分类规则,最后随机验证分类规则的普遍适用性。通过随机验证可知该分类规则具有普遍适用性,可以帮助工程造价相关从业人员进行快速预测,提高决策分析的工作效率。 展开更多
关键词 c4.5算法 市政工程 工程造价
下载PDF
C4.5算法在客户关系管理中的应用研究 被引量:4
9
作者 张炳明 毕学慧 《阜阳师范学院学报(自然科学版)》 2009年第2期27-30,共4页
通过数据挖掘技术可以挖掘出隐藏在大量数据背后的信息,企业才能对客户进行细分,预测客户行为和做出正确的决策.文章在数据挖掘常用技术的基础上,提出了其在CRM中的应用模型,并基于C 4.5算法,对数据挖掘在客户获取中的应用进行了实证分析.
关键词 客户关系管理 数据挖掘 c4.5算法
下载PDF
用C4.5算法对局域网数据报进行行为分类 被引量:3
10
作者 吴楠 宋方敏 《计算机技术与发展》 2006年第7期1-3,共3页
局域网传输的数据报中携带大量与数据包相关的信息,这些信息在一定意义上反映了数据报的行为。对数据报行为进行分类可为局域网上的网络入侵检测提供重要依据。文中提出使用C4.5决策树分类算法对局域网数据报进行行为分类,并与以往常用... 局域网传输的数据报中携带大量与数据包相关的信息,这些信息在一定意义上反映了数据报的行为。对数据报行为进行分类可为局域网上的网络入侵检测提供重要依据。文中提出使用C4.5决策树分类算法对局域网数据报进行行为分类,并与以往常用的几种分类算法进行了比较。实验表明,C4.5算法对于该问题无论在分类效率还是在分类正确性方面均有很大的优势。 展开更多
关键词 c4.5算法 数据挖掘 局域网数据报 网络入侵检测 分类 决策树
下载PDF
BP算法与C4.5算法在乳腺癌诊断中的比较分析 被引量:2
11
作者 杨云 董雪 齐勇 《陕西科技大学学报(自然科学版)》 2015年第3期163-166,172,共5页
目前数据挖掘技术被大量应用于医学领域,进行疾病诊断。针对乳腺癌发病率不断升高,为辅助医生做出诊断决策,采用具有优秀学习能力的人工神经网络中的BP算法与决策树中的C4.5算法来分析乳腺癌数据,对乳腺癌肿瘤类型进行诊断预测,并对这... 目前数据挖掘技术被大量应用于医学领域,进行疾病诊断。针对乳腺癌发病率不断升高,为辅助医生做出诊断决策,采用具有优秀学习能力的人工神经网络中的BP算法与决策树中的C4.5算法来分析乳腺癌数据,对乳腺癌肿瘤类型进行诊断预测,并对这两种算法建立的分类器性能进行比较分析,研究发现BP算法与C4.5算法都能对乳腺癌类型作出诊断预测,但在分类器的评估中发现BP分类器的性能优于C4.5分类器. 展开更多
关键词 乳腺癌分类 BP算法 c4.5算法 分类器性能
下载PDF
数据挖掘技术在客户获取中的应用研究 被引量:1
12
作者 黄伟建 赵春荣 杜巍 《科技管理研究》 北大核心 2011年第24期180-182,187,共4页
通过探讨数据挖掘决策树技术,提出构建决策树的过程,并基于C4.5算法,对数据挖掘在客户获取中的应用进行实例分析,验证其可行性。
关键词 客户关系管理 数据挖掘 决策树 c4.5算法
下载PDF
C4.5算法在大豆致病性分析中的应用 被引量:1
13
作者 赵阳 陆静 《河北农业科学》 2007年第6期96-98,共3页
介绍了一种决策树C4.5算法的构建方法及其步骤,并将决策树应用于大豆致病分析,由Weka系统实现后得到有一定实用价值的决策树。
关键词 决策树 c4.5算法 大豆 致病性
下载PDF
基于决策树算法的护理质量的应用研究(英文)
14
作者 左凤华 张兰华 王枚 《护理研究(中旬版)》 2009年第4期1026-1030,共5页
护理质量是医院医疗质量的重要组成部分,是衡量护理工作质量和效率的重要手段。建立科学、合理、严谨、量化的护理质量评价模型已成为亟需解决的重要课题。将决策树技术应用到护理质量的分析研究中,完整地实现了决策树技术在其中的应用... 护理质量是医院医疗质量的重要组成部分,是衡量护理工作质量和效率的重要手段。建立科学、合理、严谨、量化的护理质量评价模型已成为亟需解决的重要课题。将决策树技术应用到护理质量的分析研究中,完整地实现了决策树技术在其中的应用全过程,以提高护理质量。主要利用已有的数据信息和通过调查方式采集数据,使用C4.5算法生成决策树,完成了护理质量是否优良的决策树模型和护理质量是否合格的决策树模型的建立。 展开更多
关键词 c4.5算法 决策树 信息增益率 护理质量
下载PDF
基于决策树C4.5算法的京津冀机场群航线网络优化 被引量:12
15
作者 陈梵驿 杨新湦 +1 位作者 翟文鹏 吴长乐 《中国科技论文》 北大核心 2017年第7期798-801,共4页
针对京津冀机场群发展不和谐的现状,从航班准点率、航空公司份额和功能定位的角度提出机场群航线优化原则,构建了以机场群总体效益最大化为目标的机场群航线网络优化模型,将决策树C4.5算法进行改进后应用于航线网络优化问题中,通过对比... 针对京津冀机场群发展不和谐的现状,从航班准点率、航空公司份额和功能定位的角度提出机场群航线优化原则,构建了以机场群总体效益最大化为目标的机场群航线网络优化模型,将决策树C4.5算法进行改进后应用于航线网络优化问题中,通过对比各方案损益值寻找最优解。结果表明,优化后京津冀机场群总体效益提高了8.21%,优化效果显著。 展开更多
关键词 机场群 航线网络优化 京津冀 决策树c4.5算法
下载PDF
一种改进的决策树学习算法 被引量:10
16
作者 李瑞 魏现梅 +1 位作者 黄明 梁旭 《科学技术与工程》 2009年第20期6038-6041,共4页
为提高C4.5算法的准确率引进一个平衡度系数,其大小由决策者依靠先验知识或领域知识确定,在特定环境下人工协调了各属性信息增益率,用改进后的算法构造出的决策树进行分类更为准确、合理。并通过实例分析对改进前后的算法进行了比较,证... 为提高C4.5算法的准确率引进一个平衡度系数,其大小由决策者依靠先验知识或领域知识确定,在特定环境下人工协调了各属性信息增益率,用改进后的算法构造出的决策树进行分类更为准确、合理。并通过实例分析对改进前后的算法进行了比较,证明改进算法的有效性。 展开更多
关键词 数据分类 决策树 c4.5算法 平衡度系数
下载PDF
A NOVEL CLASSIFICATION METHOD FOR TROPICAL CYCLONE INTENSITY CHANGE ANALYSIS BASED ON HIERARCHICAL PARTICLE SWARM OPTIMIZATION ALGORITHM
17
作者 耿焕同 孙家清 +1 位作者 张伟 吴正雪 《Journal of Tropical Meteorology》 SCIE 2017年第1期113-120,共8页
Based on the tropical cyclone(TC) observations in the western North Pacific from 2000 to 2008, this paper adopts the particle swarm optimization(PSO) algorithm of evolutionary computation to optimize one comprehensive... Based on the tropical cyclone(TC) observations in the western North Pacific from 2000 to 2008, this paper adopts the particle swarm optimization(PSO) algorithm of evolutionary computation to optimize one comprehensive classification rule, and apply the optimized classification rule to the forecasting of TC intensity change. In the process of the optimization, the strategy of hierarchical pruning has been adopted in the PSO algorithm to narrow the search area,and thus to enhance the local search ability, i.e. hierarchical PSO algorithm. The TC intensity classification rule involves core attributes including 12-HMWS, MPI, and Rainrate which play vital roles in TC intensity change. The testing accuracy using the new mined rule by hierarchical PSO algorithm reaches 89.6%. The current study shows that the novel classification method for TC intensity change analysis based on hierarchic PSO algorithm is not only easy to explain the source of rule core attributes, but also has great potential to improve the forecasting of TC intensity change. 展开更多
关键词 tropical cyclone intensity hierarchical PSO algorithm classification and forecasting c4 5 algorithm
下载PDF
基于Map/Reduce的决策树分类挖掘方法应用研究 被引量:4
18
作者 李根 樊龙 +1 位作者 万定生 余宇峰 《计算机与数字工程》 2016年第8期1504-1510,共7页
传统数据挖掘模式在处理海量、多维、复杂等特征的数据时,存在计算能力弱、效率低、可扩展性差等问题。论文提出基于Map/Reduce的决策树分类挖掘方法(C4.5BH算法),该算法采用K-means聚类方法对连续属性进行离散化,并利用Map/Reduce编程... 传统数据挖掘模式在处理海量、多维、复杂等特征的数据时,存在计算能力弱、效率低、可扩展性差等问题。论文提出基于Map/Reduce的决策树分类挖掘方法(C4.5BH算法),该算法采用K-means聚类方法对连续属性进行离散化,并利用Map/Reduce编程模型和属性表结构实现了决策树构造过程中属性的并行计算和节点的并行分裂。实验证明,与传统的C4.5算法相比,C4.5BH算法在处理大规模数据集时具有更高的执行效率和良好的加速比。 展开更多
关键词 Map/Reduce技术 K-MEANS算法 决策树 c4.5BH算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部