期刊文献+
共找到68篇文章
< 1 2 4 >
每页显示 20 50 100
数据挖掘技术初探 被引量:18
1
作者 周晓宇 李慎之 +1 位作者 戚晓芳 徐宝文 《小型微型计算机系统》 CSCD 北大核心 2002年第3期342-346,共5页
数据挖掘技术已成为机器学习、数据库系统、人工智能等领域内热门的研究方向 .本文将讨论数据挖掘的基本概念 ,并在此基础上介绍、分析挖掘关联规则技术、决策树、聚类分析。
关键词 数据挖掘 关联规则 决策树 聚类 数据管道 数据库
下载PDF
决策树ID3算法的分析与改进 被引量:38
2
作者 王小巍 蒋玉明 《计算机工程与设计》 CSCD 北大核心 2011年第9期3069-3072,3076,共5页
为了弥补ID3算法[1-3]的缺点及不足,设计了一种基于ID3算法的改进算法。它使用修正参数修正信息增益,克服了ID3算法偏向于选择取值较多的属性这一缺点,对连续值的属性进行离散化,解决了连续属性的处理问题,通过有未知值的样本是按照已... 为了弥补ID3算法[1-3]的缺点及不足,设计了一种基于ID3算法的改进算法。它使用修正参数修正信息增益,克服了ID3算法偏向于选择取值较多的属性这一缺点,对连续值的属性进行离散化,解决了连续属性的处理问题,通过有未知值的样本是按照已知值的相对频率随机分布的思想,可以处理缺少属性值的样本。描述了通过改进的ID3算法生成决策树[4]的具体步骤,将改进算法应用到了客户关系管理系统中的客户流失分析问题当中。通过对实验结果的分析比较,得到改进算法与原ID3算法相比具有更高的预测准确率,表明了该算法的有效性。 展开更多
关键词 数据挖掘 决策树 ID3算法 聚类 剪枝
下载PDF
聚类支持下决策树模型在耕地评价中的应用 被引量:22
3
作者 田剑 胡月明 +1 位作者 王长委 刘建敏 《农业工程学报》 EI CAS CSCD 北大核心 2007年第12期58-62,F0003,共6页
为了挑选合理的学习样本,增强决策树模型在耕地评价应用的有效性,运用聚类方法挑选学习样本,用改进C 5.0决策树算法建立耕地评价模型,提出一种新的评价思路。运用此方法以广东省龙川县耕地为研究对象,以试验法挑选出6种聚类结果的学习样... 为了挑选合理的学习样本,增强决策树模型在耕地评价应用的有效性,运用聚类方法挑选学习样本,用改进C 5.0决策树算法建立耕地评价模型,提出一种新的评价思路。运用此方法以广东省龙川县耕地为研究对象,以试验法挑选出6种聚类结果的学习样本,确定4000个样本作为最终的学习样本;利用决策代价权重来改进决策树评价模型,最终建立的评价模型的预测精度达到94.92%,满足了实际情况的需要。试验结果表明综合运用聚类和决策树模型进行耕地评价是可行的,其建立的评价模型具有精度高、鲁棒性和易理解性等特点。 展开更多
关键词 决策树 聚类 耕地评价 龙川县
下载PDF
基于电力系统复杂网络特征的线路脆弱性风险分析 被引量:25
4
作者 苏慧玲 李扬 《电力自动化设备》 EI CSCD 北大核心 2014年第2期101-107,共7页
提出了一种从电力系统复杂网络特征角度分析线路脆弱性风险的方法。该方法首先采用自下而上的层次聚类法挖掘线路脆弱性的层次风险,并以电力系统的复杂网络特征为条件属性,以电力系统线路脆弱性为决策属性,建立系统样本决策表;然后采用... 提出了一种从电力系统复杂网络特征角度分析线路脆弱性风险的方法。该方法首先采用自下而上的层次聚类法挖掘线路脆弱性的层次风险,并以电力系统的复杂网络特征为条件属性,以电力系统线路脆弱性为决策属性,建立系统样本决策表;然后采用基于贪婪启发式算法的ID3决策树数据挖掘法,建立线路脆弱性的精细化决策表;最后根据决策树建立电力系统线路脆弱性的层次风险模型,各层次所含线路的脆弱性风险与层次聚类法所得层次风险水平一致。IEEE 39节点算例结果表明电力系统复杂网络特征的分布情况决定了系统脆弱性线路风险大小。 展开更多
关键词 层次风险 复杂网络特征 电力系统 线路脆弱性 决策树 层次聚类 数据挖掘 风险
下载PDF
基于决策树归纳的聚类方法与实现 被引量:11
5
作者 王喆 陆楠 周春光 《吉林大学学报(信息科学版)》 CAS 2003年第2期132-137,共6页
采用一种改进后的决策树归纳聚类算法和交互式CLTree(ClusteringbasedondecisionTrees)剪枝,对商业数据的某些问题实现了聚类挖掘。对交易数据的实际聚类分析表明,该方法不仅可以处理数值型属性,还可以处理枚举型属性。实验结果表明,该... 采用一种改进后的决策树归纳聚类算法和交互式CLTree(ClusteringbasedondecisionTrees)剪枝,对商业数据的某些问题实现了聚类挖掘。对交易数据的实际聚类分析表明,该方法不仅可以处理数值型属性,还可以处理枚举型属性。实验结果表明,该方法在处理混合类型数据时具有良好的挖掘效果。对商业数据聚类分析,可以得到合理的市场分段,预测顾客的购买行为。 展开更多
关键词 数据挖掘 决策树归纳 聚类分析 相似度
下载PDF
基于SQL SERVER 2000的数据挖掘方案研究 被引量:7
6
作者 邓文华 《物流科技》 2003年第2期54-58,共5页
微软SQLSERVER2000第一次包含了数据挖掘功能,微软的数据挖掘解决方案是基于一个称为OLEDBforDataMining规范的工业标准,它是由微软提出并且由众多数据挖掘公司支持的工业标准。这个规范展示了一个新的类似于SQL语言的数据挖掘语言,数... 微软SQLSERVER2000第一次包含了数据挖掘功能,微软的数据挖掘解决方案是基于一个称为OLEDBforDataMining规范的工业标准,它是由微软提出并且由众多数据挖掘公司支持的工业标准。这个规范展示了一个新的类似于SQL语言的数据挖掘语言,数据库开发者们可以利用它去建设数据挖掘应用。本文提出了如何利用SQLSERV-ER2000去建设数据挖掘应用的方案。 展开更多
关键词 SQL SERVER 2000 数据挖掘 决策树 聚类
下载PDF
数据挖掘方法在医学领域的应用及SWOT分析 被引量:17
7
作者 牟冬梅 冯超 王萍 《医学信息学杂志》 CAS 2015年第1期53-57,共5页
阐述关联规则、人工神经网络、决策树和聚类分析4种数据挖掘方法在医学领域的应用情况,运用SWOT分析法,得出各方法的优势及劣势、面临的机会及威胁并做出策略分析。指出4种数据挖掘方法的适用范围和协同应用情况,对方法的应用选取提出... 阐述关联规则、人工神经网络、决策树和聚类分析4种数据挖掘方法在医学领域的应用情况,运用SWOT分析法,得出各方法的优势及劣势、面临的机会及威胁并做出策略分析。指出4种数据挖掘方法的适用范围和协同应用情况,对方法的应用选取提出建议。 展开更多
关键词 数据挖掘 关联规则 人工神经网络 决策树 聚类分析 SWOT分析
下载PDF
基于模糊聚类的决策树算法在教学质量评价中的应用 被引量:10
8
作者 刘光洁 王文永 +2 位作者 吴登峰 黄文博 吴延东 《东北师大学报(自然科学版)》 CAS CSCD 北大核心 2009年第3期36-39,共4页
以目前的高等学校教育为平台,就如何将数据挖掘技术与教学质量评价相结合的问题进行了研究.通过教学质量评价指标体系的有效挖掘,运用模糊聚类的决策树技术来解决目前教学质量评价中的不合理性,提出基于模糊聚类的决策树法的教学质量评... 以目前的高等学校教育为平台,就如何将数据挖掘技术与教学质量评价相结合的问题进行了研究.通过教学质量评价指标体系的有效挖掘,运用模糊聚类的决策树技术来解决目前教学质量评价中的不合理性,提出基于模糊聚类的决策树法的教学质量评价方法,使教学质量评价公平、公正、合理、高效. 展开更多
关键词 数据挖掘 决策树 教学质量评价
下载PDF
一种新的无监督连续属性离散化方法 被引量:10
9
作者 花海洋 赵怀慈 《计算机工程与应用》 CSCD 北大核心 2011年第6期208-211,共4页
提出了一种基于聚类方法的无监督连续属性离散化算法,称为CAMNA(Clustering and Mergingon Numerical Attri-bute)算法。CAMNA算法通过聚类过程将数值值域划分为多个离散区间,根据类分布的指导信息优化合并相邻区间,实现理想的离散方案... 提出了一种基于聚类方法的无监督连续属性离散化算法,称为CAMNA(Clustering and Mergingon Numerical Attri-bute)算法。CAMNA算法通过聚类过程将数值值域划分为多个离散区间,根据类分布的指导信息优化合并相邻区间,实现理想的离散方案。通过实验证明该算法在保持执行效率较高的前提下,离散结果更加合理,生成的决策树结构简单,获得较少的分类规则,分类准确率也有提高。 展开更多
关键词 决策树 数值型属性 聚类区间 分类
下载PDF
基于大数据挖掘的终端换机模型 被引量:11
10
作者 王雪琼 熊珺洁 姚晓辉 《电信科学》 北大核心 2016年第12期43-52,共10页
目前,移动终端已成为运营商维系用户、拓展市场的战略重心,提升移动终端销量、扩大终端规模是各运营商的工作重点。基于数据挖掘技术,从用户属性、终端使用信息、终端搜索访问信息等维度出发,挖掘海量用户行为数据价值,建立终端换机模型... 目前,移动终端已成为运营商维系用户、拓展市场的战略重心,提升移动终端销量、扩大终端规模是各运营商的工作重点。基于数据挖掘技术,从用户属性、终端使用信息、终端搜索访问信息等维度出发,挖掘海量用户行为数据价值,建立终端换机模型,具体包括基于决策树算法的用户换机倾向识别模型和基于聚类算法的终端推荐模型,助力移动终端精准营销。 展开更多
关键词 移动终端营销 数据挖掘 决策树 聚类算法
下载PDF
数据挖掘技术在企业市场营销中的应用 被引量:6
11
作者 黄章树 廖华良 《物流科技》 2004年第6期39-42,共4页
本文论述了神经网络、决策树、聚类分析等挖掘技术在某电信增值业务提供商的市场营销中的实际应用情况及所取得的效果。
关键词 数据挖掘技术 企业 市场营销 神经网络 决策树 聚类分析
下载PDF
汉语连续语音识别中上下文相关的识别单元(三音子)的研究 被引量:4
12
作者 赵庆卫 王作英 陆大 《电子学报》 EI CAS CSCD 北大核心 1999年第6期79-82,117,共5页
本文详细研究了汉语语音识别中如何有效地建立上下文相关的识别单元,以解决连续语音之间的协同发音问题.本文首先利用信息论原理,研究了传统的聚类算法的距离测度,分别是模型分布的散度和模型合并或分裂前后熵的变化值.然后本文提... 本文详细研究了汉语语音识别中如何有效地建立上下文相关的识别单元,以解决连续语音之间的协同发音问题.本文首先利用信息论原理,研究了传统的聚类算法的距离测度,分别是模型分布的散度和模型合并或分裂前后熵的变化值.然后本文提出了基于决策树的聚类方法,它的主要优点是充分利用了语音学知识,聚类后得到的模型可推广性好,尤其适用于集外语料中出现大量的未在训练语料中出现的三音子单元的情况.接着介绍了模型聚类和训练的实验步骤最后,非特定人大词汇量连续语音识别的实验表明,基于决策树的聚类方法所得到的识别单元,当识别集外语料时使系统的误识率降低了7.95%,而基于合并的聚类方法所得到的识别单元只降低了2.63%. 展开更多
关键词 连续语音识别 上下文相关 决策树 聚类算法
下载PDF
基于数据挖掘技术的航空客户流失与细分研究及R语言程序实现 被引量:9
13
作者 张利利 马艳琴 《数学的实践与认识》 北大核心 2019年第6期134-142,共9页
提高航空客运的上座率既能使航空资源得到充分利用,更能显著的增加航空公司的效益.主要从某航空公司旅客乘机记录中对航空公司的客户进行行为分析,采用数据挖掘技术,首先利用决策树方法对客户进行流失预测,然后利用K-均值聚类进行客户细... 提高航空客运的上座率既能使航空资源得到充分利用,更能显著的增加航空公司的效益.主要从某航空公司旅客乘机记录中对航空公司的客户进行行为分析,采用数据挖掘技术,首先利用决策树方法对客户进行流失预测,然后利用K-均值聚类进行客户细分,将客户划分为五类,同时对客户进行价值评估,挖掘出有价值的客户,最后综合分析客户流失与客户细分结果,并提出相应的营销策略,从而达到提高上座率和效益的目标. 展开更多
关键词 决策树 聚类分析 客户细分 客户流失
原文传递
基于语音识别的农产品价格信息采集方法 被引量:8
14
作者 许金普 诸叶平 《中国农业科学》 CAS CSCD 北大核心 2015年第3期449-459,共11页
【目的】将语音识别技术应用到农产品价格信息采集中,面向非特定人和限定词汇量的汉语普通话连续语音识别,提出一种适合于农产品价格采集环境的语音识别鲁棒性方法;以隐马尔科夫模型为基础,训练出适合该环境下的声学模型,以缓解因测试... 【目的】将语音识别技术应用到农产品价格信息采集中,面向非特定人和限定词汇量的汉语普通话连续语音识别,提出一种适合于农产品价格采集环境的语音识别鲁棒性方法;以隐马尔科夫模型为基础,训练出适合该环境下的声学模型,以缓解因测试环境和训练环境不匹配而导致的识别率降低,进一步提高识别率。【方法】在数据采集和处理阶段,首先根据要识别的限定词汇按照一定的语法规则构建转换文法,利用该文法生成的脚本指导训练集和测试集录音;然后选择不同的农产品价格采集环境和不同的说话人进行语音采集,并进行准确的人工切分,最后构建出语音语料库;在模型训练阶段,选择自左向右无跳转结构的连续混合密度隐马尔科夫模型,对训练集中的数据提取39维的MFCC特征向量,用于模型训练。首先以单音素为建模单元,并分别训练基于隐马尔科夫模型的男声模型、女声模型及男女混合声学模型;然后,考虑到单音素稳定性差和易受协同发音现象影响等因素,以上下文相关的三音素为识别单元建模,重新训练上述模型;针对三音子建模单元带来的模型数量大量增加,进而造成的训练样本不足问题,采用决策树状态聚类方法来改善该问题;决策树的构建过程中,利用语音学知识,根据声母发音方式、发音部位的不同以及韵母构成、韵头的不同,划分出若干声韵母集合实现了二值问题集的设计;在此基础上,用增加混和高斯分量的方法来进一步使得模型描述更加精确;最后,为了解决信道的乘性噪声问题,在采用上述策略的同时利用CMN和CVN方法来缓解测试环境与训练环境不匹配问题,最终训练得到了相应的男声模型和女声模型。在测试阶段,对采用上述各方法后得到的不同模型,分别采用相同的测试集进行试验,得出不同方法下的句子识别率、词识别率以及精准度。� 展开更多
关键词 语音识别 农产品价格 信息采集 倒谱均值方差归一化(CMVN) 决策树聚类
下载PDF
雷64区块砂砾岩储层岩性识别方法研究 被引量:7
15
作者 宋延杰 王团 +1 位作者 付健 邓鑫 《哈尔滨商业大学学报(自然科学版)》 CAS 2015年第1期73-78,89,共7页
在取心、岩石物理实验的基础上,采用统计方法对雷64区的岩性进行研究,将其分为砂质细砾岩和不等粒砂岩两大类.利用直方图法优选出识别这两大类岩性的敏感测井曲线,并且依据优选出来的敏感测井曲线,建立了用于识别砂质细砾岩和不等粒砂... 在取心、岩石物理实验的基础上,采用统计方法对雷64区的岩性进行研究,将其分为砂质细砾岩和不等粒砂岩两大类.利用直方图法优选出识别这两大类岩性的敏感测井曲线,并且依据优选出来的敏感测井曲线,建立了用于识别砂质细砾岩和不等粒砂岩的测井响应交会图法、决策树模型、系统聚类模型.通过对上述三种模型进行精度分析,发现决策树模型的精度要高于测井响应交会图法和系统聚类模型.同时利用所建立的两种决策树模型对雷71井进行岩性识别,将识别结果与实际取心对比,发现综合判断准确率均大于85%.结果表明,给出的决策树模型可很好地用于该地区砂砾岩储层的岩性识别. 展开更多
关键词 砂质细砾岩 不等粒砂岩 岩性识别 决策树 测井响应交会图 系统聚类
下载PDF
基于数据挖掘技术的高校教学质量监控研究 被引量:7
16
作者 郭欣 章鸣嬛 +1 位作者 吴良 陈瑛 《微型电脑应用》 2020年第1期7-10,21,共5页
教学质量监控是学校进行教学质量管理的重要手段,对提高教学质量具有重要意义。随着校园信息化的发展,高校教务系统里积存了大量有价值的数据,但却没有被很好的挖掘利用。鉴此提出将数据挖掘技术应用到高校教学质量监控中,使用因子分析... 教学质量监控是学校进行教学质量管理的重要手段,对提高教学质量具有重要意义。随着校园信息化的发展,高校教务系统里积存了大量有价值的数据,但却没有被很好的挖掘利用。鉴此提出将数据挖掘技术应用到高校教学质量监控中,使用因子分析法对计算机专业的学生成绩进行综合评价分析,并提出一种决策树改良方法对学生成绩进行预测,最后针对文中所提出的方法与其他方法进行了对比分析。结果表明,因子分析法相对于平均分排名法,蕴含了更多的信息量可以提供更加全面的评价,另外其突出重要因素,可以对各方面情况进行合理量化;决策树改良方法相对于其他成绩预测方法稳定性好、准确性高,且过拟合情况少。经验证,这个方法可以在高校教学质量监控中发挥一定作用。 展开更多
关键词 数据挖掘技术 教学质量监控 因子分析 决策树 聚类
下载PDF
基于决策树的神经网络规则抽取方法 被引量:5
17
作者 侯广坤 张劲峰 《中山大学学报(自然科学版)》 CAS CSCD 北大核心 2000年第4期27-30,共4页
将从神经网络中抽取一个可理解的模型视为一个归纳学习任务 ,其中 ,目标概念就是神经网络表达的功能 ,所生成的可理解模型是一个能很好近似神经网络的决策树 .在这个过程中 ,应用了决策树归纳学习的优化原则 ,使得生成的决策树能最简洁... 将从神经网络中抽取一个可理解的模型视为一个归纳学习任务 ,其中 ,目标概念就是神经网络表达的功能 ,所生成的可理解模型是一个能很好近似神经网络的决策树 .在这个过程中 ,应用了决策树归纳学习的优化原则 ,使得生成的决策树能最简洁、准确地描述神经网络学到的知识 .实验证明 ,生成的决策树可以很好地近似神经网络 ,且比用传统方法生成的决策树具有更好的分类精度 ,同时NNtoDT算法也保持了具有较好的通用性和可扩充性的特性 . 展开更多
关键词 神经网络规则抽取 决策树 归纳学习 NNtoDT算法
下载PDF
一种加权聚类划分决策树算法 被引量:7
18
作者 刘振宇 褚娜 《电讯技术》 北大核心 2020年第11期1354-1360,共7页
针对斜划分决策树算法普遍存在时间效率低、部分算法仅能应用于二分类问题,提出了一种基于加权距离的聚类决策树算法。通过Relief-F算法为预测属性计算权重,并将权重用于树结点中数据的聚类过程,使用分簇结果对结点进行多路划分,得到可... 针对斜划分决策树算法普遍存在时间效率低、部分算法仅能应用于二分类问题,提出了一种基于加权距离的聚类决策树算法。通过Relief-F算法为预测属性计算权重,并将权重用于树结点中数据的聚类过程,使用分簇结果对结点进行多路划分,得到可直接用于多分类问题的决策树。理论分析和实验结果表明,该算法与经典轴平行决策树相比,拥有更好的泛化能力以及相近的算法时间复杂度,与大部分斜决策树相比,在付出更少计算代价的前提下,获得了近似的正确率以及模型简洁度。 展开更多
关键词 机器学习 决策树 聚类 属性加权 多路划分
下载PDF
基于聚类分析和CHAID决策树算法的航班延误预测研究 被引量:6
19
作者 周覃 高强 +1 位作者 马农 王翠英 《武汉理工大学学报》 CAS 北大核心 2017年第11期32-40,共9页
近年来航班延误日益严重,严重影响民航发展。收集国内某大型航空公司全网络中近3年来的运行数据,利用数据挖掘技术对其分析处理。首先分析各个因素(时刻、月份、机型、机场)-平均延误时间的基本特征;在延误分析的基础上,针对机场-延误关... 近年来航班延误日益严重,严重影响民航发展。收集国内某大型航空公司全网络中近3年来的运行数据,利用数据挖掘技术对其分析处理。首先分析各个因素(时刻、月份、机型、机场)-平均延误时间的基本特征;在延误分析的基础上,针对机场-延误关系,应用K-means聚类算法对机场繁忙程度聚类分析,使机场属性值更加精确,提高预测时效性和精确度;接着加入延误因素属性,使用CHAID决策树算法对航空公司全网络近3年数据进行训练,并使用该训练模型分类预测近半年数据。实验结果表明,模型正确率接近80%。该方法可以对延误进行精确预测,协助航空公司对延误采取针对措施。 展开更多
关键词 航班延误 延误预测 CHAID决策树 聚类分析
原文传递
基于机器学习的风化硅酸盐玻璃原成分预测及亚分类方法 被引量:4
20
作者 王祉皓 赵芗溦 +3 位作者 李智群 郭明 肖琬玥 刘志坚 《硅酸盐学报》 EI CAS CSCD 北大核心 2023年第2期416-426,共11页
玻璃在中国史料中早有记载,但是由于长期存在名称和质地的混淆,且近现代有关中国古代玻璃的研究起步较晚,关于古代硅酸盐玻璃的风化和成分研究比较缺乏。以往研究古代玻璃器的著作,多是从王朝更替的角度,对文化交流、化学分析等方面研... 玻璃在中国史料中早有记载,但是由于长期存在名称和质地的混淆,且近现代有关中国古代玻璃的研究起步较晚,关于古代硅酸盐玻璃的风化和成分研究比较缺乏。以往研究古代玻璃器的著作,多是从王朝更替的角度,对文化交流、化学分析等方面研究玻璃的文化艺术形态及其自身的运行发展的规律,较少有学者系统建立数学模型并使用智能算法定性定量开展风化硅酸盐玻璃原成分预测及亚分类方法研究。本工作以多组风化和未风化硅酸盐玻璃为研究对象,提取其化学成分含量、纹饰和颜色等数据,利用Spearman系数分析了纹饰、颜色和玻璃大类之间的相关性并研究影响表面风化的因素;利用决策树进行大致分类,然后用神经网络预测玻璃风化前主要化学成分的含量,并总结硅酸盐玻璃的分类依据。此后通过K-means聚类建立分类模型:确定最佳类别数,进行亚类划分,寻找铅钡玻璃和高钾玻璃的最优分类数量。研究结果表明,只有玻璃类型对表面风化具有显著影响;风化过程中参与度较高的化学成分为二氧化硅、氧化铝、氧化铅、氧化钡、氧化铅和五氧化二磷;风化后,铅钡玻璃二氧化硅含量明显下降,氧化铅含量明显上升,而高钾玻璃二氧化硅含量明显上升,氧化钾氧化钙和氧化铝含量明显下降;高钾玻璃分为3个亚类,铅钡玻璃分为4个亚类。为后续利用机器学习研究古代硅酸盐玻璃的风化和成分提供了参考。 展开更多
关键词 硅酸盐玻璃 决策树 神经网络 K-MEANS聚类 Spearman相关性
原文传递
上一页 1 2 4 下一页 到第
使用帮助 返回顶部