-
题名决策树简化(剪切)方法综述
被引量:13
- 1
-
-
作者
王熙照
游自英
-
机构
河北大学数学与计算机学院机器学习研究中心
-
出处
《计算机工程与应用》
CSCD
北大核心
2004年第27期66-69,共4页
-
基金
教育部科学技术研究重点项目(编号:03017)
河北省自然科学基金项目(编号:603137)
河北省教育厅博士基金项目(编号:B2003117)资助
-
文摘
树的简化是决策树归纳学习中关键的部分。论文是决策树简化方法的一个综述,包括预剪枝、后剪枝和其它方法。文中叙述了多种著名的剪枝方法,各种方法的优缺点及对其的改进和变型。
-
关键词
决策树简化
剪枝
预剪枝
后剪枝
-
Keywords
simplifying decision trees,pruning,pre-pruning,post-pruning
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名决策树中避免过度拟合的方法
被引量:2
- 2
-
-
作者
王黎明
刘华
-
机构
武汉理工大学计算机科学与技术学院
-
出处
《软件导刊》
2006年第10期80-82,共3页
-
文摘
通过学习训练数据集来构造分类树的策略可能无法达到最好的泛化性能。随机噪声和某些决策仅基于少量训练数据的情况都会导致决策树的分类精度下降,并且过度拟合训练数据集。避免过度拟合主要是通过对树的剪枝来实现,包括预剪枝和后剪枝。后剪枝方法有很多种,主要从计算复杂性、误差估计和算法理论基础角度分析其中的REP、MEP和规则后剪枝算法。
-
关键词
噪声
过度拟合
误差
后剪枝
降低误差剪枝
最小误差剪枝
规则后剪枝
-
Keywords
noise
over-fitting
post-pruning
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于改进C4.5算法的森林火险天气等级评估
被引量:2
- 3
-
-
作者
李斌
陈爱斌
周涛
张雷
-
机构
中南林业科技大学计算机与信息工程学院
湖南省森林消防航空护林站
-
出处
《湖南林业科技》
2018年第1期36-40,共5页
-
基金
引进国际先进林业科学技术项目(国家948项目)
项目编号:2014-4-09
+1 种基金
湖南省研究生科技创新基金项目(NO.CX2017B407)
中南林业科技大学研究生科技创新基金项目(NO.CX2017B16)
-
文摘
应用数据挖掘技术,对影响林火的因子进行数据分析与综合评估。针对林火这一课题的特殊性与复杂性,采用一种改进的C4.5决策树算法对森林火险天气等级进行评估决策。该算法着眼于从一组互不相关的事例中推算出以决策树为表现形式分类规则,并采用基于可信度阈值的后剪枝技术降低决策树纯度。基于算法原理,综合分析了温度、湿度、风力等林火因子数据集,分析了决策树算法应用于数据分类和知识发现的过程和特点,研究了该决策树模型在天气评估中的应用,建立了一套森林火险天气等级评估方法。通过试验表明,林火等级与各林火因子数据集之间建立了有机联系,实现了该算法在林火等级评估方面应用的可能,同时,也指出了该算法应用的局限性与待解决的问题。
-
关键词
C4.5算法
火险等级
决策树
后剪枝
评估
-
Keywords
C4.5 algorithm
fire danger grade
decision tree
post-pruning
evaluation
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
S762
[自动化与计算机技术—计算机科学与技术]
-
-
题名基于自适应目标偏置系数的机械臂路径规划算法
被引量:1
- 4
-
-
作者
吴文迎
蔡锦达
高朋帅
-
机构
上海理工大学出版印刷与艺术设计学院
-
出处
《轻工机械》
CAS
2022年第1期34-42,共9页
-
文摘
针对快速搜索随机树(RRT)算法因其随机特性导致的运行时间过长和计算结果往往不是最优解的问题,在RRT算法及其改进算法的基础上,课题组提出了一种基于自适应目标偏置系数的机械臂路径规划算法,并将该算法应用到医疗设备无影灯的使用中。首先,用D-H参数法对6自由度机械臂进行运动学描述和正运动学求解,得到末端的运动状态和位姿;然后,综合RRT算法及其改进算法的优点拓展新节点和重置父节点,并引入自适应目标偏置系数,再对路径作剪枝后处理。对比实验结果显示:该方法在保证算法搜索效率的基础上,有效地提高了路径质量。基于ROS的仿真平台验证了该方法具有实用性和可行性。
-
关键词
机械臂
路径规划
快速搜索随机树算法
D-H参数法
自适应目标偏置
剪枝后处理
-
Keywords
manipulator
path planning
RRT(Rapid-Exploration Random Tree)algorithm
D-H parameter method
adaptive target offset
post-pruning
-
分类号
TP241
[自动化与计算机技术—检测技术与自动化装置]
TH165
[自动化与计算机技术—控制科学与工程]
-
-
题名决策树后剪枝算法的研究
被引量:9
- 5
-
-
作者
范洁
杨岳湘
-
机构
湖南广播电视大学
国防科技大学计算机学院
-
出处
《湖南广播电视大学学报》
2005年第1期54-56,共3页
-
文摘
决策树学习策略广泛应用于模式识别和机器学习等领域 ,用来解决与分类相关的问题。决策树剪枝的作用是简化决策树 ,提高决策树的泛化能力 ,避免对训练集的过适应 ,是决策树学习中的重要研究内容。本文详细描述了常用的四种后剪枝算法 ,分析了后剪枝技术的研究与发展现状 ,为具体应用中选择剪枝算法提供了一定的理论基础。
-
关键词
决策树
后剪枝
过适应
过剪枝
欠剪枝
-
Keywords
Decision tree post-pruning methods Overfitting Overpruning Underpruning
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名贝叶斯的决策树剪枝算法在学科评审中的研究
被引量:3
- 6
-
-
作者
张文超
李亚芬
王普
-
机构
北京工业大学电子信息与控制工程学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2013年第11期3873-3877,共5页
-
文摘
为了解决决策树C4.5算法生成的决策树过度拟合训练样本,泛化能力低的问题,提出了一种基于贝叶斯理论的决策树后剪枝算法。该算法利用贝叶斯后验定律,对决策树C4.5算法所生成的决策树的每一个分枝进行验证,将不能满足条件的分枝从该决策树中去除,生成一个简单的树。对北京市重点学科信息平台和硕、博授予点平台提供的学科历史审批数据进行实验验证。实验结果表明,该算法可以剪掉大多数不可靠分枝和过拟合分枝,较决策树C4.5算法对新数据的分类有着更高的预测精度。
-
关键词
决策树CA
5
后剪枝
数据挖掘
决策支持
-
Keywords
decision tree C4. 5
post-pruning~ data mining
decision support
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名CART决策树在旅游保险数据中的研究
- 7
-
-
作者
王舜
-
机构
贵州财经大学
-
出处
《软件》
2022年第10期122-124,共3页
-
文摘
通过CART分类决策树,找到各指标对是否购买该公司旅游保险的影响程度,使得旅游保险行业更容易寻求到更多的潜在的在保人。对Tour&Traves公司提供的数千条客户基本信息进行处理,利用CART决策树算法对该数据进行分析以及建立模型,并对决策树模型进行评价和可视化输出。为了避免原模型过拟合的问题,在原有CART分类决策树模型进行后剪枝,在不减少模型正确率的情况下降低了模型的复杂度。
-
关键词
CART决策树
后剪枝算法
旅游保险
-
Keywords
CART decision tree
post-pruning algorithm
travel insurance
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名基于决策树结构特性的后剪枝技术研究
被引量:1
- 8
-
-
作者
王代星
张小平
王翰虎
-
机构
贵州大学计算机科学与信息学院
贵州省科学技术情报研究所
-
出处
《电脑与信息技术》
2010年第4期1-4,16,共5页
-
文摘
文章从决策树自身结构出发,总结出了三条后剪枝规则,并通过决策树的树形结构和规则集两种等价的表示方式,讨论了剪枝技术的实现。该方法无需任何其它先验知识,简洁高效,易于实现,易于实现图形化可视界面,且100%拟合训练数据集,可以独立使用,也可以作为其它剪枝算法的基础,从而加快其它算法的收敛速度。
-
关键词
决策树
分类规则
后剪枝技术
-
Keywords
decision tree
classification rules
post-pruning technique
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
TP301.6
[自动化与计算机技术—计算机科学与技术]
-
-
题名决策树剪枝方法的比较
被引量:42
- 9
-
-
作者
魏红宁
-
机构
西南交通大学校长办公室
-
出处
《西南交通大学学报》
EI
CSCD
北大核心
2005年第1期44-48,共5页
-
文摘
为在决策树剪枝中正确选择剪枝方法,基于理论分析和算例详细地比较了当前主要的4种剪枝方法的计算复杂性、剪枝方式、误差估计和理论基础.与PEP相比,MEP产生的树精度较小且树较大;REP是最简单的剪枝方法之一,但需要独立剪枝集;在同样精度情况下,CCP比REP产生的树小.如果训练数据集丰富,可以选择REP,如果训练数据集较少且剪枝精度要求较高,则可以选用PEP.
-
关键词
数据挖掘
决策树
事后剪枝
PEP
MEP
REP
CCP
-
Keywords
data mining
decision tree
post pruning
pessimistic error pruning
minimum error pruning
reduced error pruning
cost-complexity pruning
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名决策树分类算法的分析和比较
被引量:6
- 10
-
-
作者
刘莺迎
-
机构
郑州大学信息管理系
-
出处
《科技情报开发与经济》
2008年第2期65-67,共3页
-
文摘
在数据挖掘中存在多种算法,决策树分类算法是应用比较多的一种。基于决策树分类算法的研究现状,对各种决策树分类算法的基本思想进行了阐述,并对不同的算法进行了分析和比较。
-
关键词
决策树分类算法
ID3
后剪枝
GINI系数
-
Keywords
decision tree classification algorithm
ID3
post pruning
GINI coefficient
-
分类号
TP274
[自动化与计算机技术—检测技术与自动化装置]
TP31
[自动化与计算机技术—控制科学与工程]
-
-
题名模糊决策树的等效剪枝研究
- 11
-
-
作者
王熙照
董彦军
-
机构
河北大学数学与计算机学院机器学习研究中心
-
出处
《计算机工程与应用》
CSCD
北大核心
2006年第7期152-155,共4页
-
文摘
基于Min-Ambiguity启发式算法的模糊决策树整个建立过程均是在给定的一个显著性水平参数基础上进行,该参数值的选择对于模糊决策树性能将产生重要影响。文章通过实验研究表明,在某一特定取值区间内,随着该参数值的逐步增大,可以使得模糊决策树在保持提高测试精度的前提下,使树的规模逐步减小,直至到达该参数的最优值,使树成为测试精度达到最优而树规模达到最小的一棵。而再度增大的此参数值(已超出该区间)却会导致树的过度剪枝,使树的测试精度降低。最后,通过相同数据在清晰决策树系统(C4.5系统)后剪枝前后的比较试验进一步证实,在该区间内,逐步增大的此参数值对模糊决策树性能的影响等效于清晰决策树的后剪枝。
-
关键词
模糊决策树
清晰决策树
后剪枝
模糊熵
分类不确定性
-
Keywords
fuzzy decision tree,crisp decision tree,post pruning,fuzzy entropy,classification ambiguity
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于约束聚类的一种概念学习方法
被引量:3
- 12
-
-
作者
李敏强
李智
-
机构
天津大学管理学院
-
出处
《系统工程学报》
CSCD
2004年第5期482-488,共7页
-
基金
高等学校博士学科点专项科研基金资助项目(20020056047).
-
文摘
首先定义了字符属性例子空间中合取规则的可学习性,通过将正例集合划分为多个子集,其中每个子集在全体反例集合上均是合取规则可学习的,并建立了命题规则的一般学习模型.然后,提出了三种正例集合的自动聚类和划分方法:相似性度量、差异度量和规则长度等,并设计了一种快速的合取规则学习方法.同时,基于最小覆盖率和最小错误率给出了一种克服过学习问题的后处理方法.最后,针对一组典型的学习问题进行了实验计算,并与已有算法进行了对比分析.
-
关键词
约束聚类
概念学习
合取规则可学习性
过学习
后处理
机器学习
-
Keywords
propositional concept learning
constrained clustering
conjunctive rules learnability
overfitting
post pruning
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名决策树数据挖掘技术在医学诊断中的实现
被引量:5
- 13
-
-
作者
陈健
-
机构
福建商学院信息工程学院
-
出处
《佛山科学技术学院学报(自然科学版)》
CAS
2021年第2期47-52,共6页
-
文摘
在决策树数据挖掘技术上提出PEP后剪枝算法,对数据预处理、决策树的生成和导出决策规则及测试等问题进行了分析和研究,并建立了一个可视化系统,在分析有关医学诊断数据表的数据挖掘中,有些规则对于医学诊断具有一定的借鉴意义,取得了比较满意的实际应用成效。
-
关键词
决策树
PEP后剪枝算法
可视化
决策表
数据挖掘
-
Keywords
decision tree
PEP post pruning algorithm
visualization
decision table
data mining
-
分类号
R446.1
[医药卫生—诊断学]
TP18
[医药卫生—临床医学]
-
-
题名基于集合和剪枝原理的关联规则隐藏算法
被引量:2
- 14
-
-
作者
龚晨
王诗兵
-
机构
安徽理工大学计算机科学与工程学院
阜阳师范大学计算机与信息工程学院
-
出处
《阜阳师范学院学报(自然科学版)》
2019年第4期61-66,共6页
-
基金
安徽省高校优秀青年骨干人才国外访学研修项目(gxgwfx2018058)
阜阳师范大学产学研横向合作项目(XDHX2016029)资助
-
文摘
针对传统关联规则隐藏算法直接遍历数据集,而导致输入输出流资源浪费的问题,提出一种基于集合和剪枝原理的关联规则隐藏算法。该算法首先建立频繁模式树(FP-tree),利用后剪枝原理去除属性相同规则,减少了遍历原始数据集所耗I/O时间;然后通过建立集合来保存真实频繁序列,并以集合为单位隐藏关联规则,既保证数据集质量,又提高频繁序列挖掘效率。实验结果表明,该算法与GSP、SPADE算法相比较,不仅更好地保证了数据集的高质量,而且降低了20%~50%频繁序列挖掘时间,并在隐藏敏感规则上有较好的实用性。
-
关键词
关联规则隐藏
频繁模式树
后剪枝原理
集合
敏感规则
-
Keywords
association rule hiding
frequent pattern tree
post pruning principle
set
sensitive rules
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-