-
题名基于聚类的数据预处理对模糊决策树产生的影响
被引量:3
- 1
-
-
作者
王熙照
谢凯
-
机构
河北大学数学与计算机学院机器学习中心
-
出处
《计算机工程与应用》
CSCD
北大核心
2006年第1期156-158,186,共4页
-
文摘
在模糊决策树归纳过程中,数据的模糊化预处理通常使用三角形隶属函数,该隶属函数的中心点参数将决定数据模糊化的效果,进而影响模糊决策树的执行效率、精度和规模。Kohonen'sfeature-maps聚类算法能够用来选取连续属性值的中心点。实验研究表明,该算法选取的中心点使模糊子集之间的覆盖范围不再相同,因而能够更合理地表示模糊概念之间的重叠关系。通过与其它算法比较证明该算法使模糊决策树可以获得更高的分类精度。
-
关键词
模糊决策树归纳
模糊集合理论
数据预处理
模糊化
聚类
隶属函数
-
Keywords
fuzzy decision tree induction, fuzzy set theory, data preprocessing, fuzzification, clustering, membership function
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名多分类器融合系统中模糊测度的确定
被引量:1
- 2
-
-
作者
陈俊芬
何强
范铁钢
-
机构
河北大学数学与计算机学院机器学习中心
-
出处
《模糊系统与数学》
CSCD
北大核心
2007年第3期107-110,共4页
-
基金
河北大学青年基金资助项目
-
文摘
有限事例集上,choquet模糊积分的计算可以转化成模糊测度的线性组合,故可以使用标准的优化技术来确定模糊测度。本文使用线性规划来确定模糊测度,数据库上的仿真实验表明,线性规划确定的模糊测度的系统融合精度比多数投票法和加权平均法的分类精度要高。
-
关键词
模糊测度
模糊积分
线性规划
多数投票法
加权平均法
-
Keywords
Fuzzy Measure
Fuzzy Integral
Linear Programming
Majority Vote
Weighted Average
-
分类号
O159
[理学—数学]
-
-
题名敏感属性与不敏感属性对决策树的影响
被引量:1
- 3
-
-
作者
王金凤
王熙照
-
机构
河北大学数学与计算机学院机器学习中心
-
出处
《计算机工程与应用》
CSCD
北大核心
2003年第26期78-80,共3页
-
基金
河北省自然科学基金(编号:698139)
-
文摘
目前,已有许多种构建决策树的方法。大多数是基于信息熵的,例如,ID3算法,Min-Ambiguity算法以及它们的变异。文中提出了一种新的启发式算法,它是基于属性对于分类的重要程度的。在选择扩展属性时,有两个选择,即敏感属性和不敏感属性,通常人们习惯选择敏感属性而忽视了不敏感属性。文章主要将其应用到了几个具有符号型属性类分明的数据库。根据对几个数据库所做的实验,对这两种方法从几方面进行了比较,指出了他们各自的利弊所在。
-
关键词
决策树
属性重要度
敏感属性
不敏感属性
-
Keywords
decision tree,importance of attribute,sensitive attribute,insensitive attribute
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于模糊扩张矩阵的启发式算法
被引量:1
- 4
-
-
作者
王熙照
闫磊凡
-
机构
河北大学数学与计算机学院机器学习中心
-
出处
《计算机工程与应用》
CSCD
北大核心
2005年第34期31-33,共3页
-
基金
国家自然科学基金资助项目(编号:60473045)
河北省自然科学基金资助项目(编号:603137)
-
文摘
扩张矩阵是一种规则归纳的方法。在模糊环境下,模糊扩张矩阵算法根据路径的最小模糊信息熵标准,从示例中归纳产生一组模糊规则。本文引入评价矩阵的概念,并使用近似集合覆盖算法的思想,对上述模糊规则归纳方法做了改进。实验结果表明,与原算法相比,改进后的版本增添了许多优点,比如,得到的规则较少,运算速度较快等。
-
关键词
扩张矩阵
模糊熵
评价矩阵
集合覆盖
启发式算法
-
Keywords
extension matrix, fuzzy entropy, evaluation matrix, set-covering, heuristic algorithm
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名基于信息熵的神经网络敏感性分析
- 5
-
-
作者
李海峰
齐鸿志
-
机构
河北大学教务处
河北大学数学与计算机学院机器学习中心
河北大学计算中心
-
出处
《河北农业大学学报》
CAS
CSCD
北大核心
2013年第4期110-114,共5页
-
基金
保定市科学技术研究与发展指导计划项目(12ZG005)
-
文摘
基于神经网络的敏感性分析的神经网络结构剪枝,经常会遇到剪枝决策不够客观的问题。针对这个问题,文章提出了基于信息熵的神经网络敏感性的定义,该定义可以客观的评估神经网络对各个输入变量的敏感性,并采用Zurada提出的最大间隔算法决定剪枝个数,使得在整个神经网络的剪枝过程中没有凭主观经验而决定的参数问题。模拟实验结果说明,基于信息熵定义的神经网络敏感性,在网络剪枝的应用中可以相对保守的删除输入变量的个数,使网络的泛化性能不降低。
-
关键词
信息熵
最大熵
神经网络
敏感性定义
-
Keywords
information entropy
maximum entropy
neural network
sensitivity definition
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-