题名 基于粗集理论的数据离散化方法
被引量:34
1
作者
赵军
王国胤
吴中福
唐宏
李华
机构
重庆邮电学院计算机科学与技术研究所
重庆大学计算机学院
出处
《小型微型计算机系统》
CSCD
北大核心
2004年第1期60-64,共5页
基金
国家自然科学基金(69803014)资助
攀登特别支持费
+3 种基金
教育部高等学校骨干教师资助计划(GG-520-10617-1001)资助
教育部留学回国人员科研启动基金
重庆市科委攻关基金
重点市中青年优秀骨干教师基金资助
文摘
对后继阶段的机器学习或数据挖掘过程而言 ,决策系统中连续属性值的离散化具有非常重要的意义 .本文系统地研究了基于粗集理论的数据离散化方法 :提出一种计算候选断点集合的算法 ;定义概念“选择概率”来合理、有效地度量和区分候选断点的相对重要性 ;最后基于这一概念提出一种确定结果断点子集的启发式算法 .理论分析及仿真结果表明 ,算法的综合性能优于文献报道的同类算法 .
关键词
粗集
离散化
候选 断点
结果断点
选择概率
Keywords
Rough Set
Discretization
Candidate Cuts
Result Cuts
Selection Possibility
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 基于决策的剥离式连续属性离散化算法
被引量:5
2
作者
潘巍
李晋川
王阳生
杨宏戟
机构
首都师范大学信息工程学院
四川大学
中国科学院自动化研究所模式识别国家重点实验室
Software Technology Research Laboratory
出处
《计算机科学》
CSCD
北大核心
2007年第8期208-210,共3页
基金
国家863高技术研究发展计划项目(编号:2003AA114020)
文摘
针对粗糙集理论只能处理离散数据的局限,提出了基于决策的剥离式连续属性离散化方法,一改传统的候选断点集合的获取方法,直接通过分析连续属性在各决策类的取值范围和计算属性重要度,完成对连续属性的初步离散。此外,本文提出候选断点集的推移原则,可逐步减小候选断点集的范围。由于每次都是针对尚不能明确分类的样本进行细化,因此随着候选断点集的减少和明确分类样本的增加,系统能够迅速收敛,并且离散化后的决策表总是相容的,这与目前很多离散方法不考虑决策相容性相比,能够最大限度地保留系统的有用信息。本文提出的离散化方法是领域独立的,不需要领域知识,可应用于不同领域的连续属性的离散化。
关键词
粗糙集理论
属性离散化
候选 断点
决策相容性
Keywords
Rough set theory, Attribute discretization, Candidate point, Decision consistency
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
题名 基于区分矩阵的数据离散化算法
被引量:3
3
作者
秦川
黄欢
施化吉
李星毅
机构
江苏大学计算机学院
北京交通大学电子信息学院
出处
《计算机工程与应用》
CSCD
北大核心
2008年第35期148-150,共3页
基金
国家火炬计划(No.2004EB33006)
江苏省高校自然科学指导性计划项目(No.05JKD520050)
文摘
由于传统的粗糙理论只能对数据库中离散数据进行处理,而绝大多数现实的数据库既包含了离散数据,又包含了连续数据。针对这一问题,提出了一种基于候选断点区分矩阵的数据离散化算法。该方法以断点核为起点,以候选断点在区分矩阵中出现的频率作为启发信息,逐次选择最重要的断点加入到结果断点子集中,并由最终的断点集得离散化后的信息系统。最后通过实例分析表明,该算法具有较好的离散化效果。
关键词
粗糙集
离散化
断点 核
候选 断点
启发式算法
Keywords
rough set
discretization
cuts core
candidate cuts
heuristic algorithm
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 基于粗糙集理论的属性离散化算法
被引量:3
4
作者
陈昊
张旻
杨俊安
机构
解放军电子工程学院
出处
《计算机工程与应用》
CSCD
北大核心
2008年第13期30-32,共3页
基金
国家自然科学基金(the National Natural Science Foundation of China under Grant No.60175018)
安徽省自然科学基金(the Natural Science Foundation of Anhui Province of China under Grant No.050420101)
文摘
决策系统中连续属性离散化,即将一个连续属性分为若干属性区间并为每个区间确定一个离散型数值,对后继阶段的机器学习具有重要的意义。首先研究了满足决策系统最优划分的一种计算候选断点集合的算法,然后在基于条件属性重要度和贪心算法的基础上提出了一种确定结果断点子集的新启发式算法。所提出的属性离散算法考虑并体现了粗糙集理论的基本特点和优点,并能取得较理想的连续属性离散化结果。
关键词
粗糙集
最优划分
离散化
候选 断点
结果断点
Keywords
rough set
best partition
discretization
candidate cuts
result cuts
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 一种多值决策属性的决策系统的离散化算法
被引量:1
5
作者
陈昊
杨俊安
王岩
庄镇泉
机构
解放军电子工程学院
安徽省电子制约技术重点实验室
中国科学技术大学电子科学与技术系
出处
《小型微型计算机系统》
CSCD
北大核心
2010年第10期1989-1992,共4页
基金
国家自然科学基金项目(60872113)资助
安徽省自然科学基金项目(050420101)资助
文摘
决策系统中连续属性的离散化,即实型属性空间向整型属性空间的映射,它是对决策表中属性约简的第一步.针对多值决策属性的决策信息系统,提出一种新的属性离散化算法.首先根据决策属性的不同,将条件属性集划分为不同的序列,对每两个序列求取候选断点,最后,综合所有的候选断点即为所求的候选断点集合;然后在基于条件属性重要度和贪心算法的基础上提出一种确定结果断点子集的新启发式算法.实例验证了本文所提出的算法能够取得较理想的连续属性离散化结果.
关键词
粗糙集
多值决策属性
离散化
候选 断点
结果断点
Keywords
rough set
multi-value decision attributes
discretization
candidate cuts
result cuts
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 基于粗糙集的贝叶斯网络连续变量离散化算法
6
作者
瞿英
李萍
吴祈宗
贾建
机构
北京理工大学管理与经济学院
河北科技大学经济与管理学院
河北远东哈里斯通信有限公司市场部
出处
《计算机应用》
CSCD
北大核心
2009年第9期2491-2493,2508,共4页
基金
河北省教育厅软科学基金资助项目(2007205)
河北省科技厅科技支撑计划项目(09213509D)
文摘
分析了布尔逻辑和粗糙集理论相结合的离散化算法在贝叶斯网络建模中应用的局限性,提出基于断点值逐次扫描划分实例对的连续变量离散化算法,改变了原算法中基于断点区间划分实例对的计算方法,应用实例表明,该算法时间复杂度和空间复杂度较低,具有较强的实用性,更适用于贝叶斯网络中的连续数据离散化处理。
关键词
粗糙集理论
连续变量离散化
候选 断点
贝叶斯网络
信息表
Keywords
Rough Set (RS) theory
discretizing continuous variables
candidate cut
Bayesian network
information table
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]