聚类思想在贝叶斯算法中的应用被引量：10

Application of Clustering Analysis in Bayesian Method

下载PDF

导出

摘要在数据挖掘过程中,缺损数据是不可避免的,因此,数据预处理是必不可少的前提工作。在传统的数据预处理工作中,朴素贝叶斯算法是最常用的缺损数据修补算法。然而,现实世界中的数据经常不满足其属性独立性假设,分类结果不令人满意。文章基于聚类分析思想,提出了一种改进的贝叶斯算法。对大量数据的计算结果表明此方法的合理性、可信度优于朴素贝叶斯算法。 The problem of defective data often arises during the course of data mining.Thus data preprocessing is necessary.In the traditional data preprocessing,naive Bayesian method is commonly used to remedy defective data. However,the assumption that attributes are independent is always unfit for data of real world,and the classification result is unsatisfactory.On the basis of clustering analysis ,this paper presents an improved Bayesian method.The result of calculations on mass data shows that this method is more reasonable and believable compared with naive Bayesian method.

作者余瑞康施润身

机构地区同济大学电子与信息工程学院

出处《计算机工程与应用》 CSCD 北大核心 2006年第28期159-160,163,共3页 Computer Engineering and Applications

关键词数据挖掘数据预处理聚类分析贝叶斯算法 data mining,data preproeessing,elustering analysis,Bayesian method

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献6

1杨炳儒.知识工程预知识发现[M].北京冶金工业出版社,2000 被引量：1
2王珊.数据仓库技术与联机分析处理[M].北京：科学出版社,1999.47-65. 被引量：52
3Jiawei Han,Micheline Kamber.Data Mining Concepts and Techniques[M].China Machine Press,2001 被引量：1
4Hung-Ju Huang,Chun-Nan Hsu.Bayesian Classification for Data From the Same Unknown Class.IEEE Transactions on Systems,2002 被引量：1
5A Famili,Wei-Min Shen,Richard Weber.Data Preprocessing and Intelligent Data Analysis[J].International Journal on Intelligent Data Analysis,1997 被引量：1
6Venter FJ.Knowledge Discovery in Databases Using Lattices.Expert System With Application,1997 被引量：1

共引文献51

1黄丽娟,郑雪峰,靳风荣.零售业数据仓库中ETL技术的研究[J].计算机与现代化,2004(9):63-65. 被引量：1
2付瑞雪,杨会志,陈军霞,鲍智文.一种超市OLAP系统的设计与实现[J].河北工业科技,2004,21(5):45-47. 被引量：7
3田海东,李静,陆菊康.OLAP数据挖掘引擎算法的设计与实现[J].计算机工程与设计,2004,25(12):2321-2323. 被引量：4
4付瑞雪,杨会志,陈军霞,鲍智文.基于C++Builder的多维分析的实现[J].河北工业科技,2005,22(1):35-37.
5冷泉鑫,李继华,马海英.基于Web的考试系统设计与实现[J].青海师范大学学报（自然科学版）,2005,21(1):59-62. 被引量：3
6尹卫刚,姜薇,刘桓,徐秀.基于数据仓库的煤矿物资管理系统的设计与实现[J].计算机工程与设计,2005,26(1):200-201. 被引量：9
7尤玉林,张宪民.一种可靠的数据仓库中ETL策略与架构设计[J].计算机工程与应用,2005,41(10):172-174. 被引量：45
8高文闽,曾平,李天荣.基于数据集市的多层OLAP应用模型[J].计算机与现代化,2005(4):70-72. 被引量：2
9别文群,钟其.基于数据挖掘的物流信息系统的分析和设计[J].物流技术,2005,24(6):83-84. 被引量：7
10胡海员.基于数据仓库的招生辅助决策支持系统研究[J].西南民族大学学报（人文社会科学版）,2005,26(7):338-340. 被引量：6

同被引文献98

1赵晓煜,黄小原.基于数据挖掘的客户价值预测方法[J].东北大学学报（自然科学版）,2006,27(12):1393-1396. 被引量：7
2季玉新.裂缝储层预测技术及应用[J].天然气工业,2007,27(S1):420-423. 被引量：3
3刘湛清.基于贝叶斯分类算法在中医临床证型诊断中的研究与实现[J].科技资讯,2007,5(22):148-148. 被引量：6
4赵秦怡,王丽珍,周丽华.一种基于朴素贝叶斯分类法的空间分类算法[J].云南大学学报（自然科学版）,2004,26(4):297-300. 被引量：1
5查青林,林色奇,吕爱平.多元统计分析在中医证候研究中的应用探析[J].江西中医学院学报,2004,16(6):79-80. 被引量：46
6唐发明,陈绵云,王仲东.基于支持向量机的仓储害虫声音识别[J].华中科技大学学报（自然科学版）,2005,33(2):34-36. 被引量：10
7王学伟,瞿海斌,王阶.一种基于数据挖掘的中医定量诊断方法[J].北京中医药大学学报,2005,28(1):4-7. 被引量：40
8万红新,彭云,聂承启.基于模糊集和粗糙集的关联规则挖掘策略[J].江西师范大学学报（自然科学版）,2005,29(1):23-25. 被引量：7
9苟量,彭真明.小波多尺度边缘检测及其在裂缝预测中的应用[J].石油地球物理勘探,2005,40(3):309-313. 被引量：47
10王学伟,瞿海斌,刘雪松,程翼宇.贝叶斯网络杂交学习算法及其在中医中的应用[J].浙江大学学报（工学版）,2005,39(7):948-952. 被引量：12

引证文献10

1陈宝君,包祖晓,张丽,李黎,何贵平,钟宇峰.抑郁症肝肾阳虚证的宏观辨证指标研究[J].中医药学报,2011,39(5):5-7. 被引量：20
2王洪春.缺失数据的主曲线恢复方法[J].微电子学与计算机,2008,25(11):160-161. 被引量：1
3吴为胜,武友新,游建平,万敏.一种基于线性的朴素贝叶斯分类器知识库的组织方法[J].计算机与现代化,2009(10):26-28.
4赵敏,倪志伟,刘斌.K-means与朴素贝叶斯在商务智能中的应用[J].计算机技术与发展,2010,20(4):179-182. 被引量：6
5李玲俐.数据挖掘中分类算法综述[J].重庆师范大学学报（自然科学版）,2011,28(4):44-47. 被引量：45
6彭兴媛,刘琼荪,王立威.基于条件互信息下聚类的朴素贝叶斯分类算法[J].云南大学学报（自然科学版）,2011,33(5):517-520. 被引量：4
7黄越,臧冽,聂盼盼.一种混合分类方法的研究与改进[J].计算机技术与发展,2012,22(5):48-52.
8汲生珍,邬兴威,夏东领,王萍.地震相裂缝分级技术在储层预测中的应用[J].西南石油大学学报（自然科学版）,2012,34(3):71-77. 被引量：7
9王丹,贾跃玮,魏水建,郑文波.新场须四段叠后裂缝综合预测[J].物探与化探,2014,38(5):1038-1044. 被引量：6
10宝音图,刘真真.基于Python的客户分类和挖掘系统[J].信息与电脑,2018,30(15):72-73. 被引量：1

二级引证文献89

1徐淼.基于蚂蚁体追踪的裂缝预测技术在静北地区的应用[J].内蒙古石油化工,2015,41(Z1):106-108. 被引量：11
2行情[J].现代计算机（中旬刊）,2010(2):81-84.
3何云,李辉,姚能坚,赵榕生.改进K-means算法实现移动通信行为特征分析[J].计算机技术与发展,2011,21(6):63-65.
4沈奇,王池社.生物缺失数据处理的贝叶斯模型研究[J].微电子学与计算机,2011,28(7):110-112. 被引量：2
5唐蓉君,马玉波,蒋丹璐.基于多分类器的房地产客户分类[J].世界科技研究与发展,2012,34(1):108-110.
6张亚萍,胡学钢,方振国,姜恩华.数据缺失条件下的贝叶斯优化算法[J].计算机工程与应用,2012,48(11):111-114. 被引量：3
7高新建.血府逐瘀汤加减治疗抑郁症30例疗效分析[J].中国医药科学,2012,2(8):59-59. 被引量：9
8包祖晓,田青,周威,孙伟,何贵平.助阳舒心方对抑郁症肝肾阳虚型患者中医证候学影响的临床观察[J].中华中医药学刊,2012,30(10):2258-2260. 被引量：1
9许文杰,王忆勤.基于贝叶斯网的现代方法学在中医辨证研究中的应用[J].中华中医药杂志,2012,27(12):3168-3171. 被引量：1
10赵铁牛,杨晓南,王惠君,于春泉,孟静岩.决策树原理应用于中医证候学研究[J].天津中医药,2012,29(6):620-623. 被引量：8

1胡为成.朴素贝叶斯分类器的改进[J].铜陵学院学报,2007,6(1):73-75. 被引量：1
2杜会锋,刘琼荪.基于Copula的贝叶斯分类器[J].计算机工程与应用,2010,46(10):111-112. 被引量：3
3何家玉,许峰.正则化低秩子空间谱聚类算法[J].软件导刊,2016,15(12):22-24.
4娄海彦,楼巍,严利民.基于先验知识的缺损数据研究[J].控制工程,2004,11(6):539-541.
5杨敏,贺兴时,刘平丽,王芳妮.基于属性约简的PLS加权朴素贝叶斯分类[J].西安工程大学学报,2013,27(1):118-121. 被引量：3
6杨欣斌,孙京诰,黄道.基于Bayesian网络的缺损数据处理方法[J].华东理工大学学报（社会科学版）,2002,17(S1):41-44. 被引量：3
7胡为成,程转流,王本年.基于模拟退火遗传算法的贝叶斯分类[J].计算机工程,2007,33(9):219-221. 被引量：9
8胡为成,胡学钢.基于遗传算法的朴素贝叶斯分类[J].计算机技术与发展,2007,17(1):30-32. 被引量：3
9刘牛.基于属性加权的朴素贝叶斯分类算法改进[J].网络安全技术与应用,2011(6):72-74. 被引量：6
10杨延娇,王治和.基于树桩网络的贝叶斯文本分类算法[J].计算机工程,2009,35(16):201-202. 被引量：4

计算机工程与应用

2006年第28期

浏览历史

内容加载中请稍等...

聚类思想在贝叶斯算法中的应用被引量：10

参考文献6

共引文献51

同被引文献98

引证文献10

二级引证文献89

相关作者

相关机构

相关主题

浏览历史

聚类思想在贝叶斯算法中的应用 被引量：10

参考文献6

共引文献51

同被引文献98

引证文献10

二级引证文献89

相关作者

相关机构

相关主题

浏览历史

聚类思想在贝叶斯算法中的应用被引量：10