大肠癌诊断数据分类新算法研究

Research on new classification algorithm for colorectal carcinoma diagnosis data

下载PDF

导出

摘要数据分类是数据挖掘技术在医疗数据分析中的一个重要应用,在分析了医疗数据特点后,以大肠早癌诊断数据为例,提出了利用计数最近邻算法对其进行分类的思想;同时在分析该算法性能的基础上,提出了基于检索树和样本密度的计数最近邻新算法对改数据进行分析,以检索树的构建来提高原算法的计算效率,基于全局密度、K-密度的改进算法来提高原算法的精确度。通过实验证明新算法在大肠早癌的数据分析中,其计算复杂度、存储空间和数据分类精确度都得到了较大的提高,同时新算法适应于数值数据、文本数据以及混合数据的分类。 Data classification is an important data mining role in biomedicine.This paper proposes a method to analyze Colorectal Carcinoma diagnosis data based on counting KNN algorithm after analyzing the characteristics of biomedicine data.Though the count-weight-k-nearest neighbours for classification is simple and effective,it doesn＇t deal with biomedicine data well.After analyzing the algorithm performance,an novel counting KNN algorithm by index tree and sample density is presented.The new method improves the accuracy of classification by using different algorithms of overall density and K-local density,and also improves efficiency by using a tree structure index.Experimefits show that this method outperforms the distance-based voting KNN, and CwKNN.More importantly it is a single method that works for ordinal,nominal or mixed data.

作者廖志芳樊晓平陈宇宙廖志宁瞿志华

机构地区中南大学信息科学与工程学院英国莱斯特郡拉夫堡大学科学学院计算机系美国奥兰多中弗罗里达大学电子工程与计算机学院

出处《计算机工程与应用》 CSCD 北大核心 2008年第20期208-211,共4页 Computer Engineering and Applications

基金国家自然科学基金(the National Natural Science Foundation of China under Grant No.60776834) 湖南省自然科学基金(the Natural Science Foundation of Hunan Province of China under Grant No.06JJ50143)

关键词大肠早癌诊断数据计数最近邻算法全局密度 K-密度 colorectal carcinoma diagnosis data KNN by counting overall density K-density

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献7

1Zheng W,Krishnan S M,Huang Z W,et al.Laser-induced fluorescence microscopy of human lung tissues[J].SPIE, 1999,3863:310- 315. 被引量：1
2张阳德,刘蔚东,彭健.大肠正常组织和癌组织的自体荧光光谱特征分析[J].中国现代医学杂志,2000,10(9):1-4. 被引量：20
3Wang Hui.Nearest neighbors by neighborhood counting [J].IEEE Transaction pattern Analysis and Machine Intelligence,2006(6). 被引量：1
4Gratzer G.General lattice theory[M].Basel:Birkhauser, 1978. 被引量：1
5Wilson D R,Martinez T R.Reduction techniques for instancebased learning algorithms [J].Machine Learning, 2000,38 (3) : 257 - 286. 被引量：1
6Fan Xiao-ping,Liu Xiao,Liao Zhi-fang.Data mining-based research on diagnostic system of early colorectal carcinoma[C]//DMIN 2005,2005 : 451-455. 被引量：1
7Hand D,Mannila H.Padhraic smyth principles of data mining[M]. Beijing: China Machine Press,2003. 被引量：1

二级参考文献3

1万小平,张阳德,范春,唐冬生,周平.大肠早癌自体荧光检测系统研究 Ⅱ.大肠癌自体荧光物质——血卟啉研究[J].中国内镜杂志,1996,2(1):3-5. 被引量：7
2骆清铭,曾绍群.肿瘤组织自体荧光光谱测量与分析[J].华中理工大学学报,1996,24(A01):133-135. 被引量：1
3张阳德,刘蔚东,杨川,万小平,李年丰,唐贵林,王渊景.结肠早癌自体荧光内镜诊断系统研究 Ⅰ.结肠组织显微自体荧光图像分析[J].中国内镜杂志,2000,6(1):1-2. 被引量：13

共引文献19

1夏代林,何继善,张阳德,彭健,刘雁群.组织自体荧光的Monte Carlo仿真方法(英文)[J].中国医学工程,2003,11(6):45-49. 被引量：1
2张阳德,董可,谭宁,刘东非,王毅,陈威.Cr:LiSAF激光在组织自体荧光光谱研究中的应用(英文)[J].中国医学工程,2003,11(6):54-58.
3刘皛,廖志芳,樊晓平,李异凡,张阳德.基于决策树分类技术的大肠早癌诊断系统研究[J].中国医学工程,2005,13(5):462-465. 被引量：3
4罗湘建,张阳德,李建国,彭建,曹兴.激光诱导大肠癌自体荧光光谱实验研究[J].生物医学工程学杂志,2005,22(6):1231-1233. 被引量：4
5张阳德,李罗丝.激光诱导组织自体荧光光谱技术在消化道恶性肿瘤早期诊断中的应用[J].中国医学工程,2006,14(1):40-42. 被引量：3
6蔡其洪.荧光分析在卟啉作为肿瘤标志物研究中的应用[J].现代诊断与治疗,2006,17(2):96-98. 被引量：3
7樊晓平,刘皛,廖志芳,李异凡,张阳德.大肠癌自体荧光光谱信号处理方法研究[J].计算机应用研究,2007,24(6):230-232. 被引量：1
8贾泽明,万小平.大肠早期癌症血卟啉和组织卟啉浓度研究(英文)[J].中南大学学报（医学版）,2009,34(9):846-849.
9胡文昌,夏志伟,刘黎明,肖家新.老年自发性直肠穿孔八例误诊分析[J].临床误诊误治,2011,24(7):32-33. 被引量：2
10王可人,叶玉琴,朱珠,续哲莉.荧光光谱学在乳腺疾病诊治中的研究进展[J].中国实验诊断学,2013,17(2):386-388. 被引量：2

1廖志芳,陈宇宙,樊晓平,瞿志华.面向非平衡混合数据的改进计数最近邻分类算法[J].计算机工程与应用,2008,44(12):139-141. 被引量：2
2艾英山,张德贤.基于聚类和密度的KNN分类器训练样本约减方法[J].计算机与数字工程,2009,37(5):10-12.
3钟将,刘荣辉.一种改进的KNN文本分类[J].计算机工程与应用,2012,48(2):142-144. 被引量：27
4黎俊锋,朱锋峰.基于样本密度的FCM改进算法[J].科学技术与工程,2007,7(4):636-638. 被引量：12
5陈良洲,施文康.基于随机集的复杂境况下多目标测量[J].上海交通大学学报,2007,41(6):881-884. 被引量：1
6童小明.用检索树实现哈希表[J].电脑编程技巧与维护,2012(7):15-22.
7钟萍,岑涌,席斌.最小二乘支持向量机在医疗数据分析中的应用[J].计算机与数字工程,2007,35(9):21-23.
8李虹,蔡之华.关联规则在医疗数据分析中的应用[J].微机发展,2003,13(6):94-97. 被引量：38
9王晓东,秦超英.基于径向基神经网络的目标识别研究[J].西南民族大学学报（自然科学版）,2006,32(1):195-198.
10吴斌,王秉钦.图像数据库的智能检索[J].北京科技大学学报,1999,21(4):396-399. 被引量：1

计算机工程与应用

2008年第20期

浏览历史

内容加载中请稍等...

大肠癌诊断数据分类新算法研究

参考文献7

二级参考文献3

共引文献19

相关作者

相关机构

相关主题

浏览历史