一种面向SNP选择的模糊聚类算法被引量：3

A Fuzzy Clustering Algorithm for SNP Selection

下载PDF

导出

摘要在对高维少样本的遗传数据进行单核苷酸多态性(SNP)选择时,为能使所选SNP子集高度代表所有SNP信息,实现数据降维,在模糊C均值(FCM)算法的基础上提出一种改进方法GN-FCM。通过引入SNP权重因子量化SNP位点重要程度的差异性,同时将重点SNP邻域正则项引入模糊聚类的损失函数中,挖掘高度重要SNP与同邻域内其他SNP的关联性。实验结果表明,GN-FCM具有较好的收敛性,与DW-FCM算法相比,其构造的SNP子集在支持向量机、决策树和朴素贝叶斯分类中准确率分别提升5.73 %、3.40 %和3.79 %,F1值分别提升4.01 %、 3.20 %和 2.22 %。 In the selection of Single Nucleotide Polymorphism(SNP) from high-dimensional genetic data with few samples,in order to make the selected SNP subset highly represent all SNP information and achieve data dimension reduction,an improved method is proposed on the basis of Fuzzy C-Mean(FCM) algorithm,which is named GN-FCM.By introducing the weight factor of SNP,the difference of importance degree of SNP site is quantified.Meanwhile,the neighborhood regular term of key SNP is introduced into the loss function of fuzzy clustering,so as to mine the correlation between highly important SNP and other SNPs in the neighborhood.Experimental results show that GN-FCM has better convergence.Compared with DW-FCM algorithm,the accuracy of the constructed SNP subsets by this algorithm in Support Vector Machine(SVM),Decision Tree(DT) and Na ve Bayesian(NB) classification is improved by 5.73 %, 3.40 % and 3.79 % respectively,and the F1 value is improved by 4.01 %,3.20 % and 2.22 % respectively.

作者张波周从华张付全张婷蒋跃明 ZHANG Bo;ZHOU Conghua;ZHANG Fuquan;ZHANG Ting;JIANG Yueming(School of Computer Science and Communication Engineering,Jiangsu University,Zhenjiang,Jiangsu 212013,China;Wuxi Mental Health Center,Wuxi,Jiangsu 214151,China;Wuxi Hospital for Maternity and Child Health Care Hospital,Wuxi,Jiangsu 214002,China;Wuxi No.5 People’s Hospital,Wuxi,Jiangsu 214073,China)

机构地区江苏大学计算机科学与通信工程学院无锡市精神卫生中心无锡市妇幼保健院无锡市第五人民医院

出处《计算机工程》 CAS CSCD 北大核心 2019年第8期66-74,共9页 Computer Engineering

基金江苏省重点研发计划社会发展项目(BE2016630,BE2017628) 无锡市卫生计生委科研项目(Z201603)

关键词单核苷酸多态性选择模糊聚类特征选择支持向量机决策树朴素贝叶斯分类 Single Nucleotide Polymorphism(SNP) selection fuzzy clustering feature selection Support Vector Machine(SVM) Decision Tree(DT) Na ve Bayesian(NB) classification

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1王巍..基因组关联研究中Tag SNP选择算法优化的研究[D].北京大学,2008:
2唐成龙,王石刚,徐威.基于数据加权策略的模糊聚类改进算法[J].电子与信息学报,2010,32(6):1277-1283. 被引量：11
3王印松,商丹丹,王艳飞,张婉君.改进的模糊聚类在控制系统故障诊断中的应用[J].计算机工程与科学,2018,40(2):326-330. 被引量：8
4王连喜,蒋盛益.一种基于特征聚类的特征选择方法[J].计算机应用研究,2015,32(5):1305-1308. 被引量：20

二级参考文献33

1Li Chao-shun,Zhou Jian-zhong,and Li Qing-qing.A fuzzy clustering algorithm based on mutative scale chaos optimization.Advances in Neural Networks.ISNN 2008,Berlin/Heidelberg:Springer.2008,5264:259-267. 被引量：1
2Runkler T A and Katz C.Fuzzy clustering by particle swarm optimization.Proceedings of 2006 IEEE International Conference on Fuzzy Systems.Vancouver,BC,2006:601-608. 被引量：1
3Chuang Keh-shih,Tzeng Hong-long,and Chen Sharon.Fuzzy c-means clustering with spatial information for image segmentation.Computerized Medical Imaging and Graphics.2006,30(1):9-15. 被引量：1
4Cai Wei-ling,Chen Song-can,and Zhang Dao-qiang.Fast and robust fuzzy c-means clustering algorithms incorporating local information for image segmentation.Pattern Recognition,2007,40(3):825-838. 被引量：1
5Pal N R and Bezdek J C.On cluster validity for the Fuzzy c-means Model.1EEE Transactions on Fuzzy Systems.1995,3(3):370-378. 被引量：1
6Kamber M and Han Jia-wei.Data Mining:Concepts and Techniques.2rd edition.Singapore:Elsevier Press.2005:295-300. 被引量：1
7Breunig M M,Kriegel Hans-peter,and Raymond T N,et al..LOF:Identifying density-based local outliers.Proceedings of ACM SIGMOD International Conference on Management of Data,Dallas,Texas:ACM Press.2000,29:93-104. 被引量：1
8Cao Hui,Si Gang-quan,Zhu Wen-zhi,and Zhang Yan-bin.Enhancing effectiveness of deusity-based outlier mining.International Symposiums on Information processing,Moscow,May 23-25,2008. 被引量：1
9Ghoting A,Parthasarathy S,and Otey M E.Fast miniug of distance-based outliers in high-dimensional dataset.Data Mining Knowledge Discovery,2008,16(3):349-364. 被引量：1
10Weng Xiao-qing and Shen Jun-yi.Detecting outlier samples in multivariate time series dataset.Knowledge-Based Systems,2008,21(8):807-812. 被引量：1

共引文献36

1刘喜梅,雷达.一种改进的模糊C均值聚类算法[J].青岛科技大学学报（自然科学版）,2011,32(2):194-198. 被引量：1
2范会联,罗跃国,李献礼.一种带克隆选择的粒子群动态聚类算法[J].山东大学学报（工学版）,2011,41(2):12-17. 被引量：2
3王越,黄靖华,张凯文.一种核模糊聚类的改进及其在育肥猪出栏中的应用[J].计算机应用与软件,2013,30(1):120-125. 被引量：2
4贺元元,张雪英,刘晓峰.多类分类预选取的SVM在语音识别中的应用[J].计算机工程与应用,2013,49(7):115-118. 被引量：2
5陈庄,黄勇,邹航.基于离群点挖掘的工业控制系统异常检测[J].计算机科学,2014,41(5):178-181. 被引量：13
6曲武,王莉军,韩晓光.云环境下基于LSH的分布式数据流聚类算法[J].计算机科学,2014,41(11):195-202. 被引量：3
7周媛,左洪福,王丽娜.基于簇特征加权的航空发动机状态监视方法[J].航空动力学报,2015,30(7):1759-1765. 被引量：1
8王辉,王晗.基于遗传算法和近邻分类器识别率的特征选择方法[J].林业机械与木工设备,2015,43(9):26-27. 被引量：1
9董兰芳,巢中迪.一种拟合聚类结果的特征重要性评价方法[J].小型微型计算机系统,2016,37(6):1284-1288.
10黄章树,叶志龙.基于改进的CHI统计方法在文本分类中的应用[J].计算机系统应用,2016,25(11):136-140. 被引量：13

同被引文献29

1陈宇,王金凤,温欣玲.高精度可调式红外检测控制系统设计[J].传感器与微系统,2006,25(2):55-57. 被引量：5
2魏亚姣,周慧鑫.非制冷IRFPA的盲元产生机理及响应特性分析[J].电子科技,2009,22(3):13-15. 被引量：2
3秦剑,李林,李绍明,王龙鹤,时振通.基于梯度的图像分割新方法[J].计算机应用,2009,29(8):2071-2073. 被引量：15
4李锋,林华.基于功效系数法与模糊综合评价法的企业营销绩效考核研究[J].学术论坛,2010,33(2):113-116. 被引量：20
5童孟军,俞立,郑立静,董齐芬.基于蚁群算法的无线传感器网络能量有效路由算法研究[J].传感技术学报,2011,24(11):1632-1638. 被引量：24
6岳改丽,王栋,杨蕊.几种边缘检测算子在红外图像处理方面应用研究[J].西安科技大学学报,2012,32(4):500-504. 被引量：18
7王巍,樊养余,司俊杰,吴伟,侯治锦.红外焦平面阵列盲元簇成因分析[J].红外与激光工程,2012,41(11):2857-2860. 被引量：7
8阚博涵,殷金坚,李凌杰,穆宇.基于可调阈值窗口的红外盲元检测算法[J].激光与红外,2014,44(8):949-952. 被引量：6
9王连喜,蒋盛益.一种基于特征聚类的特征选择方法[J].计算机应用研究,2015,32(5):1305-1308. 被引量：20
10徐勇,张慧,陈亮.一种基于情感分析的UGC模糊综合评价方法——以淘宝商品文本评论UGC为例[J].情报理论与实践,2016,39(6):64-69. 被引量：21

引证文献3

1王小芳,邹倩颖,彭林子,李雨峰.融合模糊聚类的蚁群图像增强算法[J].数据采集与处理,2020,35(3):506-515. 被引量：4
2李兵,许浩文,琚天公,曾文波,赵锋.聚类算法在电力设备红外图像盲元快速检测中的应用[J].传感器与微系统,2020,39(11):158-160.
3张萌谡,刘春天,李希今,黄永平.基于K-means聚类算法的绩效考核模糊综合评价系统设计[J].吉林大学学报（工学版）,2021,51(5):1851-1856. 被引量：19

二级引证文献23

1杨本胜,肖红,刘娇娇.基于蚁群算法的图像分割方法[J].信息与电脑,2021,33(13):53-55. 被引量：2
2曾怡苗.基于环形数据集的改进K-means聚类算法[J].软件,2021,42(11):74-76. 被引量：1
3吕文伟,史晨飞,张禹.露天煤矿松动爆破效果评价分析[J].露天采矿技术,2022,37(1):94-97. 被引量：4
4李静波.基于平衡计分卡的应用型高校教学质量绩效评价系统设计[J].信息与电脑,2022,34(3):236-239. 被引量：2
5钟寒,徐艺嘉,鹿浩,孙旌睿.基于模糊贝叶斯决策的核心概念抽取方法[J].计算机工程与科学,2022,44(9):1686-1692.
6张常泉,彭吉琼.基于综合模糊评价法的高校党建工作绩效评价指标体系构建[J].江科学术研究,2022,17(3):62-66.
7黄柳倩,蔡彦彬.模糊综合评价法在高校体育教师德能勤绩廉考核中的应用[J].桂林航天工业学院学报,2022,27(3):389-395. 被引量：1
8张俊生,赫英凤,杨鹏,仝晓刚.船载嵌入式网络视频监控图像模糊细节增强系统[J].舰船科学技术,2022,44(19):162-165. 被引量：2
9李宣达,张丹妮,薛亮,王林.一种智能开窗控制系统的设计与实现[J].物联网技术,2022,12(12):83-88.
10李峰.一种基于不确定数据的高效聚类算法[J].湖南工程学院学报（自然科学版）,2022,32(4):55-59.

1朱毅,杨航,吕泽华,陈传波,邹小威.一种基于禁忌搜索的全局最优化模糊聚类算法[J].电子学报,2019,47(2):289-295. 被引量：16
2宋宇,王志明.面向无人机三维航迹规划的改进粒子群优化算法[J].传感器与微系统,2019,38(3):144-146. 被引量：12
3曾政多.基于Naive Bayes的P2P平台评论研究[J].现代计算机,2019,25(20):10-13. 被引量：1
4胡忠旺,丁勇,杨勇,黄鑫城.基于时空关联—网格聚类的多扩展目标跟踪算法[J].传感器与微系统,2019,38(2):129-132. 被引量：2
5胡伟强,鹿艳晶.模糊聚类算法在船舶图像分割中的应用[J].舰船科学技术,2019,41(10):181-183. 被引量：1
6朱风丽,徐晓兰,陈体强,石林春,缪晓青,兰进.韩国赤芝全基因组重测序分析[J].世界科学技术-中医药现代化,2019,21(4):764-774. 被引量：3
7周世波,徐维祥,徐良坤.融合密度峰值和空间邻域信息的FCM聚类算法[J].仪器仪表学报,2019,40(4):137-144. 被引量：11
8李承威,韩彦龙,徐晓焱,王静,宋洁.钠离子转运基因多态性及血清Na^+水平与朝鲜族女性原发性高血压相关性研究[J].中国优生与遗传杂志,2019,27(7):783-787.
9王治和,黄梦莹,杜辉,秦红武.基于密度峰值与密度聚类的集成算法[J].计算机应用,2019,39(2):398-402. 被引量：5
10廖恩红,李会芳,王华,庞雄文.基于卷积神经网络的食品图像识别[J].华南师范大学学报（自然科学版）,2019,51(4):113-119. 被引量：14

计算机工程

2019年第8期

浏览历史

内容加载中请稍等...

一种面向SNP选择的模糊聚类算法被引量：3

参考文献4

二级参考文献33

共引文献36

同被引文献29

引证文献3

二级引证文献23

相关作者

相关机构

相关主题

浏览历史

一种面向SNP选择的模糊聚类算法 被引量：3

参考文献4

二级参考文献33

共引文献36

同被引文献29

引证文献3

二级引证文献23

相关作者

相关机构

相关主题

浏览历史

一种面向SNP选择的模糊聚类算法被引量：3