期刊文献+

生物大数据中的聚类方法分析 被引量:5

Survey of clustering methods for big data in biology
下载PDF
导出
摘要 随着人类基因组计划的实施和完成,生物实验技术快速发展,生物数据呈现爆发式增长并不断积累,生命科学迎来了大数据时代.在后基因组时代,单一的统计模式逐渐被智能化与综合分析相结合的方式所取代,聚类分析便是核心的数据挖掘方式.描述了生物信息学领域中的大数据现状,总结基因表达谱分析和生物网络分析中常用的聚类方法,并对小鼠胚胎成纤维细胞的时间序列数据进行实验对比.实验结果表明,不同的聚类方法生成了不同的实验结果,面临高噪声的生物大数据,选择或结合合适的聚类方法进行综合分析将有助于获得更可靠的分析结果. With the implementation of the Human Genome Project and the rapid devel- opment of biological experiment technology, biological data sharply grow and continuous accumulate. Age of big data in biology is coming. In the post genomic era, single statistical models are gradually replaced with combination of intelligent and comprehensive analyses. Clustering is the core of data mining. This paper describes the state-of-the-art technology of big data in bioinformatics, and summarizes several popular clustering methods on gene expression profiling and biological networks. Furthermore, some experiments are made to compare different clustering methods on the time series data of mouse embryonic fibrob- lasts, showing that different clustering methods have different results. To achieve more reliable conclusions for highly noisy biological data, it is necessary for investigators to do comprehensive analyses by selecting and combining proper clustering methods.
出处 《上海大学学报(自然科学版)》 CAS CSCD 北大核心 2016年第1期45-57,共13页 Journal of Shanghai University:Natural Science Edition
基金 国家自然科学基金重大研究计划项目(91330116) 教育部留学回国人员科研启动基金资助项目
关键词 生物大数据 数据分析 聚类方法 big data in biology data analysis clustering method
  • 相关文献

参考文献44

  • 1赵屹,谷瑞升,杜生明.生物信息学研究现状及发展趋势[J].医学信息学杂志,2012,33(5):2-6. 被引量:8
  • 2Koboldt D C, Steinberg K M, Larson D E, et al. The next-generation sequencing revolution and its impact on genomics [J]. Cell, 2013, 155(1): 27-38. 被引量:1
  • 3任艳姣..生物信息学数据整合的应用研究[D].吉林大学,2012:
  • 4Benson D A, Karsch-Mizrachi I, Lipman D J, et al. GenBank [J]. Nucleic Acids Research, 2000, 28(1): 15-18. 被引量:1
  • 5Uetz P, Etzold T. The EMBL/EBI reptile database [J]. Herpetological Review, 1996, 27(4): 174-175. 被引量:1
  • 6Barrett T, Wilhite S E, Ledoux P, et al. NCBI GEO: archive for functional genomics data sets-update [J]. Nucleic Acids Res, 2013, 41: D1005-D1010. 被引量:1
  • 7王洪昌,丁立军,黄宇.生物信息学中模式识别技术应用与发展[J].医学信息学杂志,2013,34(11):7-10. 被引量:5
  • 8Yixue Li,Luonan Chen.Big Biological Data:Challenges and Opportunities[J].Genomics, Proteomics & Bioinformatics,2014,12(5):187-189. 被引量:6
  • 9Marx V. Biology: the big challenges of big data [J]. Nature, 2013, 498(7453): 255-260. 被引量:1
  • 10Schuster S C. Next-generation sequencing transforms today’s biology [J]. Nature, 2007, 200(8): 16-18. 被引量:1

二级参考文献84

共引文献24

同被引文献45

引证文献5

二级引证文献11

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部