摘要
为了识别出可能具有诊断力的特征基因,常常使用聚类的方法对基因表达数据进行分析,而仿分子动理学聚类法通过仿效分子间的作用力机制能达到对数据聚类的目的。仿分子动理学聚类技术不需要预设簇个数,且可用于估计数据中的簇个数。该方法被应用于基因表达数据,结合相关指标用以估计数据中存在的簇个数和发现可能具有诊断力的特征基因。实验与分析结果显示了仿分子动理学聚类技术具有良好的知识挖掘能力。
In order to find possible diagnostic genes that may typically assist in disease diagnosis,clustering technologies are always used to analyze gene expression data.Molecular-kinetic-theory-based clustering approach is a new and effective clustering technique.It finds data clusters by following the molecular kinetic mechanism.This dynamic clustering approach does not require presetting the number of clusters and can be used to estimate the number of clusters.The authors applied the method on gene expression data to estimate the number of clusters and possible diagnostic genes according to relevant clustering criteria.The simulation results and analysis verify the good knowledge discovery ability of this approach.
出处
《计算机应用》
CSCD
北大核心
2011年第10期2774-2777,共4页
journal of Computer Applications
基金
国家自然科学基金资助项目(61073099)
中央高校基本科研业务费专项资金资助项目(103.1.2 E022050205
ZYGX2009J058)
关键词
聚类
分子动理学
互作用力
基因表达
数据挖掘
知识发现
clustering
molecular kinetics
interaction
gene expression
data mining
knowledge discovery