鉴于传统基因选择方法会选出大量冗余基因从而导致样本预测准确率较低,提出了一种基于信噪比与邻域粗糙集的特征基因选择方法(Signal noise ration and the neighborhood rough set,SNRS)。首先采用信噪比指标获得分类能力较强的预选特...鉴于传统基因选择方法会选出大量冗余基因从而导致样本预测准确率较低,提出了一种基于信噪比与邻域粗糙集的特征基因选择方法(Signal noise ration and the neighborhood rough set,SNRS)。首先采用信噪比指标获得分类能力较强的预选特征子集;然后利用邻域粗糙集约简算法对预选特征子集进行寻优;最后采用不同的分类器对特征基因子集进行分类。通过实验表明,该方法能够克服传统分类算法精度不高的缺陷,并且能够在较少的特征基因下取得较高的分类精度,验证了该方法的可行性和有效性。展开更多
特征选择技术被广泛应用于生物信息学中。通过重复利用偏最小二乘(partial least square,PLS)方法提取主成分,通过逐次选择在主成分中权重较大的基因,将PLS应用于特征选择中。将这种方法用于对肿瘤基因表达谱数据的特征基因选择中,并用...特征选择技术被广泛应用于生物信息学中。通过重复利用偏最小二乘(partial least square,PLS)方法提取主成分,通过逐次选择在主成分中权重较大的基因,将PLS应用于特征选择中。将这种方法用于对肿瘤基因表达谱数据的特征基因选择中,并用提取的特征基因分类,用8个特征基因进行分类时,能达到92.5%的正确率。展开更多
文摘鉴于传统基因选择方法会选出大量冗余基因从而导致样本预测准确率较低,提出了一种基于信噪比与邻域粗糙集的特征基因选择方法(Signal noise ration and the neighborhood rough set,SNRS)。首先采用信噪比指标获得分类能力较强的预选特征子集;然后利用邻域粗糙集约简算法对预选特征子集进行寻优;最后采用不同的分类器对特征基因子集进行分类。通过实验表明,该方法能够克服传统分类算法精度不高的缺陷,并且能够在较少的特征基因下取得较高的分类精度,验证了该方法的可行性和有效性。
基金北京市教育委员会科技计划项目(JC002011200903)资助Supported by Beijing Natural Science Foundation(Grant No.4092021)
文摘特征选择技术被广泛应用于生物信息学中。通过重复利用偏最小二乘(partial least square,PLS)方法提取主成分,通过逐次选择在主成分中权重较大的基因,将PLS应用于特征选择中。将这种方法用于对肿瘤基因表达谱数据的特征基因选择中,并用提取的特征基因分类,用8个特征基因进行分类时,能达到92.5%的正确率。