基因表达数据具有高维小样本特点,包含了大量与疾病无关的基因,对该类数据进行分析的首要步骤是特征选择.常见的特征选择方法需要有类标的数据,但样本类标获取往往比较困难.针对基因表达数据的特征选择问题,提出基于谱聚类的无监督特征...基因表达数据具有高维小样本特点,包含了大量与疾病无关的基因,对该类数据进行分析的首要步骤是特征选择.常见的特征选择方法需要有类标的数据,但样本类标获取往往比较困难.针对基因表达数据的特征选择问题,提出基于谱聚类的无监督特征选择思想FSSC(feature selection by spectral clustering).FSSC对所有特征进行谱聚类,将相似性较高的特征聚成一类,定义特征的区分度与特征独立性,以二者之积度量特征重要性,从各特征簇选取代表性特征,构造特征子集.根据使用的不同谱聚类算法,得到FSSC-SD(FSSC based on standard deviation) FSSCMD(FSSC based on mean distance)和FSSC-ST(FSSC based on self-tuning)这3种无监督特征选择算法.以SVMs(support vector machines)和KNN(K-nearest neighbours)为分类器,在10个基因表达数据集上进行实验测试.结果表明,FSSC-SD、FSSC-MD和FSSC-ST算法均能选择到具有强分类能力的特征子集.展开更多
针对稀疏自动编码器(Sparse auto encoder,SAE)采用sigmoid激活函数容易造成梯度消失的问题,用一种新的Tan函数替代原有的sigmoid函数;针对SAE采用Kullback-Leibler(KL)散度进行稀疏性约束在回归预测方面的局限性,以dropout机制替代KL...针对稀疏自动编码器(Sparse auto encoder,SAE)采用sigmoid激活函数容易造成梯度消失的问题,用一种新的Tan函数替代原有的sigmoid函数;针对SAE采用Kullback-Leibler(KL)散度进行稀疏性约束在回归预测方面的局限性,以dropout机制替代KL散度实现网络的稀疏性.利用改进SAE对滚动轴承振动信号进行无监督深层特征自适应提取,无需人工设计标签进行有监督微调.同时,考虑到滚动轴承剩余使用寿命(Remaining useful life,RUL)预测方法一般仅考虑过去信息而忽略未来信息,引入双向长短时记忆网络(Bi-directional long short-term memory,Bi-LSTM)构建滚动轴承RUL的预测模型.在2个轴承数据集上的实验结果均表明,所提基于改进SAE和Bi-LSTM的滚动轴承RUL预测方法不仅可以提高模型的收敛速度而且具有较低的预测误差.展开更多
文摘基因表达数据具有高维小样本特点,包含了大量与疾病无关的基因,对该类数据进行分析的首要步骤是特征选择.常见的特征选择方法需要有类标的数据,但样本类标获取往往比较困难.针对基因表达数据的特征选择问题,提出基于谱聚类的无监督特征选择思想FSSC(feature selection by spectral clustering).FSSC对所有特征进行谱聚类,将相似性较高的特征聚成一类,定义特征的区分度与特征独立性,以二者之积度量特征重要性,从各特征簇选取代表性特征,构造特征子集.根据使用的不同谱聚类算法,得到FSSC-SD(FSSC based on standard deviation) FSSCMD(FSSC based on mean distance)和FSSC-ST(FSSC based on self-tuning)这3种无监督特征选择算法.以SVMs(support vector machines)和KNN(K-nearest neighbours)为分类器,在10个基因表达数据集上进行实验测试.结果表明,FSSC-SD、FSSC-MD和FSSC-ST算法均能选择到具有强分类能力的特征子集.
文摘针对稀疏自动编码器(Sparse auto encoder,SAE)采用sigmoid激活函数容易造成梯度消失的问题,用一种新的Tan函数替代原有的sigmoid函数;针对SAE采用Kullback-Leibler(KL)散度进行稀疏性约束在回归预测方面的局限性,以dropout机制替代KL散度实现网络的稀疏性.利用改进SAE对滚动轴承振动信号进行无监督深层特征自适应提取,无需人工设计标签进行有监督微调.同时,考虑到滚动轴承剩余使用寿命(Remaining useful life,RUL)预测方法一般仅考虑过去信息而忽略未来信息,引入双向长短时记忆网络(Bi-directional long short-term memory,Bi-LSTM)构建滚动轴承RUL的预测模型.在2个轴承数据集上的实验结果均表明,所提基于改进SAE和Bi-LSTM的滚动轴承RUL预测方法不仅可以提高模型的收敛速度而且具有较低的预测误差.