由于PPI网络数据的无尺度和小世界特性,使得目前对此类数据的聚类算法效果不理想.根据PPI网络的拓扑结构特性,本文提出了一种基于连接强度的蚁群优化(Joint Strength based Ant Colony Optimization,JSACO)聚类算法,该算法引入了连接强...由于PPI网络数据的无尺度和小世界特性,使得目前对此类数据的聚类算法效果不理想.根据PPI网络的拓扑结构特性,本文提出了一种基于连接强度的蚁群优化(Joint Strength based Ant Colony Optimization,JSACO)聚类算法,该算法引入了连接强度的概念对蚁群聚类算法中的拾起/放下规则加以改进,以连接强度作为拾起规则,对结点进行聚类,并根据放下规则放弃部分不良数据,产生最终聚类结果.最后采用了MIPS数据库中的PPI数据进行实验,将JSACO算法与PPI网络数据的其他聚类算法进行比较,聚类结果表明JSACO算法正确率高,时间开销低.展开更多
蛋白质是生命活动的重要物质基础,对其功能的准确标注可以极大地促进生命科学的研究与发展.已有的蛋白质功能预测方法通常仅关注利用蛋白质具有某些功能的信息(正样例),并没有关注利用蛋白质不相关的功能信息(负样例).已有研究表明,结...蛋白质是生命活动的重要物质基础,对其功能的准确标注可以极大地促进生命科学的研究与发展.已有的蛋白质功能预测方法通常仅关注利用蛋白质具有某些功能的信息(正样例),并没有关注利用蛋白质不相关的功能信息(负样例).已有研究表明,结合蛋白质负样例可以降低蛋白质功能预测的复杂度并提高预测精度.本文提出一种基于降维的蛋白质不相关功能预测方法 (predicting irrelevant functions of proteins based on dimensionality reduction,IFDR).IFDR通过在蛋白质互作网邻接矩阵和蛋白质–功能标记关联矩阵上分别进行随机游走,挖掘蛋白质之间的内在关系和预估蛋白质的缺失功能标记,再分别利用奇异值分解将上述2个矩阵投影降维为低维实数矩阵,最后利用半监督回归预测负样例.在酵母菌、人类和拟南芥的蛋白质数据集上的实验表明,IFDR比已有相关算法能够更准确地预测负样例,对互作网络和功能标记空间的降维均可以提高负样例预测精度.展开更多
文摘由于PPI网络数据的无尺度和小世界特性,使得目前对此类数据的聚类算法效果不理想.根据PPI网络的拓扑结构特性,本文提出了一种基于连接强度的蚁群优化(Joint Strength based Ant Colony Optimization,JSACO)聚类算法,该算法引入了连接强度的概念对蚁群聚类算法中的拾起/放下规则加以改进,以连接强度作为拾起规则,对结点进行聚类,并根据放下规则放弃部分不良数据,产生最终聚类结果.最后采用了MIPS数据库中的PPI数据进行实验,将JSACO算法与PPI网络数据的其他聚类算法进行比较,聚类结果表明JSACO算法正确率高,时间开销低.
文摘蛋白质是生命活动的重要物质基础,对其功能的准确标注可以极大地促进生命科学的研究与发展.已有的蛋白质功能预测方法通常仅关注利用蛋白质具有某些功能的信息(正样例),并没有关注利用蛋白质不相关的功能信息(负样例).已有研究表明,结合蛋白质负样例可以降低蛋白质功能预测的复杂度并提高预测精度.本文提出一种基于降维的蛋白质不相关功能预测方法 (predicting irrelevant functions of proteins based on dimensionality reduction,IFDR).IFDR通过在蛋白质互作网邻接矩阵和蛋白质–功能标记关联矩阵上分别进行随机游走,挖掘蛋白质之间的内在关系和预估蛋白质的缺失功能标记,再分别利用奇异值分解将上述2个矩阵投影降维为低维实数矩阵,最后利用半监督回归预测负样例.在酵母菌、人类和拟南芥的蛋白质数据集上的实验表明,IFDR比已有相关算法能够更准确地预测负样例,对互作网络和功能标记空间的降维均可以提高负样例预测精度.