期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
基于氨基酸组成分布的蛋白质同源寡聚体分类研究 被引量:9
1
作者 施建宇 潘泉 +1 位作者 张绍武 程咏梅 《生物物理学报》 CAS CSCD 北大核心 2006年第1期49-56,共8页
基于一种新的特征提取方法——氨基酸组成分布,使用支持向量机作为成员分类器,采用“一对一”的多类分类策略,从蛋白质一级序列对四类同源寡聚体进行分类研究。结果表明,在10-CV检验下,基于氨基酸组成分布,其总分类精度和精度指数分别... 基于一种新的特征提取方法——氨基酸组成分布,使用支持向量机作为成员分类器,采用“一对一”的多类分类策略,从蛋白质一级序列对四类同源寡聚体进行分类研究。结果表明,在10-CV检验下,基于氨基酸组成分布,其总分类精度和精度指数分别达到了86.22%和67.12%,比基于氨基酸组成成分的传统特征提取方法分别提高了5.74和10.03个百分点,比二肽组成成分特征提取方法分别提高了3.12和5.63个百分点,说明氨基酸组成分布对于蛋白质同源寡聚体分类是一种非常有效的特征提取方法;将氨基酸组成分布和蛋白质序列长度特征组合,其总分类精度和精度指数分别达到了86.35%和67.23%,说明蛋白质序列长度特征含有一定的空间结构信息。 展开更多
关键词 氨基酸组成分布 二维主成分分析 支持向量机 同源寡聚体
下载PDF
预测同源寡聚蛋白质的支持向量机方法(英文) 被引量:5
2
作者 宋杰 唐焕文 《计算机与应用化学》 CAS CSCD 北大核心 2004年第6期789-794,共6页
计算实验表明蛋白质一级结构包含着四级结构信息。本文用支持向量机方法从蛋白质一级结构出发区分同源二聚体和非同源二聚体。蛋白质原始序列的子序列分布用于支持向量机的输入向量,从而充分考虑了蛋白质序列的信息。当子序列的长度为3... 计算实验表明蛋白质一级结构包含着四级结构信息。本文用支持向量机方法从蛋白质一级结构出发区分同源二聚体和非同源二聚体。蛋白质原始序列的子序列分布用于支持向量机的输入向量,从而充分考虑了蛋白质序列的信息。当子序列的长度为3时,10-次交叉验证的总预测准确率达到84.9%,在相同的数据集上,比原有的决策树方法提高了15.0%。实验表明残基顺序对同源寡聚蛋白质的识别起重要作用,而支持向量机方法是蛋白质四级结构预测的强有力工具。 展开更多
关键词 蛋白质四级结构 同源寡聚蛋白质 支持向量机 子序列分布
原文传递
基于一种新的信息离散性度量方法的同源寡聚蛋白质分类 被引量:3
3
作者 宋杰 唐焕文 《数学的实践与认识》 CSCD 北大核心 2007年第8期36-42,共7页
用一种新的信息离散性度量方法,即Function of Degree of Disagreement(FDOD),从蛋白质原始序列出发区分同源二聚体、同源三聚体、同源四聚体和同源六聚体.该方法用蛋白质原始序列的子序列分布来描述氨基酸序列,从而充分考虑了蛋白质序... 用一种新的信息离散性度量方法,即Function of Degree of Disagreement(FDOD),从蛋白质原始序列出发区分同源二聚体、同源三聚体、同源四聚体和同源六聚体.该方法用蛋白质原始序列的子序列分布来描述氨基酸序列,从而充分考虑了蛋白质序列的信息.随着子序列长度的增加,两个数据集上自检验和jack-knife检验的各个分类指标都有快速增加的趋势,实验表明残基顺序对同源寡聚蛋白质的识别起重要作用,FDOD方法是同源寡聚蛋白质分类的简单而有效的工具.这也进一步证实了蛋白质原始序列包含着四级结构信息. 展开更多
关键词 FDOD函数 子序列分布 蛋白质四级结构 同源寡聚蛋白质 分类
原文传递
Prediction of Protein Homo-Oligomer Types by Using IB1 Algorithm
4
作者 SONG Chaohong SHI Feng XIONG Huijuant 《Wuhan University Journal of Natural Sciences》 CAS 2011年第2期121-124,共4页
Protein homo-oligomers play an important role in various vital activities. Successful prediction of protein homo-oligomers directly from primary sequence is very beneficial to understand their protein function. In thi... Protein homo-oligomers play an important role in various vital activities. Successful prediction of protein homo-oligomers directly from primary sequence is very beneficial to understand their protein function. In this paper, a total of 14 238 homo-oligomeric protein sequences are predicted by IB1 algorithm. 10-fold cross-validation test is applied to test the predictive capability of the proposed method. The predictive results show that overall prediction accuracy is 90.46%, which is at least 9% higher than that of previous results; furthermore,the sensitivity and Matthew's correlation coefficient for each class of homo-oligomers are also improved significantly. The results show that IB1 algorithm is effective and feasible,and very suitable for predicting protein homo-oligomer types. 展开更多
关键词 homo-oligomers IB1 algorithm amino acids composition
原文传递
基于线性降维方法的蛋白质四级结构类型预测 被引量:2
5
作者 王彤 杨志珍 曹晓夏 《上海第二工业大学学报》 2013年第1期12-17,共6页
提出一种新的能依据蛋白质序列自动地识别被查询蛋白质的四级结构类型的方法。首先采用伪特定位点记分矩阵方法(PsePSSM)提取蛋白质序列的特征。采用这种方法提取出的特征能尽可能多地反映蛋白质序列的原始信息如顺序和进化等信息。但... 提出一种新的能依据蛋白质序列自动地识别被查询蛋白质的四级结构类型的方法。首先采用伪特定位点记分矩阵方法(PsePSSM)提取蛋白质序列的特征。采用这种方法提取出的特征能尽可能多地反映蛋白质序列的原始信息如顺序和进化等信息。但随之产生的问题是特征维数很高,使得预测系统复杂化。因此,引入线性维数约简算法最大方差映射方法(MVP),它可以从高维的特征空间中提取出低维的关键特征。最后,在约简后的特征上再应用分类算法预测未知蛋白质的四级结构。试验结果表明,采用降维方法不但使得预测系统得到简化,同时还提高了分类性能。 展开更多
关键词 蛋白质四级结构 同源寡聚蛋白质 分类 降维
下载PDF
基于多策略滑动伸缩窗特征提取方法预测蛋白质同源寡聚体
6
作者 李启鹏 张绍武 +1 位作者 潘泉 陈伟 《生物物理学报》 CAS CSCD 北大核心 2009年第5期335-342,共8页
寡聚蛋白质广泛地参与多种生命活动,对其预测研究有重要的意义。文章从蛋白质序列出发,提出多策略滑动伸缩窗特征提取方法,采用"一对一"的多类分类策略,对蛋白质同源寡聚体进行预测研究。结果表明,在Jackknife检验下,基于支... 寡聚蛋白质广泛地参与多种生命活动,对其预测研究有重要的意义。文章从蛋白质序列出发,提出多策略滑动伸缩窗特征提取方法,采用"一对一"的多类分类策略,对蛋白质同源寡聚体进行预测研究。结果表明,在Jackknife检验下,基于支持向量机的多策略滑动伸缩窗特征和氨基酸组成成分构成的特征集在加权情况下,其总分类精度最高达到了75.37%,比单纯的氨基酸组成成分法提高10.05%,比参考文献最好特征BG_Zhang提高了3.82%。说明多策略滑动伸缩窗特征提取方法对于蛋白质同源寡聚体分类,是一种非常有效的特征提取方法。 展开更多
关键词 同源寡聚体 支持向量机 特征提取 多策略滑动伸缩窗 多策略滑动伸缩窗特征
原文传递
基于次生特征提取方法预测蛋白质同源寡聚体
7
作者 李启鹏 张绍武 +1 位作者 潘泉 陈伟 《北京生物医学工程》 2010年第1期16-22,共7页
寡聚蛋白质相对于单体蛋白质具有许多优势,广泛地参与多种生命活动。本文提出次生特征提取方法,使用支持向量机作为分类器,采用"一对一"的多类分类策略,基于蛋白质一级序列提取特征方法,对四类同源寡聚体进行分类研究。结果表... 寡聚蛋白质相对于单体蛋白质具有许多优势,广泛地参与多种生命活动。本文提出次生特征提取方法,使用支持向量机作为分类器,采用"一对一"的多类分类策略,基于蛋白质一级序列提取特征方法,对四类同源寡聚体进行分类研究。结果表明,在Jackknife检验下,基于次生特征和氨基酸组成成分特征构成的特征集,加权情况下,其总分类精度最高达到了78.41%,比氨基酸组成成分特征提高13.09%,比参考文献最好特征集BG提高了6.86%,比最好原生特征集CM1提高了5.53%。此结果说明次生特征提取方法对于蛋白质同源寡聚体分类是一种非常有效的特征提取方法。 展开更多
关键词 同源寡聚体 支持向量机 特征提取 原生特征 次生特征
下载PDF
基于加权自相关函数特征提取法的多类蛋白质同源寡聚体分类研究 被引量:2
8
作者 张绍武 潘泉 +1 位作者 赵春晖 程咏梅 《生物医学工程学杂志》 EI CAS CSCD 北大核心 2007年第4期721-726,共6页
我们提出一种新的特征提取方法,即用蛋白质序列的氨基酸组成成分和一系列的氨基酸残基指数加权自相关函数构成特征向量,表示蛋白质序列,与支持向量机算法组合对蛋白质同源二聚体、同源三聚体、同源四聚体、同源六聚体进行分类研究,得到... 我们提出一种新的特征提取方法,即用蛋白质序列的氨基酸组成成分和一系列的氨基酸残基指数加权自相关函数构成特征向量,表示蛋白质序列,与支持向量机算法组合对蛋白质同源二聚体、同源三聚体、同源四聚体、同源六聚体进行分类研究,得到较好的分类结果。在Jackknife检验下,采用支持向量机算法,基于此新特征提取法所构成的参数集QIANA、QIANB、MEEJ、ROBB和SNEP的总分类精度分别为77.63%、77.16%、76.46%、76.70%、75.06%,分别比传统氨基酸组成成分特征提取法(参数集为COMP)提高6.39、5.92、5.22、5.46、3.82个百分点。对于参数集QIANA,支持向量机的总分类精度为77.63%,比协方差算法提高16.29个百分点。这些结果表明:(1新特征提取法是有效和可行的,基于此特征提取法构成的特征向量包含蛋白质四级结构信息,且可能捕获了埋藏在缔合亚基作用部位接触表面的基本信息;(2)对于蛋白质同源寡聚体分类研究,支持向量机是非常有效的。 展开更多
关键词 特征提取 加权自相关函数 支持向量机 同源寡聚体
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部