期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
蛋白质结构的预测及其应用 被引量:8
1
作者 宁正元 林世强 《福建农林大学学报(自然科学版)》 CSCD 北大核心 2006年第3期308-313,共6页
蛋白质结构的预测是结构基因组学的重要研究内容,本文就蛋白质结构预测的方法和应用进行了综述,介绍了比较建模、折叠识别、从头计算等3种方法及其在结构基因组学研究、药物设计、蛋白质设计中的应用,并且对蛋白质结构预测存在的主要问... 蛋白质结构的预测是结构基因组学的重要研究内容,本文就蛋白质结构预测的方法和应用进行了综述,介绍了比较建模、折叠识别、从头计算等3种方法及其在结构基因组学研究、药物设计、蛋白质设计中的应用,并且对蛋白质结构预测存在的主要问题进行了讨论,指出了今后蛋白质结构预测研究重点在于优化比对算法和计分函数以及膜蛋白的结构预测. 展开更多
关键词 蛋白质结构 比较建模 折叠识别 从头计算
下载PDF
低同源性蛋白质结构预测 被引量:2
2
作者 倪立生 毛凤楼 +1 位作者 韩玉真 来鲁华 《物理化学学报》 SCIE CAS CSCD 北大核心 2001年第5期389-392,共4页
The development of human genome project calls for more rapid and accurate protein structure prediction method to assign the structure and function of gene products. Threading has been proved to be successful in protei... The development of human genome project calls for more rapid and accurate protein structure prediction method to assign the structure and function of gene products. Threading has been proved to be successful in protein fold assignment,although difficulties remain for low homologous sequences. We have developed a method for solving the sequence rearrangement problem in threading. By reshuffling secondary elements,protein structures with the same spatial arrangement of secondary structures but different connections can be predicted. This method has been proved to be useful in fold recognition for proteins of different evolutionary origin and converge to the same fold. 展开更多
关键词 蛋白质 结构预测 折叠模式识别 低同源性 收敛进化 基因组 二级结构
下载PDF
使用图像特征构建快速有效的蛋白质折叠识别方法 被引量:5
3
作者 施建宇 张艳宁 《生物物理学报》 CAS CSCD 北大核心 2009年第2期106-116,共11页
蛋白质结构自动分类是探索蛋白质结构-功能关系的一种重要研究手段。首先将蛋白质折叠子三维空间结构映射成为二维距离矩阵,并将距离矩阵视作灰度图像。然后基于灰度直方图和灰度共生矩阵提出了一种计算简单的折叠子结构特征提取方法,... 蛋白质结构自动分类是探索蛋白质结构-功能关系的一种重要研究手段。首先将蛋白质折叠子三维空间结构映射成为二维距离矩阵,并将距离矩阵视作灰度图像。然后基于灰度直方图和灰度共生矩阵提出了一种计算简单的折叠子结构特征提取方法,得到了低维且能够反映折叠结构特点的特征,并进一步阐明了直方图中零灰度孤峰形成原因,深入分析了共生矩阵特征中灰度分布、不同角度和像素距离对应的结构意义。最后应用于27类折叠子分类,对独立集测试的精度达到了71.95%,对所有数据进行10交叉验证的精度为78.94%。与多个基于序列和结构的折叠识别方法的对比结果表明,此方法不仅具有低维和简洁的特征,而且无需复杂的分类系统,能够有效和高效地实现多类折叠子识别。 展开更多
关键词 折叠识别 直方图 灰度共生矩阵 图像分析 支持向量机
原文传递
基于功能域组分的蛋白质折叠类型识别 被引量:3
4
作者 闫金丽 陈治伟 +1 位作者 徐海松 李晓琴 《生物化学与生物物理进展》 SCIE CAS CSCD 北大核心 2011年第2期166-172,共7页
蛋白质空间结构研究是分子生物学、细胞生物学、生物化学以及药物设计等领域的重要课题.折叠类型反映了蛋白质核心结构的拓扑模式,对折叠类型的识别是蛋白质序列与结构关系研究的重要内容.选取LIFCA数据库中样本量较大的53种折叠类型,... 蛋白质空间结构研究是分子生物学、细胞生物学、生物化学以及药物设计等领域的重要课题.折叠类型反映了蛋白质核心结构的拓扑模式,对折叠类型的识别是蛋白质序列与结构关系研究的重要内容.选取LIFCA数据库中样本量较大的53种折叠类型,应用功能域组分方法进行折叠识别.将Astral 1.65中序列一致性小于95%的样本作为检验集,全库检验结果中平均敏感性为96.42%,特异性为99.91%,马修相关系数(MCC)为0.91,各项统计结果表明:功能域组分方法可以很好地应用在蛋白质折叠识别中,LIFCA相对简单的分类规则可以很好地集中蛋白质的大部分功能特性,反映了结构与功能的对应关系. 展开更多
关键词 折叠类型 折叠识别 功能域 LIFCA数据库
下载PDF
A Contact Energy Function Considering Residue Hydrophobic Environment and Its Application in Protein Fold Recognition 被引量:1
5
作者 Mo-Jie Duan Yan-Hong Zhou 《Genomics, Proteomics & Bioinformatics》 SCIE CAS CSCD 2005年第4期218-224,共7页
The three-dimensional (3D) structure prediction of proteins :is an important task in bioinformatics. Finding energy functions that can better represent residue-residue and residue-solvent interactions is a crucial ... The three-dimensional (3D) structure prediction of proteins :is an important task in bioinformatics. Finding energy functions that can better represent residue-residue and residue-solvent interactions is a crucial way to improve the prediction accu- racy. The widely used contact energy functions mostly only consider the contact frequency between different types of residues; however, we find that the contact frequency also relates to the residue hydrophobic environment. Accordingly, we present an improved contact energy function to integrate the two factors, which can reflect the influence of hydrophobic interaction on the stabilization of protein 3D structure more effectively. Furthermore, a fold recognition (threading) approach based on this energy function is developed. The testing results obtained with 20 randomly selected proteins demonstrate that, compared with common contact energy functions, the proposed energy function can improve the accuracy of the fold template prediction from 20% to 50%, and can also improve the accuracy of the sequence-template alignment from 35% to 65%. 展开更多
关键词 protein structure prediction fold recognition contact energy hydrophobic environment
原文传递
蛋白质折叠识别方法综述(英文)
6
作者 鄢仁祥 王晓峰 +2 位作者 许伟明 林娟 蔡伟文 《生物信息学》 2015年第4期231-238,共8页
蛋白质折叠识别算法是蛋白质三维结构预测的重要方法之一,该方法在生物科学的许多方面得到卓有成效的应用。在过去的十年中,我们见证了一系列基于不同计算方式的蛋白质折叠识别方法。在这些计算方法中,机器学习和序列谱-序列谱比对是两... 蛋白质折叠识别算法是蛋白质三维结构预测的重要方法之一,该方法在生物科学的许多方面得到卓有成效的应用。在过去的十年中,我们见证了一系列基于不同计算方式的蛋白质折叠识别方法。在这些计算方法中,机器学习和序列谱-序列谱比对是两种在蛋白质折叠中应用较为广泛和有效的方法。除了计算方法的进展外,不断增大的蛋白质结构数据库也是蛋白质折叠识别的预测精度不断提高的一个重要因素。在这篇文章中,我们将简要地回顾蛋白质折叠中的先进算法。另外,我们也将讨论一些可能可以应用于改进蛋白质折叠算法的策略。 展开更多
关键词 折叠识别 序列比对 结构预测
下载PDF
基于支持向量机融合网络的蛋白质折叠子识别研究 被引量:19
7
作者 施建宇 潘泉 +1 位作者 张绍武 梁彦 《生物化学与生物物理进展》 SCIE CAS CSCD 北大核心 2006年第2期155-162,共8页
在不依赖于序列相似性的条件下,蛋白质折叠子识别是一种分析蛋白质结构的重要方法.提出了一种三层支持向量机融合网络,从蛋白质的氨基酸序列出发,对27类折叠子进行识别.融合网络使用支持向量机作为成员分类器,采用“多对多”的多类分类... 在不依赖于序列相似性的条件下,蛋白质折叠子识别是一种分析蛋白质结构的重要方法.提出了一种三层支持向量机融合网络,从蛋白质的氨基酸序列出发,对27类折叠子进行识别.融合网络使用支持向量机作为成员分类器,采用“多对多”的多类分类策略,将折叠子的6种特征分为主要特征和次要特征,构建了多个差异的融合方案,然后对这些融合方案进行动态选择得到最终决策.当分类之前难以确定哪些参与组合的特征种类能够使分类结果最好时,提供了一种可靠的解决方案来自动选择特征信息互补最大的组合,保证了最佳分类结果.最后,识别系统对独立测试样本的总分类精度达到61.04%.结果和对比表明,此方法是一种有效的折叠子识别方法. 展开更多
关键词 折叠子识别 支持向量机 分类器融合 动态选择
下载PDF
蛋白质折叠类型的分类建模与识别 被引量:8
8
作者 刘岳 李晓琴 +1 位作者 徐海松 乔辉 《物理化学学报》 SCIE CAS CSCD 北大核心 2009年第12期2558-2564,共7页
蛋白质的氨基酸序列如何决定空间结构是当今生命科学研究中的核心问题之一.折叠类型反映了蛋白质核心结构的拓扑模式,折叠识别是蛋白质序列-结构研究的重要内容.我们以占Astral 1.65序列数据库中α,β和α/β三类蛋白质总量41.8%的36个... 蛋白质的氨基酸序列如何决定空间结构是当今生命科学研究中的核心问题之一.折叠类型反映了蛋白质核心结构的拓扑模式,折叠识别是蛋白质序列-结构研究的重要内容.我们以占Astral 1.65序列数据库中α,β和α/β三类蛋白质总量41.8%的36个无法独立建模的折叠类型为研究对象,选取其中序列一致性小于25%的样本作为训练集,以均方根偏差(RMSD)为指标分别进行系统聚类,生成若干折叠子类,并对各子类建立基于多结构比对算法(MUSTANG)结构比对的概形隐马尔科夫模型(profile-HMM).将Astral 1.65中序列一致性小于95%的9505个样本作为检验集,36个折叠类型的平均识别敏感性为90%,特异性为99%,马修斯相关系数(MCC)为0.95.结果表明:对于成员较多,无法建立统一模型的折叠类型,基于RMSD的系统分类建模均可实现较高准确率的识别,为蛋白质折叠识别拓展了新的方法和思路,为进一步研究奠定了基础. 展开更多
关键词 蛋白质折叠类型 均方根偏差 系统聚类 隐马尔科夫模型 折叠识别
下载PDF
基于结构分类的蛋白质折叠模式识别方法
9
作者 刘伟华 毛凤楼 +1 位作者 来鲁华 韩玉真 《生物物理学报》 CAS CSCD 北大核心 1999年第1期126-136,共11页
对用于折叠模式识别的蛋白质结构数据库进行结构分类,构建了四个分类库:Al-α库,Al-β库,α/β库,α+β库和一个总库,然后分别统计出不同灵敏度的匹配评估函数(平均势)。对不同的平均势,不同结构类型的蛋白进行的检验... 对用于折叠模式识别的蛋白质结构数据库进行结构分类,构建了四个分类库:Al-α库,Al-β库,α/β库,α+β库和一个总库,然后分别统计出不同灵敏度的匹配评估函数(平均势)。对不同的平均势,不同结构类型的蛋白进行的检验发现:来源于α/β库的平均势预测能力最强,来源于Al-α库的平均势预测能力最弱;对α/β蛋白的预测成功率最高,对Al-α蛋白的预测成功率最低。这与α/β蛋白结构最规则。 展开更多
关键词 蛋白质 折叠模式识别 结构分类 平均势
下载PDF
基于相关向量机的多类蛋白质折叠识别 被引量:3
10
作者 章文 刘娟 《武汉大学学报(理学版)》 CAS CSCD 北大核心 2008年第3期353-356,共4页
蛋白质折叠的识别是一种不依赖于序列相似性的蛋白质结构研究方法.本文将相关向量机应用于蛋白质折叠的识别,将两类相关向量机推广到多分类情况,对多类蛋白质折叠进行识别.与支持向量机相比较,相关向量机无需调整多余的参数,核函数不需... 蛋白质折叠的识别是一种不依赖于序列相似性的蛋白质结构研究方法.本文将相关向量机应用于蛋白质折叠的识别,将两类相关向量机推广到多分类情况,对多类蛋白质折叠进行识别.与支持向量机相比较,相关向量机无需调整多余的参数,核函数不需要满足mercer条件,实际数据集上的测试结果表明,相关向量机可以得到更加稀疏的模型,在交叉检验中获得了更高的精度,表明相关向量机是一种有效的识别蛋白质折叠的方法. 展开更多
关键词 相关向量机 蛋白质折叠识别 多分类问题 机器学习
下载PDF
一个识别蛋白质折叠模式的SVM分类器 被引量:1
11
作者 郭海娟 吕强 +3 位作者 吴宏杰 吴进珍 杨鹏 黄旭 《生物信息学》 2010年第4期287-290,共4页
蛋白质折叠模式识别是一种分析蛋白质结构的重要方法。以序列相似性较低的蛋白质为训练集,提取蛋白质序列信息频数及疏水性等信息作为折叠类型特征,从SCOP数据库中已分类蛋白质构建1 393种折叠模式的数据集,采用SVM预测蛋白质1 393种折... 蛋白质折叠模式识别是一种分析蛋白质结构的重要方法。以序列相似性较低的蛋白质为训练集,提取蛋白质序列信息频数及疏水性等信息作为折叠类型特征,从SCOP数据库中已分类蛋白质构建1 393种折叠模式的数据集,采用SVM预测蛋白质1 393种折叠模式。封闭测试准确率达99.612 2%,基于SCOP的开放测试准确率达79.632 9%。基于另一个权威测试集的开放测试折叠准确率达64.705 9%,SCOP类准确率达76.470 6%,可以有效地对蛋白质折叠模式进行预测,从而为蛋白质从头预测提供参考。 展开更多
关键词 蛋白质折叠模式识别 SVM 从头预测
下载PDF
基于卷积神经网络的蛋白质折叠类型最小特征提取 被引量:1
12
作者 潘越 王骏 +2 位作者 李文飞 张建 王炜 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第5期744-753,共10页
通过蛋白质的序列、结构等信息构建完整的蛋白质宇宙是生物信息学中的重要课题,相关研究对蛋白质结构预测、蛋白质进化路径分析以及蛋白质结构设计等方面的研究都有重要的意义.从蛋白质结构的一种简化表示——蛋白质接触图出发,通过训... 通过蛋白质的序列、结构等信息构建完整的蛋白质宇宙是生物信息学中的重要课题,相关研究对蛋白质结构预测、蛋白质进化路径分析以及蛋白质结构设计等方面的研究都有重要的意义.从蛋白质结构的一种简化表示——蛋白质接触图出发,通过训练卷积神经网络进行特征提取,筛选出可识别结构域折叠类型的最小特征向量,构建蛋白质折叠类型空间,并使用谱聚类等方法对不同蛋白质折叠类型的高维分布情况进行分析.得到的最小特征向量兼顾了信息的完整性与冗余度,可以很好地表示全部七种常见蛋白质类的空间关联.该研究结果填补了之前蛋白质宇宙研究中对不常见类的空间位置和相互关系描述的空白,加深了对于蛋白质结构相似性的理解. 展开更多
关键词 蛋白质宇宙 深度学习 卷积神经网络 蛋白质折叠类型识别
下载PDF
双绕蛋白质的分类与识别 被引量:1
13
作者 刘岳 徐海松 +1 位作者 乔辉 李晓琴 《生物信息学》 2010年第1期1-6,共6页
蛋白质折叠识别是蛋白质结构研究的重要内容。双绕是α/β蛋白质中结构典型的常见折叠类型。选取22个家族中序列一致性小于25%的79个典型双绕蛋白质作为训练集,以RMSD为指标进行系统聚类,并对各类建立基于结构比对的概形隐马尔科夫模型(... 蛋白质折叠识别是蛋白质结构研究的重要内容。双绕是α/β蛋白质中结构典型的常见折叠类型。选取22个家族中序列一致性小于25%的79个典型双绕蛋白质作为训练集,以RMSD为指标进行系统聚类,并对各类建立基于结构比对的概形隐马尔科夫模型(profile-HMM)。将Astral1.65中序列一致性小于95%的9 505个样本作为检验集,整体识别敏感性为93.9%,特异性为82.1%,MCC值为0.876。结果表明:对于成员较多,无法建立统一模型的折叠类型,分类建模可以实现较高准确率的识别。 展开更多
关键词 双绕蛋白质 RMSD 系统聚类 隐马尔科夫模型 折叠类型识别
下载PDF
基于ELMC的蛋白质折叠识别方法
14
作者 唐立力 《计算机工程与应用》 CSCD 2013年第10期114-117,共4页
传统的机器学习方法在处理蛋白质折叠类型识别问题时需要花费大量的时间来调节最佳参数,利用一种新的极限学习机(Extreme Learning Machine,ELM)分类优化方法(Extreme Learning Machine for Classification,ELMC)对蛋白质折叠进行识别,... 传统的机器学习方法在处理蛋白质折叠类型识别问题时需要花费大量的时间来调节最佳参数,利用一种新的极限学习机(Extreme Learning Machine,ELM)分类优化方法(Extreme Learning Machine for Classification,ELMC)对蛋白质折叠进行识别,仅需调节很少的参数值就可达到很好的测试精度。与支持向量机(Support Vector Machine,SVM)和推荐相关向量机(Relevance Vector Machine,RVM)相比,ELMC能获得更好的泛化性能,而且在寻找最优解的训练时间比较上,ELMC比SVM平均要快35倍,比RVM要快12倍。 展开更多
关键词 蛋白质折叠识别 ELM分类优化方法 多类分类
下载PDF
猪IL27p28蛋白分子的三维结构模建的研究
15
作者 胡鹏 胡怀东 +2 位作者 唐俐 彭明利 任红 《西南师范大学学报(自然科学版)》 CAS CSCD 北大核心 2005年第6期1090-1094,共5页
利用生物信息学手段分析了猪白细胞介素IL27p28(IL27p28)蛋白的二级结构及特征,并运用线索化/折叠识别方法模建了猪IL27p28蛋白分子的三维空间结构,它是一种与4-螺旋细胞因子超家族中的牛粒细胞集落刺激因子(G-CSF)类似,并且含有多个... 利用生物信息学手段分析了猪白细胞介素IL27p28(IL27p28)蛋白的二级结构及特征,并运用线索化/折叠识别方法模建了猪IL27p28蛋白分子的三维空间结构,它是一种与4-螺旋细胞因子超家族中的牛粒细胞集落刺激因子(G-CSF)类似,并且含有多个功能结构位点的全α型蛋白质.在此基础上,结合氨基酸特性,分析其可能的功能位点,发现其中5个功能结构位点分布在蛋白质纵轴的两端.包括1个蛋白激酶C磷酸化位点,3个酪蛋白激酶Ⅱ磷酸化位点和一个N-豆寇酰化位点,推测蛋白质纵轴的两端是其重要的功能结构区域. 展开更多
关键词 IL27p28 蛋白质三维结构 结构预测 线索化/折叠识别方法
下载PDF
极限学习机优化方法在蛋白质折叠类型识别中的应用
16
作者 张志锋 范乃梅 《科学技术与工程》 北大核心 2013年第11期3002-3005,3011,共5页
传统的机器学习方法在处理蛋白质折叠类型识别问题时需要花费大量的时间来调节最佳的参数。利用一种新的极限学习机(Extreme Learning Machine,ELM)分类优化方法(Extreme Learning Machine for Classification,ELMC)对蛋白质折叠进行识... 传统的机器学习方法在处理蛋白质折叠类型识别问题时需要花费大量的时间来调节最佳的参数。利用一种新的极限学习机(Extreme Learning Machine,ELM)分类优化方法(Extreme Learning Machine for Classification,ELMC)对蛋白质折叠进行识别,仅需调节很少的参数值就可达到很好的测试精度。与支持向量机(Support Vector Machine,SVM)和推荐相关向量机(Relevance Vector Machine,RVM)相比,ELMC能获得更好的泛化性能,而且在寻找最优解的训练时间比较上,ELMC比SVM平均要快35倍,比RVM要快12倍。 展开更多
关键词 蛋白质折叠识别 ELM分类优化方法 多类分类
下载PDF
蛋白质折叠类型识别方法研究 被引量:5
17
作者 张玮 李晓琴 +1 位作者 徐海松 任文科 《生物物理学报》 CAS CSCD 北大核心 2008年第1期65-71,共7页
蛋白质折叠类型识别是一种分析蛋白质结构的重要方法。以序列相似性低于25%的822个全β类蛋白为研究对象,提取核心结构二级结构片段及片段间氢键作用信息为折叠类型特征参数,构建全β类蛋白74种折叠类型模板数据库。定义查询蛋白与折叠... 蛋白质折叠类型识别是一种分析蛋白质结构的重要方法。以序列相似性低于25%的822个全β类蛋白为研究对象,提取核心结构二级结构片段及片段间氢键作用信息为折叠类型特征参数,构建全β类蛋白74种折叠类型模板数据库。定义查询蛋白与折叠类型模板间二级结构匹配函数SS、氢键作用势函数BP及打分函数P,P值最小的模板所对应的折叠类型为查询蛋白的折叠类型。从SCOP1.69中随机抽取三组、每组50个全β类蛋白结构域进行预测,分辨精度分别为56%、56%和42%;对Ding等提供的检验集进行预测,总分辨精度为61.5%。结果和比对表明,此方法是一种有效的折叠类型识别方法。 展开更多
关键词 折叠类型识别 结构域 全β类蛋白
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部