期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
蛋白质结构型的定义和识别 被引量:5
1
作者 李晓琴 罗辽复 《生物化学与生物物理进展》 SCIE CAS CSCD 北大核心 2002年第1期124-127,共4页
提出紧结构域的概念 ,由二级结构序列中一段或几段连续的α螺旋和 β折叠构成的空间紧密堆集的最大折叠体称为紧结构域 .利用 3种紧结构域 (α域 ,β域和α/β域 )定义球蛋白的 5种结构型 :α型蛋白 ,β型蛋白 ,α/β型蛋白 ,多域蛋白和... 提出紧结构域的概念 ,由二级结构序列中一段或几段连续的α螺旋和 β折叠构成的空间紧密堆集的最大折叠体称为紧结构域 .利用 3种紧结构域 (α域 ,β域和α/β域 )定义球蛋白的 5种结构型 :α型蛋白 ,β型蛋白 ,α/β型蛋白 ,多域蛋白和 ζ型蛋白 .将 12 6 1个代表性的蛋白质 (10 2 2家族 )进行分类 ,并和SCOP库的分类做了比较 .进行了删去序列冗余的分析 .在此基础上提出结构型的预测方案 ,成功率在 82 %~ 85 %. 展开更多
关键词 蛋白质结构型 二级结构序列 紧结构域 序列冗余 预测 识别
下载PDF
基于深度学习的蛋白质二级结构预测 被引量:5
2
作者 张安胜 王爱平 《计算机仿真》 CSCD 北大核心 2015年第1期392-396,共5页
后基因组时代的到来,蛋白质的数据量急剧增长。为对蛋白质结构进行准确预测,提出了一种深度学习的方法,来预测蛋白质的二级结构分类问题。采用由近似熵、疏水模式以及图像特征组成的伪氨基酸组分方法,来提取蛋白质序列的特征;预测模型... 后基因组时代的到来,蛋白质的数据量急剧增长。为对蛋白质结构进行准确预测,提出了一种深度学习的方法,来预测蛋白质的二级结构分类问题。采用由近似熵、疏水模式以及图像特征组成的伪氨基酸组分方法,来提取蛋白质序列的特征;预测模型采用了5层的深度玻尔兹曼机(DBM)+分类层,5层的DBM组成了4个RBM,分类层采用softmax分类器;同时采用了非监督学习和监督学习作为预测模型的训练策略。与现有预测方法相比,提出的预测方法,比目前较好的支持向量机(SVM),人工神经网络(ANN)精度均要高。实验结果表明,提出的改进方法具有很好的可行性和有效性。 展开更多
关键词 深度学习 蛋白质结构预测 伪氨基酸组分 蛋白质分类
下载PDF
蛋白质三级结构对蛋白质内部形成紧密接触对速率的影响 被引量:1
3
作者 施苏广 王向红 官铬刚 《浙江大学学报(理学版)》 CAS CSCD 北大核心 2008年第4期400-403,408,共5页
通过蛋白质分子内两残基间距的概率分布函数P(r),计算了641个蛋白质分子内近程和远程紧密接触对的形成速率.分析了不同蛋白质结构,不同紧密接触对半径以及DNA的绑定对速率的影响.结果表明:不同结构类型蛋白近程和远程紧密接触对的形成... 通过蛋白质分子内两残基间距的概率分布函数P(r),计算了641个蛋白质分子内近程和远程紧密接触对的形成速率.分析了不同蛋白质结构,不同紧密接触对半径以及DNA的绑定对速率的影响.结果表明:不同结构类型蛋白近程和远程紧密接触对的形成速率的变化趋势恰好相反.近程紧密接触对的形成速率kS随着n(n=|j-i|)的增大而增大,远程紧密接触对的形成速率kL随着n的增大而减小,并且远程紧密接触对的形成速率kL满足kL(n)∝n-γ的关系.γ值随着紧密接触对半径a的增大而变小,当a=0.6 nm时,全α蛋白的γ值等于0.382,α/β蛋白的γ值等于0.343,全β和α+β蛋白的γ值等于0.218.DNA的绑定使蛋白质分子内近程和远程紧密接触对的形成速率都减小. 展开更多
关键词 蛋白质三级结构 两残基间距的概率分布函数P(r) 紧密接触对的形成速率
下载PDF
半监督学习算法拉普拉斯支持向量机应用于蛋白质结构类预测 被引量:1
4
作者 吴疆 董婷 蒋平 《微型电脑应用》 2020年第8期5-8,共4页
应用半监督学习方法拉普拉斯支持向量机(Laplace Support Vector Machine, LapSVM)对蛋白质结构类进行预测。首先7个氨基酸理化性质参数作为替代模型将蛋白质序列转换为数字序列,自协方差变换(Autocross-Covariance, AC)用来描述具有一... 应用半监督学习方法拉普拉斯支持向量机(Laplace Support Vector Machine, LapSVM)对蛋白质结构类进行预测。首先7个氨基酸理化性质参数作为替代模型将蛋白质序列转换为数字序列,自协方差变换(Autocross-Covariance, AC)用来描述具有一定间隔氨基酸残基之间的相互关系并将数字序列变换为统一长度的向量,构建样本的特征空间。然后在数据集中分别随机挑选20、50、80、110、140、170个样本作为无标签样本构建训练集,一对多分解策略和留一法用来评价LapSVM模型的预报能力。分类器对蛋白质样本类预测正确率为94.12%,与标准支持向量机算法(Support Vector Machine, SVM)方法90.69%的预测精度相比有明显的竞争力。实验结果有效验证了无标签样本的分布信息作为弱规则能有效提升分类器的预报性能。同时提供了一种新颖的思路,应用半监督方法解决全监督学习问题,更小的优化规模,更好的预报能力。 展开更多
关键词 半监督学习 蛋白质结构类 拉普拉斯支持向量机 自协方差变换
下载PDF
蛋白质结构型的识别方法 被引量:1
5
作者 李晓琴 罗辽复 《生物化学与生物物理进展》 SCIE CAS CSCD 北大核心 2002年第6期938-941,共4页
给出了α型、β型、α/ β型、多域型蛋白质二级结构主序列六联体的分布规律 .提出了根据蛋白质二级结构主序列对蛋白质结构型进行识别 (分类 )的方法 .以蛋白质二级结构主序列三联体为参数 ,利用Mahalanobis距离方法对上述 4种结构型... 给出了α型、β型、α/ β型、多域型蛋白质二级结构主序列六联体的分布规律 .提出了根据蛋白质二级结构主序列对蛋白质结构型进行识别 (分类 )的方法 .以蛋白质二级结构主序列三联体为参数 ,利用Mahalanobis距离方法对上述 4种结构型的蛋白质进行识别 ,分类的总体准确率为 81% ;以二级结构主序列中六联体的频数构成蛋白质结构的多样性源 ,利用多样性增量极小化对上述 4种结构型进行识别 ,分类的总体准确率为 83% . 展开更多
关键词 蛋白质结构型 识别方法 二级结构序列 多样性指标
下载PDF
基于蛋白质二级结构内容的域结构类预测(英文)
6
作者 闫化军 章毅 《生物信息学》 2004年第4期19-24,41,共7页
运用加入竞争层的BP网络 ,研究了基于蛋白质二级结构内容的域结构类预测问题。在BP网络中嵌入一竞争 ,层显著提高了网络预测性能。仅使用了一个小的训练集和简单的网络结构 ,获得了很高的预测精度 :自支持精度 97 6 2 % ,jack -knife测... 运用加入竞争层的BP网络 ,研究了基于蛋白质二级结构内容的域结构类预测问题。在BP网络中嵌入一竞争 ,层显著提高了网络预测性能。仅使用了一个小的训练集和简单的网络结构 ,获得了很高的预测精度 :自支持精度 97 6 2 % ,jack -knife测试精度 97 6 2 % ,及平均外推精度 90 74 %。在建立更完备的域结构类特征向量和更有代表性的训练集的基础上 ,所述方法将为蛋白质域结构分类领域提供新的分类基准。 展开更多
关键词 蛋白质结构类 结构类预测 BP神经网络 竞争层
下载PDF
基于MATLAB的隐马尔可夫模型预测蛋白质结构类
7
作者 杨惠云 石鸥燕 +1 位作者 乔海晅 田心 《国际生物医学工程杂志》 CAS 2012年第6期350-352,372,共4页
目的准确预测蛋白质结构类,为研究其空间结构及生物功能打下基础。方法应用隐马尔可夫模型(HMM)预测蛋白质结构类,分别构建3-状态HMM和8-状态HMM。数据来源于Chou和Zhou构建的蛋白质数据集,分别包含有204条蛋白质序列和498条蛋白... 目的准确预测蛋白质结构类,为研究其空间结构及生物功能打下基础。方法应用隐马尔可夫模型(HMM)预测蛋白质结构类,分别构建3-状态HMM和8-状态HMM。数据来源于Chou和Zhou构建的蛋白质数据集,分别包含有204条蛋白质序列和498条蛋白质序列,通过留-法预测其准确率。结果所构建的3-状态HMM和8-状态HMM对全d类的预测准确率最高,尤其是3-状态HMM的预测准确率达到95%以上。与Chou数据集相比,Zhou数据集对于全B类和α/β类的预测准确率也有所提高,同时,总体预测率也提高了2%左右;但仅+B类的预测准确率有所下降。结论将整条蛋白质序列作为预测模型的输入信息所构建的HMM模型能有效地预测蛋白质的结构类。 展开更多
关键词 蛋白质结构类 预测 隐马尔可夫模型 3-状态 8-状态
原文传递
蛋白质结构类的全序列神经网络预测
8
作者 王焕峰 刘伟 《河南工业大学学报(自然科学版)》 CAS 北大核心 2009年第4期65-67,共3页
利用神经网络和蛋白质全序列对蛋白质结构类进行了预测.按照蛋白质序列的长度,分别从508个蛋白质中选择244个蛋白质构建了3个数据集,3个数据集中蛋白质序列的长度变化范围分别为50,100和150个氨基酸.3个数据集的自检结果均为100%.数据... 利用神经网络和蛋白质全序列对蛋白质结构类进行了预测.按照蛋白质序列的长度,分别从508个蛋白质中选择244个蛋白质构建了3个数据集,3个数据集中蛋白质序列的长度变化范围分别为50,100和150个氨基酸.3个数据集的自检结果均为100%.数据集的留一检测结果分别为97.13%,95.90%和95.49%.3个数据集中最好的10倍交叉检验结果为82.38%.结果表明,数据集的序列长度变化范围对预测准确率有很大影响,序列长度变化范围越大准确率越低. 展开更多
关键词 蛋白质结构类 全序列 神经网络 支持向量机
下载PDF
蛋白质结构型预测的研究
9
作者 贾孟文 李前忠 《内蒙古大学学报(自然科学版)》 CAS CSCD 北大核心 2002年第3期276-279,共4页
以 nα、nβ、nβαβ、n4α、n4β等五个二级结构参数为基础 ,用离散增量研究了蛋白质的聚类和蛋白质的结构型预测 .α型 ,β型和 αβ型可以很好地分别聚在三个大支中 .蛋白质结构型预测总体预测正确率为 82 % ,用 Self-consistency和... 以 nα、nβ、nβαβ、n4α、n4β等五个二级结构参数为基础 ,用离散增量研究了蛋白质的聚类和蛋白质的结构型预测 .α型 ,β型和 αβ型可以很好地分别聚在三个大支中 .蛋白质结构型预测总体预测正确率为 82 % ,用 Self-consistency和 Jake-knife这两种方法测试的结果没有明显的差别 .从结果可以看出利用蛋白质的二级结构参数能较好地体现出各种结构型蛋白质的特点 . 展开更多
关键词 二级结构参数 离散增量 蛋白质 聚类 结构型预测 二级结构序列 Α螺旋 Β折叠
下载PDF
基于多特征信息及Ma-Ada多分类器融合的蛋白质结构类预测 被引量:1
10
作者 郑斌 厉力华 《中国生物医学工程学报》 CAS CSCD 北大核心 2013年第5期580-587,共8页
蛋白质序列特征表示和机器学习算法是影响蛋白质结构类预测效果好坏的两个重要方面。本研究基于k-字统计频率和k-片段位置分布两种特征提取方法,将分别提取到的氨基酸序列信息和物理化学性质信息同蛋白质二级结构信息进行融合,建立17维... 蛋白质序列特征表示和机器学习算法是影响蛋白质结构类预测效果好坏的两个重要方面。本研究基于k-字统计频率和k-片段位置分布两种特征提取方法,将分别提取到的氨基酸序列信息和物理化学性质信息同蛋白质二级结构信息进行融合,建立17维和57维的特征信息集,并尝试在Adaboost.M1算法中引入Multi-Agent多智能体融合的思想,提出了一种Ma-Ada多分类器融合算法。该算法作为蛋白质结构类的预测工具,充分挖掘了单分类器度量层信息以及各个单分类器之间的交互融合信息。实验结果表明,Ma-Ada算法在Z277、Z498、1189和D640四个蛋白质数据集的57维特征信息集上的分类率分别达到了91.3%、96.8%、85.3%和87.2%,在17维特征信息集上的分类率也分别达到了90.6%、95.8%、84.8%和88.3%。与其它蛋白质结构类预测方法的结果相比,本方法能够获得较好的分类率。 展开更多
关键词 蛋白质结构类预测 特征信息集 Ma-Ada多分类器融合
下载PDF
基于二叉树支持向量机的蛋白质结构类预测 被引量:1
11
作者 张同亮 丁永生 《生物医学工程学杂志》 EI CAS CSCD 北大核心 2008年第4期921-924,共4页
提出了一种基于二叉树支持向量机(BT-SVM)的蛋白质结构类多类预测新方法。采用26维的向量来表示蛋白质序列的特征。BT-SVM多类分类方法能消除SVM在多分类问题中存在的不可分数据问题。采用两个经典数据集作为测试数据,通过自身一致性和... 提出了一种基于二叉树支持向量机(BT-SVM)的蛋白质结构类多类预测新方法。采用26维的向量来表示蛋白质序列的特征。BT-SVM多类分类方法能消除SVM在多分类问题中存在的不可分数据问题。采用两个经典数据集作为测试数据,通过自身一致性和n折叠交叉验证方法测试了新方法的性能。预测结果表明新方法具有良好的预测能力,与使用同一数据集的已有结果相比较,新方法的Jackknife结果和目前最好的方法取得的结果相当,可作为蛋白质结构类预测的一个工具。 展开更多
关键词 蛋白质结构类预测 二叉树支持向量机 氨基酸对相互作用 疏水模式
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部