期刊文献+
共找到33篇文章
< 1 2 >
每页显示 20 50 100
随机森林方法预测膜蛋白类型 被引量:14
1
作者 袁敏 胡秀珍 《生物物理学报》 CAS CSCD 北大核心 2009年第5期349-355,共7页
膜蛋白的类型与其功能是密切相关的,因此膜蛋白类型的预测是研究其功能的重要手段,从蛋白质的氨基酸序列出发对膜蛋白的类型进行预测有重要意义。文章基于蛋白质的氨基酸序列,将组合离散增量和伪氨基酸组分信息共同作为预测参数,采用随... 膜蛋白的类型与其功能是密切相关的,因此膜蛋白类型的预测是研究其功能的重要手段,从蛋白质的氨基酸序列出发对膜蛋白的类型进行预测有重要意义。文章基于蛋白质的氨基酸序列,将组合离散增量和伪氨基酸组分信息共同作为预测参数,采用随机森林分类器,对8类膜蛋白进行了预测。在Jackknife检验下的预测精度为86.3%,独立检验的预测精度为93.8%,取得了好于前人的预测结果。 展开更多
关键词 生物膜蛋白 随机森林法 离散增量 离散傅里叶谱 伪氨基酸组分
原文传递
改进的离散增量算法预测27类折叠子的结构类型 被引量:6
2
作者 张怀光 胡秀珍 《内蒙古大学学报(自然科学版)》 CAS CSCD 北大核心 2009年第3期285-290,共6页
蛋白质二级结构预测是三级结构预测的一个非常重要的中间步骤,而折叠子识别和结构类型的准确预测则可以提高二级结构和三级结构预测的准确度.本文从蛋白质的一级序列出发,提出了一种改进的预测算法:以二肽组分、预测的二级结构信息、伪... 蛋白质二级结构预测是三级结构预测的一个非常重要的中间步骤,而折叠子识别和结构类型的准确预测则可以提高二级结构和三级结构预测的准确度.本文从蛋白质的一级序列出发,提出了一种改进的预测算法:以二肽组分、预测的二级结构信息、伪氨基酸组分和位置权重矩阵打分值等特征分别作为参数,输入离散增量算法的单分类器中,通过加权融合单分类器的计算结果,对27类折叠子的结构类型进行了预测,取得了较好的预测结果. 展开更多
关键词 离散增量 伪氨基酸组分 位置权重矩阵 蛋白质折叠子 蛋白质结构类型
下载PDF
使用伪氨基酸组成和模糊支持向量机预测蛋白质结构类 被引量:2
3
作者 姜小莹 朱俊东 +1 位作者 李晓波 张同亮 《生物物理学报》 CAS CSCD 北大核心 2008年第1期43-48,共6页
蛋白质结构类预测是生物信息和蛋白质科学中重要的研究领域。基于Chou提出的伪氨基酸离散模型框架,从蛋白质序列出发,设计一种新的伪氨基酸组成方法表示蛋白质序列样本。抽取氨基酸组合(10-D)在序列中出现的频率和疏水氨基酸模式(6-D)... 蛋白质结构类预测是生物信息和蛋白质科学中重要的研究领域。基于Chou提出的伪氨基酸离散模型框架,从蛋白质序列出发,设计一种新的伪氨基酸组成方法表示蛋白质序列样本。抽取氨基酸组合(10-D)在序列中出现的频率和疏水氨基酸模式(6-D)表示蛋白质序列的附加特征,用和传统的氨基酸组成(20-D)一起构成的36维的伪氨基酸组成向量来表示蛋白质序列的特征。使用遗传算法来优化附加特征的权重系数。伪氨基酸组成向量作为输入数据,模糊支持向量机作为预测工具。使用三个常用的标准数据集来验证算法的性能。Jack-knife检验结果说明本方法具有较高的准确率,有望成为潜在的预测蛋白质功能的工具。 展开更多
关键词 蛋白质结构类预测 伪氨基酸组成 模糊支持向量机 遗传算法
下载PDF
基于伪氨基酸组成的G蛋白偶联受体超家族的识别 被引量:2
4
作者 顾全 丁永生 +1 位作者 张同亮 沈懿珍 《生物医学工程学杂志》 EI CAS CSCD 北大核心 2010年第3期500-504,共5页
G蛋白偶联受体(GPCRs)是人体内最大的蛋白质受体家族,在制药业中起到很大作用。G蛋白偶联受体的功能和其超家族、子家族的分类密切相关,然而目前其空间结构却很难用实验方法获得。因此,如何用计算的方法预测G蛋白偶联受体的家族和超家... G蛋白偶联受体(GPCRs)是人体内最大的蛋白质受体家族,在制药业中起到很大作用。G蛋白偶联受体的功能和其超家族、子家族的分类密切相关,然而目前其空间结构却很难用实验方法获得。因此,如何用计算的方法预测G蛋白偶联受体的家族和超家族是生物信息学和蛋白质科学中重要的研究内容。根据Chou提出的伪氨基酸离散模型框架,使用近似熵的概念表示G蛋白序列附加特征,构造一种新的蛋白序列表示方法。采用FKNN(模糊K近邻)分类器作为预测工具,从最新的G蛋白数据抽取全部数据,经过去除同源性处理后,构成低同源性的新测试数据集。Jackknife测试结果验证了此方法的有效性。与之前的研究结果相比,取得了最高的预测精度。结果表明,此方法处理G蛋白偶联受体有很高的实用价值。 展开更多
关键词 G蛋白偶联受体 低同源性 伪氨基酸组成 近似熵 FKNN分类器
原文传递
基于伪氨基酸和支持向量机的蛋白质亚细胞定位预测 被引量:3
5
作者 姜小莹 李晓波 《广西农业生物科学》 CSCD 2006年第4期349-352,374,共5页
用电子—离子伪势能(E IIP)对蛋白质序列数字化,经离散傅立叶变换(DFT)后,取5个最高幅值对应的频率和20种氨基酸在序列中所占的百分比组成伪氨基酸。用支持向量机(SVM)方法得到分类的模型,并用几个标准的测试方法测试模型的性能。自身... 用电子—离子伪势能(E IIP)对蛋白质序列数字化,经离散傅立叶变换(DFT)后,取5个最高幅值对应的频率和20种氨基酸在序列中所占的百分比组成伪氨基酸。用支持向量机(SVM)方法得到分类的模型,并用几个标准的测试方法测试模型的性能。自身一致性测试和Jackkn ife测试均取得高的预测准确率,独立数据集测试的准确率超过80%。和之前报道的方法相比,本方法具有较高的预测准确率。 展开更多
关键词 生物信息 亚细胞定位 支持向量机 伪氨基酸 电子-离子伪势能
下载PDF
The Significant and Profound Impacts of Chou’s Pseudo Amino Acid Composition or PseAAC 被引量:1
6
作者 Kuo-Chen Chou 《Natural Science》 2020年第9期647-658,共12页
In this short review paper, the significant and profound impacts of the Pseudo Amino Acid Composition or PseAAC have been briefly presented with crystal clear convincingness.
关键词 pseudo amino acid composition PseAAC Significant Impacts Profound Impacts
下载PDF
Structural Prediction of Membrane Protein:Application to Known Structures
7
作者 赵培英 丁永生 《Journal of Donghua University(English Edition)》 EI CAS 2010年第2期289-292,共4页
Membrane proteins are embedded in the lipid bilayer,which creates a suitable environment for their actions. It is important to decide which tpye it belongs to because it is closely relevant to its biological function ... Membrane proteins are embedded in the lipid bilayer,which creates a suitable environment for their actions. It is important to decide which tpye it belongs to because it is closely relevant to its biological function and its interaction process with other molecules in a biological system. Membrane proteins have different types. The function of a membrane protein is closely correlated with the type it belongs to. In this study,on the basis of the concept of pseudo amino acid (PseAA) composition originally introduced by Chou,the value of approximate entropy (ApEn) of the query membrane protein was used to integrate the complementary information. By fusing fifteen powerful individual fuzzy K-nearest neighbor ( FKNN) classifiers,an ensemble classifier was presented. Each basic classifier was trained in PseAA composition of membrane protein sequences with different parameters. The results of experiments demonstrate it is efficient for the structural prediction of membrane proteins. 展开更多
关键词 pseudo amino acid composition approximate entropy ensemble classifiers
下载PDF
基于改进伪氨基酸组成的蛋白质相互作用预测 被引量:2
8
作者 许传轲 陈月辉 赵亚欧 《山东大学学报(理学版)》 CAS CSCD 北大核心 2009年第9期17-21,共5页
提出了一种新的基于改进的伪氨基酸组成特征模型与随机森林的蛋白质相互作用预测方法。首先利用基于Geary自相关函数的伪氨基酸组成特征模型,对与蛋白质相互作用相关的氨基酸属性进行评价,然后根据评价结果选择相关的属性整合到基于Mink... 提出了一种新的基于改进的伪氨基酸组成特征模型与随机森林的蛋白质相互作用预测方法。首先利用基于Geary自相关函数的伪氨基酸组成特征模型,对与蛋白质相互作用相关的氨基酸属性进行评价,然后根据评价结果选择相关的属性整合到基于Minkowski距离的伪氨基酸特征模型中,并使用随机森林作为分类器进行学习和预测,实验结果表明该方法相对于传统方法提高了正确率。 展开更多
关键词 蛋白质相互作用 伪氨基酸组成 随机森林
原文传递
基于两层分类器的抗微生物肽种类预测 被引量:2
9
作者 李凤敏 王晓茜 王星支 《内蒙古农业大学学报(自然科学版)》 CAS 北大核心 2014年第4期148-152,共5页
抗微生物肽是由宿主产生的一类能够抵御外界病原体感染的小分子多肽,由于其特殊的防御机制和不易产生抗药性,已经成为医学与生物学研究的热点。抗微生物肽应用于医学主要依靠其独特的生物学功能,所以从其功能层面对抗微生物肽进行预测... 抗微生物肽是由宿主产生的一类能够抵御外界病原体感染的小分子多肽,由于其特殊的防御机制和不易产生抗药性,已经成为医学与生物学研究的热点。抗微生物肽应用于医学主要依靠其独特的生物学功能,所以从其功能层面对抗微生物肽进行预测十分必要。本文选取氨基酸组分和伪氨基酸组分信息为特征向量,分别利用随机森林(RF)和k-近邻(KNN)算法,采用两层分类器对抗微生物肽种类进行预测,第一层分类器预测是否为抗微生物肽,成功率达到93.14%,第二层分类器针对抗微生物肽的五种生物学功能进行分类预测,成功率达到83.65%。 展开更多
关键词 抗微生物肽 伪氨基酸 随机森林 K-近邻
原文传递
使用伪氨基酸和集成分类器预测凋谢蛋白亚细胞定位 被引量:2
10
作者 魏蓉 赵艳君 +1 位作者 张同亮 顾全 《计算机与应用化学》 CAS CSCD 北大核心 2009年第7期921-924,共4页
预测凋谢蛋白质亚细胞定位是生物信息学和蛋白质科学中重要的研究内容。基于Chou的伪氨基酸组成概念,用近似熵表示蛋白质序列的附加特征,组成新的伪氨基酸组成表示序列特征。将蛋白质序列看作短时间序列,近似熵能够区分不同亚细胞定位... 预测凋谢蛋白质亚细胞定位是生物信息学和蛋白质科学中重要的研究内容。基于Chou的伪氨基酸组成概念,用近似熵表示蛋白质序列的附加特征,组成新的伪氨基酸组成表示序列特征。将蛋白质序列看作短时间序列,近似熵能够区分不同亚细胞定位中序列的复杂度。结合多个模糊K近邻分类器(基本分类器)的集成分类器作为预测工具。以不同维数的伪氨基酸组成向量,作为每个基本分类器的输入数据。3个常用的数据集用来测试算法的性能,Jackknife测试结果表明新算法有效和实用。有望发展成为亚细胞定位研究的有用工具。 展开更多
关键词 凋谢蛋白质亚细胞定位 伪氨基酸组成 近似熵 集成分类器 模糊K近邻分类器
原文传递
Using Chou’s Pseudo Amino Acid Composition for Protein Remote Homology Detection
11
作者 Bin Liu Xiaolong Wang 《Engineering(科研)》 2013年第10期149-153,共5页
Protein remote homology detection is a key problem in bioinformatics. Currently, the discriminative methods, such as Support Vector Machine (SVM), can achieve the best performance. The most efficient approach to impro... Protein remote homology detection is a key problem in bioinformatics. Currently, the discriminative methods, such as Support Vector Machine (SVM), can achieve the best performance. The most efficient approach to improve the performance of the SVM-based methods is to find a general protein representation method that is able to convert proteins with different lengths into fixed length vectors and captures the different properties of the proteins for the discrimination. The bottleneck of designing the protein representation method is that native proteins have different lengths. Motivated by the success of the pseudo amino acid composition (PseAAC) proposed by Chou, we applied this approach for protein remote homology detection. Some new indices derived from the amino acid index (AAIndex) database are incorporated into the PseAAC to improve the generalization ability of this method. Our experiments on a well-known benchmark show this method achieves superior or comparable performance with current state-of-the-art methods. 展开更多
关键词 PROTEIN REMOTE HOMOLOGY Support VECTOR Machine pseudo amino acid composition PROTEIN Representation
下载PDF
基于物化性质对嗜热蛋白的预测 被引量:1
12
作者 刀福英 陈欣欣 林昊 《生物信息学》 2017年第1期1-6,共6页
嗜热蛋白在高温下能保持稳定性和活性,是研究蛋白质热稳定性的理想模型,开发一个蛋白质热稳定性识别的方法将对蛋白质工程和蛋白质的设计很有帮助。目前的研究中,氨基酸的组成及其物化性质一直被认为和蛋白质的热稳定性相关。本研究筛... 嗜热蛋白在高温下能保持稳定性和活性,是研究蛋白质热稳定性的理想模型,开发一个蛋白质热稳定性识别的方法将对蛋白质工程和蛋白质的设计很有帮助。目前的研究中,氨基酸的组成及其物化性质一直被认为和蛋白质的热稳定性相关。本研究筛选出可靠的数据集,包括915个嗜热蛋白和793个非嗜热蛋白。利用蛋白质氨基酸的物化性质和氨基酸的组成表征嗜热蛋白,将二肽氨基酸组成整合到9组氨基酸物化性质中使蛋白序列公式化。支持向量机5折叠交叉验证表明:当gap=0时,290个特征产生的精度最高,为92.74%。因此说明对于分析蛋白质的热稳定性,所建立的预测模型将是一个很有效的工具。 展开更多
关键词 嗜热蛋白 热稳定性 伪氨基酸组分 氨基酸物化性质
下载PDF
基于近似熵的伪氨基酸组成预测蛋白质亚核定位
13
作者 张同亮 丁永生 +1 位作者 顾全 孙登宽 《生物物理学报》 CAS CSCD 北大核心 2008年第3期239-244,共6页
了解真核细胞中细胞核内蛋白质的定位情况对于新发现蛋白质的功能注释具有重要意义。随着蛋白质数据库中蛋白质序列数量的急速增加,采用计算方法来预测蛋白质亚核定位已经成为蛋白质科学领域研究的热点。根据Chou提出的伪氨基酸组成离... 了解真核细胞中细胞核内蛋白质的定位情况对于新发现蛋白质的功能注释具有重要意义。随着蛋白质数据库中蛋白质序列数量的急速增加,采用计算方法来预测蛋白质亚核定位已经成为蛋白质科学领域研究的热点。根据Chou提出的伪氨基酸组成离散模型,提出了一种新的蛋白质亚核定位预测方法。计算蛋白质序列的近似熵作为附加特征构建伪氨基酸组成,表示蛋白质序列特征,AdaBoost分类算法作为预测工具。与已报道的亚核定位预测方法的性能相比,这种方法具有更高的准确率。 展开更多
关键词 蛋白质亚核定位 伪氨基酸组成 近似熵 ADABOOST分类器
下载PDF
采用伪氨基酸组成预测水解酶亚家族 被引量:1
14
作者 李红春 张光亚 方柏山 《华侨大学学报(自然科学版)》 CAS 北大核心 2010年第3期317-321,共5页
利用伪氨基酸组成提取蛋白序列特征值,考察参数λ和w对识别效果的影响,以k-近邻作为基础分类器,用于预测水解酶的亚家族类型.结果表明,伪氨基酸组成特征提取法与单纯的20个氨基酸组成特征方法相比,其识别精度有较大程度提高.20AA组成的... 利用伪氨基酸组成提取蛋白序列特征值,考察参数λ和w对识别效果的影响,以k-近邻作为基础分类器,用于预测水解酶的亚家族类型.结果表明,伪氨基酸组成特征提取法与单纯的20个氨基酸组成特征方法相比,其识别精度有较大程度提高.20AA组成的平均预测精度为72.3%,而伪氨基酸组成特征提取的识别效果可达82.7%.在参数影响考察方面,自相关性函数个数的选取对识别效果影响较大,而权重因子w对识别效果影响则很小. 展开更多
关键词 水解酶亚家族 特征值 伪氨基酸 K-近邻
下载PDF
利用伪氨基酸组分预测分枝杆菌膜蛋白类型
15
作者 丁辰 邓科君 +1 位作者 袁鲁峰 林昊 《生物信息学》 2011年第3期238-241,共4页
膜蛋白是重要的药物靶位点,对膜蛋白类型的研究有助于药物的成功设计,因此正确预测膜蛋白类型对于药物研发是十分必要的。本文采用由274条分枝杆菌膜蛋白序列组成的一致性小于40%的数据集,以经过优化的伪氨基酸组分为特征,利用支持向量... 膜蛋白是重要的药物靶位点,对膜蛋白类型的研究有助于药物的成功设计,因此正确预测膜蛋白类型对于药物研发是十分必要的。本文采用由274条分枝杆菌膜蛋白序列组成的一致性小于40%的数据集,以经过优化的伪氨基酸组分为特征,利用支持向量机分类算法预测分枝杆菌膜蛋白类型,在Jackknife检验下,得到85.4%的总体准确率和72.2%的平均准确率。结果说明,该方法可用于分枝杆菌膜蛋白类型的识别,将有助于抗分枝杆菌药物的开发。 展开更多
关键词 分枝杆菌 膜蛋白 伪氨基酸组分 支持向量机 方差分析
下载PDF
利用伪氨基酸组分和支持向量机预测抗冻蛋白
16
作者 许嘉 《生物信息学》 2013年第4期297-299,共3页
抗冻蛋白是一类具有提高生物抗冻能力的蛋白质。抗冻蛋白能够特异性的与冰晶相结合,进而阻止体液内冰核的形成与生长。因此,对抗冻蛋白的生物信息学研究对生物工程发展,提高作物抗冻性有重要的推动作用。本文采用由400条抗冻蛋白序列和... 抗冻蛋白是一类具有提高生物抗冻能力的蛋白质。抗冻蛋白能够特异性的与冰晶相结合,进而阻止体液内冰核的形成与生长。因此,对抗冻蛋白的生物信息学研究对生物工程发展,提高作物抗冻性有重要的推动作用。本文采用由400条抗冻蛋白序列和400条非抗冻蛋白序列构成数据集,以伪氨基酸组分为特征,利用支持向量机分类算法预测抗冻蛋白,对训练集预测精度达到91.3%,对测试集预测精度达到78.8%。该结果证明伪氨基酸组分能够很好的反映抗冻蛋白特性,并能够用于预测抗冻蛋白。 展开更多
关键词 抗冻蛋白 伪氨基酸组分 支持向量机
下载PDF
基于改进的GO-PseAA方法的凋亡蛋白亚细胞定位
17
作者 樊玉才 胡秀珍 《内蒙古工业大学学报(自然科学版)》 2012年第1期12-18,共7页
亚细胞定位与蛋白质的功能紧密相关,细胞凋亡蛋白在生物体的发育和平衡状态中起着重要的作用,因此预测凋亡蛋白的亚细胞定位是十分有意义的。本文采用一种融合GO分子功能信息和伪氨基酸组分信息的杂合算法即GO-PseAA方法,来预测凋亡蛋... 亚细胞定位与蛋白质的功能紧密相关,细胞凋亡蛋白在生物体的发育和平衡状态中起着重要的作用,因此预测凋亡蛋白的亚细胞定位是十分有意义的。本文采用一种融合GO分子功能信息和伪氨基酸组分信息的杂合算法即GO-PseAA方法,来预测凋亡蛋白亚细胞定位。采用与Chen等相同的数据集和Jackknife检验,预测成功率达到了91.4%,结果表明本文采用的改进的GO-PseAA方法是预测凋亡蛋白亚细胞位置的一种很有效的方法。 展开更多
关键词 细胞凋亡蛋白 伪氨基酸组分 GO分子功能 最邻近算法 支持向量机
下载PDF
基于不同序列特征值预测氧化还原酶辅酶类型的研究
18
作者 张光亚 葛慧华 方柏山 《计算机与应用化学》 CAS CSCD 北大核心 2008年第5期545-548,共4页
如何有效提取蛋白质序列特征值,一直是生物信息学研究的重要任务。本文研究8种序列特征值提取方法,并考察它们在不同分类器中的表现,以用于预测氧化还原酶辅酶依赖类型。其中,氨基酸组成法效果最差,平均预测精度仪及64.96%;而将两性伪... 如何有效提取蛋白质序列特征值,一直是生物信息学研究的重要任务。本文研究8种序列特征值提取方法,并考察它们在不同分类器中的表现,以用于预测氧化还原酶辅酶依赖类型。其中,氨基酸组成法效果最差,平均预测精度仪及64.96%;而将两性伪氨基酸组成和新氨基酸组成分布两种方法合并后,以支持向量机作为分类器时,其识别效果最佳,可达92.93%。此外,不同特征值的提取方法与分类器之间似乎有着一定的匹配关系,只有找到其间的最佳匹配,才能获得最佳的识别效果。 展开更多
关键词 特征值提取 氧化还原酶 辅酶 两性伪氨基酸组成 新氨基酸组成分布
原文传递
基于修正的伪氨基酸组成预测水解酶亚家族的研究
19
作者 张光亚 邱沛然 +1 位作者 葛慧华 方柏山 《计算机与应用化学》 CAS CSCD 北大核心 2009年第5期557-560,共4页
从序列出发预测水解酶亚家族类型具有重要意义。本文利用不同标度的伪氨基酸组成提取序列特征值,采用k-近邻算法预测水解酶亚家族类型。选择参数后,三种方法各自在最优运行参数下预测水解酶亚家族的准确率分别为:85.15%,82.65%和80.14%... 从序列出发预测水解酶亚家族类型具有重要意义。本文利用不同标度的伪氨基酸组成提取序列特征值,采用k-近邻算法预测水解酶亚家族类型。选择参数后,三种方法各自在最优运行参数下预测水解酶亚家族的准确率分别为:85.15%,82.65%和80.14%。其中以Z标度的伪氨基酸组成效果最佳,比氨基酸组成识别精度提高12.85%。本文研究结果说明从序列出发,预测水解酶亚家族是可行的,且修正的伪氨基酸组成可望成为一种新的有效提取蛋白质序列特征值的方法。 展开更多
关键词 特征值提取 水解酶 修正的伪氨基酸组成 K-近邻
原文传递
基于伪氨基酸组成和多标记最近邻算法的抗菌肽功能类型预测
20
作者 王晓 杨鹏鹏 +1 位作者 王榕 李辉 《郑州轻工业学院学报(自然科学版)》 CAS 2015年第5期85-87,共3页
针对多数已有的计算方法无法同时预测抗菌肽的多种功能类型的问题,提出一种基于伪氨基酸组成和多标记最近邻算法的抗菌肽功能类型预测的系统方法:采用伪氨基酸组成抽取抗菌肽序列的特征向量,并且引入多标记最近邻算法作为预测引擎,同时... 针对多数已有的计算方法无法同时预测抗菌肽的多种功能类型的问题,提出一种基于伪氨基酸组成和多标记最近邻算法的抗菌肽功能类型预测的系统方法:采用伪氨基酸组成抽取抗菌肽序列的特征向量,并且引入多标记最近邻算法作为预测引擎,同时预测抗菌肽的多种功能类型.实验结果表明,本方法显著地提高了预测性能,为该领域的进一步研究提供了一个有用的工具. 展开更多
关键词 抗菌肽 伪氨基酸组成 多标记分类 多标记最近邻算法
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部