期刊文献+
共找到29篇文章
< 1 2 >
每页显示 20 50 100
基于加权PSSM直方图和随机森林集成的蛋白质交互作用位点预测 被引量:7
1
作者 魏志森 杨静宇 於东军 《南京理工大学学报》 EI CAS CSCD 北大核心 2015年第4期379-385,共7页
为了提高蛋白质相互作用位点预测的精度,该文基于蛋白质位置特异性得分矩阵(Position specific scoring matrix,PSSM),提出了一种新的加权得分矩阵直方图特征表示方法;针对训练数据的极端不平衡,结合下采样和分类器集成方法,训练随机森... 为了提高蛋白质相互作用位点预测的精度,该文基于蛋白质位置特异性得分矩阵(Position specific scoring matrix,PSSM),提出了一种新的加权得分矩阵直方图特征表示方法;针对训练数据的极端不平衡,结合下采样和分类器集成方法,训练随机森林集成分类器。相对于传统的特征,该文所提新特征具有更低的维数,同时拥有更好的鉴别性。分类器集成则缓解了下采样带来的信息丢失,并提高了分类精度。实验结果验证了所述方法是有效的,在标准数据集上的结果优于其他最新的蛋白质相互作用位点预测方法。 展开更多
关键词 蛋白质作用 位置特异性得分矩阵 加权得分矩阵直方图 随机森林 分类器集成
下载PDF
基于SVM-RFE算法的凋亡蛋白亚细胞定位预测 被引量:4
2
作者 刘太岗 王春华 《计算机工程与应用》 CSCD 北大核心 2017年第10期155-159,共5页
获取凋亡蛋白亚细胞定位的信息对揭示细胞程序性死亡的机制和注解蛋白质功能都具有非常重要的意义。鉴于实验方法确定亚细胞定位不仅费时费力而且代价过高,开发快速有效的计算方法预测亚细胞定位已成为生物信息学领域的重要研究内容之... 获取凋亡蛋白亚细胞定位的信息对揭示细胞程序性死亡的机制和注解蛋白质功能都具有非常重要的意义。鉴于实验方法确定亚细胞定位不仅费时费力而且代价过高,开发快速有效的计算方法预测亚细胞定位已成为生物信息学领域的重要研究内容之一。首先基于位置特异性得分矩阵提取氨基酸组分、二肽组分和自协方差变量等特征构建蛋白质序列的特征表示模型,然后采用递归特征消除法进行特征选择,最后选用支持向量机分类器在两个常用数据集上进行夹克刀检验。实验结果表明,该方法优于大多数已报道的预测方法,从而证明了其有效性。 展开更多
关键词 位置特异性得分矩阵 自协方差变换 支持向量机 递归特征消除 夹克刀检验
下载PDF
基于分类器集成的跨膜蛋白两亲螺旋区域位置预测 被引量:4
3
作者 郜法启 於东军 沈红斌 《南京理工大学学报》 EI CAS CSCD 北大核心 2016年第4期431-437,共7页
为提高跨膜蛋白两亲螺旋区域(Amphipathic helices,AHs)预测的精度,基于蛋白质位置特异性得分矩阵、二级结构以及疏水矩,提出了一种新的衡量两亲性的螺旋周期性(Helix periodicity,HP)特征;利用Mem Brain预测器滤除跨膜区域片段并使用... 为提高跨膜蛋白两亲螺旋区域(Amphipathic helices,AHs)预测的精度,基于蛋白质位置特异性得分矩阵、二级结构以及疏水矩,提出了一种新的衡量两亲性的螺旋周期性(Helix periodicity,HP)特征;利用Mem Brain预测器滤除跨膜区域片段并使用下采样的方法,降低了AHs的搜索空间;在此基础上训练基于支持向量机(Support vector machine,SVM)的集成分类器用于AHs预测。为了客观评价AHs的预测性能,首次构建了领域内较为完备可用的标准数据集。在此数据集上的实验结果表明所提方法优于其他AHs预测方法。 展开更多
关键词 跨膜蛋白 两亲螺旋区域 位置特异性得分矩阵 疏水矩 分类器集成
下载PDF
基于支持向量机的癌细胞经典分泌蛋白与非经典分泌蛋白识别研究 被引量:4
4
作者 余乐正 柳凤娟 +2 位作者 李东海 郭延芝 李益洲 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第1期152-156,共5页
基于支持向量机算法,本文提出了一种能快速准确区分癌细胞经典分泌蛋白与非经典分泌蛋白的方法.通过严格的特征筛选,氨基酸组成、位置特异性得分矩阵和信号肽组成了最优特征集.测试集检测结果表明,本方法对癌细胞经典分泌蛋白与非经典... 基于支持向量机算法,本文提出了一种能快速准确区分癌细胞经典分泌蛋白与非经典分泌蛋白的方法.通过严格的特征筛选,氨基酸组成、位置特异性得分矩阵和信号肽组成了最优特征集.测试集检测结果表明,本方法对癌细胞经典分泌蛋白与非经典分泌蛋白具有较强的区分能力,可为寻找到不同种类癌症间通用的生物标志物提供理论参考. 展开更多
关键词 支持向量机 癌症 非经典分泌蛋白 位置特异性得分矩阵 信号肽
下载PDF
Using position specific scoring matrix and auto covariance to predict protein subnuclear localization 被引量:2
5
作者 Rong-Quan Xiao Yan-Zhi Guo +4 位作者 Yu-Hong Zeng Hai-Feng Tan Hai-Feng Tan Xue-Mei Pu Meng-Long Li 《Journal of Biomedical Science and Engineering》 2009年第1期51-56,共6页
The knowledge of subnuclear localization in eukaryotic cells is indispensable for under-standing the biological function of nucleus, genome regulation and drug discovery. In this study, a new feature representation wa... The knowledge of subnuclear localization in eukaryotic cells is indispensable for under-standing the biological function of nucleus, genome regulation and drug discovery. In this study, a new feature representation was pro-posed by combining position specific scoring matrix (PSSM) and auto covariance (AC). The AC variables describe the neighboring effect between two amino acids, so that they incorpo-rate the sequence-order information;PSSM de-scribes the information of biological evolution of proteins. Based on this new descriptor, a support vector machine (SVM) classifier was built to predict subnuclear localization. To evaluate the power of our predictor, the benchmark dataset that contains 714 proteins localized in nine subnuclear compartments was utilized. The total jackknife cross validation ac-curacy of our method is 76.5%, that is higher than those of the Nuc-PLoc (67.4%), the OET- KNN (55.6%), AAC based SVM (48.9%) and ProtLoc (36.6%). The prediction software used in this article and the details of the SVM parameters are freely available at http://chemlab.scu.edu.cn/ predict_SubNL/index.htm and the dataset used in our study is from Shen and Chou’s work by downloading at http://chou.med.harvard.edu/ bioinf/Nuc-PLoc/Data.htm. 展开更多
关键词 position specific scoring matrix AUTO COVARIANCE Support VECTOR Machine Protein SUBNUCLEAR Localization Prediction
下载PDF
基于多视角特征融合与随机森林的蛋白质结晶预测 被引量:2
6
作者 李强 郑宇杰 《现代电子技术》 北大核心 2015年第8期50-53,共4页
X射线晶体结构分析是测定蛋白质结构的重要方法之一,国际蛋白质数据库(PDB)中已知晶体结构的蛋白质80%~90%均是使用该方法得到的。然而,并不是所有的蛋白质都能良好结晶,使用晶体结构分析方法对不能结晶的蛋白质进行结构测定将浪费... X射线晶体结构分析是测定蛋白质结构的重要方法之一,国际蛋白质数据库(PDB)中已知晶体结构的蛋白质80%~90%均是使用该方法得到的。然而,并不是所有的蛋白质都能良好结晶,使用晶体结构分析方法对不能结晶的蛋白质进行结构测定将浪费大量的资源。因此,研发准确高效的算法来对蛋白质能否结晶进行预测就具有重要意义。在此提出了一种组合蛋白质物理化学特性、序列信息与进化信息的蛋白质结晶预测方法。该方法从不同视角抽取分别抽取蛋白质的物理化学特征、伪氨基酸组成特征(Pse AAC)和伪位置特异性得分矩阵特征(Pse PSSM),使用随机森林对组合的特征进行蛋白质结晶预测。在标准数据集上的独立测试验证的结果表明,这里所述的蛋白质结晶预测方法具有良好的性能。 展开更多
关键词 蛋白质结晶 伪氨基酸组成 位置特异性得分矩阵 随机森林
下载PDF
基于随机下采样和SVR的蛋白质-ATP绑定位点预测 被引量:2
7
作者 余健浩 孙廷凯 《现代电子技术》 北大核心 2015年第4期19-24,共6页
将蛋白质序列的ATP绑定位点与非绑定位点进行分类是个不平衡的二分类问题,其中绑定位点是样本数目稀少的正类样本,非绑定位点是样本数目众多的负类样本。根据机器学习关于可以将分类问题作为回归问题的特例的观点出发,并根据所研究问题... 将蛋白质序列的ATP绑定位点与非绑定位点进行分类是个不平衡的二分类问题,其中绑定位点是样本数目稀少的正类样本,非绑定位点是样本数目众多的负类样本。根据机器学习关于可以将分类问题作为回归问题的特例的观点出发,并根据所研究问题本身的特点,在此提出一种基于随机下采样和支持向量回归的蛋白质-ATP绑定位点预测方法。首先,使用滑动窗口抽取蛋白质序列中每个残基的特征,得到一批不平衡的两类样本;其次,应用随机下采样策略,消除正负样本存在的显著不平衡;最后,使用支持向量回归建立预测模型,并选取合适的阈值进行蛋白质-ATP绑定位点的预测。在标准数据集上的实验结果以及与几种最新报道的预测方法的对比结果,验证了本文所述方法的有效性。 展开更多
关键词 蛋白质-ATP绑定位点 位置特异性得分矩阵 滑动窗口 支持向量回归模型 随机下采样
下载PDF
序列蛋白质-GDP绑定位点预测 被引量:2
8
作者 石大宏 何雪 《计算机工程与应用》 CSCD 北大核心 2016年第13期55-59,75,共6页
正确地识别蛋白质-二磷酸鸟苷(Guanosine Diphosphate,GDP)绑定位点对于蛋白质功能分析和药物设计有非常重要的意义。蛋白质-GDP绑定位点预测是一个典型的不平衡学习问题。直接应用传统的机器学习方法是不合适的,而且会使预测结果偏向... 正确地识别蛋白质-二磷酸鸟苷(Guanosine Diphosphate,GDP)绑定位点对于蛋白质功能分析和药物设计有非常重要的意义。蛋白质-GDP绑定位点预测是一个典型的不平衡学习问题。直接应用传统的机器学习方法是不合适的,而且会使预测结果偏向大多数类。为了解决这个问题,在基于稀疏表示的位置特异性得分矩阵特征基础上,提出了加权下采样方法来使得样本平衡,采用支持向量机算法来预测。实验结果表明提出的方法能获得更高的预测性能。 展开更多
关键词 蛋白质-GDP绑定预测 位置特异性得分矩阵 稀疏表示 加权下采样 支持向量机
下载PDF
基于SVM的革兰氏阴性菌分泌系统蛋白识别方法 被引量:2
9
作者 余乐正 赵柳青 +2 位作者 陈曼 罗杰斯 柳凤娟 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2016年第2期443-447,共5页
本文提出了一种基于SVM快速识别革兰氏阴性菌分泌系统蛋白的方法.该方法以氨基酸组成和位置特异性得分矩阵为最优特征集,充分考虑了蛋白质的序列信息及进化信息.实验结果表明,本文提出的方法对革兰氏阴性菌分泌系统蛋白具有较好的预测性... 本文提出了一种基于SVM快速识别革兰氏阴性菌分泌系统蛋白的方法.该方法以氨基酸组成和位置特异性得分矩阵为最优特征集,充分考虑了蛋白质的序列信息及进化信息.实验结果表明,本文提出的方法对革兰氏阴性菌分泌系统蛋白具有较好的预测性能,可作为细菌分泌系统研究的有益补充. 展开更多
关键词 革兰氏阴性细菌 分泌系统蛋白 SVM 位置特异性得分矩阵
下载PDF
基于卷积神经网络的大肠杆菌启动子预测 被引量:1
10
作者 彭宝成 张晓炜 +1 位作者 刘暘 樊国梁 《生物化学与生物物理进展》 SCIE CAS CSCD 北大核心 2022年第7期1334-1347,共14页
目的基于位点特异性打分矩阵(position-specific scoring matrices,PSSM)的预测模型已经取得了良好的效果,基于PSSM的各种优化方法也在不断发展,但准确率相对较低,为了进一步提高预测准确率,本文基于卷积神经网络(convolutional neural ... 目的基于位点特异性打分矩阵(position-specific scoring matrices,PSSM)的预测模型已经取得了良好的效果,基于PSSM的各种优化方法也在不断发展,但准确率相对较低,为了进一步提高预测准确率,本文基于卷积神经网络(convolutional neural networks,CNN)算法做了进一步研究。方法采用PSSM将启动子序列处理成数值矩阵,通过CNN算法进行分类。大肠杆菌K-12(Escherichia coli K-12,E.coli K-12,下文简称大肠杆菌)的Sigma38、Sigma54和Sigma703种启动子序列被作为正集,编码(Coding)区和非编码(Non-coding)区的序列为负集。结果在预测大肠杆菌启动子的二分类中,准确率达到99%,启动子预测的成功率接近100%;在对Sigma38、Sigma54、Sigma703种启动子的三分类中,预测准确率为98%,并且针对每一种序列的预测准确率均可以达到98%以上。最后,本文以Sigma38、Sigma54、Sigma703种启动子分别和Coding区或者Non-coding区序列做四分类,预测得到的准确性为0.98,对3种Sigma启动子均衡样本的十交叉检验预测精度均可以达到0.95以上,海明距离为0.016,Kappa系数为0.97。结论相较于支持向量机(support vector machine,SVM)等其他分类算法,CNN分类算法更具优势,并且基于CNN的分类优势,编码方式亦可以得到简化。 展开更多
关键词 大肠杆菌 位点特异性打分矩阵 卷积神经网络 多分类
下载PDF
Using the improved position specific scoring matrix and ensemble learning method to predict drug-binding residues from protein sequences
11
作者 Juan Li Yongqing Zhang +5 位作者 Wenli Qin Yanzhi Guo Lezheng Yu Xuemei Pu Menglong Li Jing Sun 《Natural Science》 2012年第5期304-312,共9页
Identification of the drug-binding residues on the surface of proteins is a vital step in drug discovery and it is important for understanding protein function. Most previous researches are based on the structural inf... Identification of the drug-binding residues on the surface of proteins is a vital step in drug discovery and it is important for understanding protein function. Most previous researches are based on the structural information of proteins, but the structures of most proteins are not available. So in this article, a sequence-based method was proposed by combining the support vector machine (SVM)-based ensemble learning and the improved position specific scoring matrix (PSSM). In order to take the local environment information of a drug-binding site into account, an improved PSSM profile scaled by the sliding window and smoothing window was used to improve the prediction result. In addition, a new SVM-based ensemble learning method was developed to deal with the imbalanced data classification problem that commonly exists in the binding site predictions. When performed on the dataset of 985 drug-binding residues, the method achieved a very promising prediction result with the area under the curve (AUC) of 0.9264. Furthermore, an independent dataset of 349 drug- binding residues was used to evaluate the pre- diction model and the prediction accuracy is 84.68%. These results suggest that our method is effective for predicting the drug-binding sites in proteins. The code and all datasets used in this article are freely available at http://cic.scu.edu.cn/bioinformatics/Ensem_DBS.zip. 展开更多
关键词 DRUG-BINDING SITE Prediction position specific scoring matrix ENSEMBLE Learning Support Vector Machine
下载PDF
基于序列与结构特征结合的蛋白质与DNA绑定位点预测 被引量:1
12
作者 杨骥 《计算机与现代化》 2016年第1期20-25,共6页
目前国内外对于DNA-蛋白质绑定位点预测的研究大多集中在仅以蛋白质序列信息或仅以蛋白质结构信息为基础进行计算,而二者结合所实现的预测效果较差。本文提出一种在蛋白质位置特异性得分矩阵序列特征的基础上,结合蛋白质残基的溶剂可及... 目前国内外对于DNA-蛋白质绑定位点预测的研究大多集中在仅以蛋白质序列信息或仅以蛋白质结构信息为基础进行计算,而二者结合所实现的预测效果较差。本文提出一种在蛋白质位置特异性得分矩阵序列特征的基础上,结合蛋白质残基的溶剂可及表面积、相对表面积、深度和突出指数这几个结合效果良好的结构特征的DNA与蛋白质绑定位点预测方法,并使用随机下采样方法解决训练集样本不平衡问题,最后使用支持向量机算法进行预测。实验结果表明,本文方法具有较好的预测能力。 展开更多
关键词 位置特异性得分矩阵 可及表面积 相对表面积 深度与突出指数 随机下采样 支持向量机
下载PDF
一种快速准确区分Ⅲ型、Ⅳ型分泌效应蛋白的计算方法 被引量:1
13
作者 柳凤娟 杨庆 +2 位作者 陈倩 余乐正 李益洲 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第4期781-785,共5页
通过Ⅲ型、Ⅳ型、Ⅵ型分泌系统,革兰氏阴性菌可将效应蛋白直接注入宿主体内,并导致宿主感染各种疾病.由于Ⅲ型、Ⅳ型分泌效应蛋白均属非经典分泌蛋白,且它们可能具有相似的序列模体或进化保守性,故两者之间难于区分.基于支持向量机和伪... 通过Ⅲ型、Ⅳ型、Ⅵ型分泌系统,革兰氏阴性菌可将效应蛋白直接注入宿主体内,并导致宿主感染各种疾病.由于Ⅲ型、Ⅳ型分泌效应蛋白均属非经典分泌蛋白,且它们可能具有相似的序列模体或进化保守性,故两者之间难于区分.基于支持向量机和伪位置特异性得分矩阵,本文提出了一种可快速准确识别革兰氏阴性菌Ⅲ型、Ⅳ型效应蛋白的计算方法.测试集实验结果表明,本方法对Ⅲ型、Ⅳ型效应蛋白具有较好的分类效果,可作为辅助工具用于分泌效应蛋白的进一步研究. 展开更多
关键词 革兰氏阴性菌 分泌效应蛋白 支持向量机 位置特异性得分矩阵 留一法
下载PDF
不同类型的革兰氏阴性菌分泌系统蛋白分类研究 被引量:1
14
作者 余乐正 陈曼 +2 位作者 赵柳青 罗杰斯 柳凤娟 《化学研究与应用》 CAS CSCD 北大核心 2015年第7期969-973,共5页
革兰氏阴性菌细胞中至少存在八种分泌系统,而每种分泌系统分别由一系列具有特定结构与功能的蛋白质组成。因此,对不同类型的细菌分泌系统蛋白进行深入研究,不仅有助于理解对应的蛋白质分泌机制,对于疾病的诊断与治疗及新药研发也具有重... 革兰氏阴性菌细胞中至少存在八种分泌系统,而每种分泌系统分别由一系列具有特定结构与功能的蛋白质组成。因此,对不同类型的细菌分泌系统蛋白进行深入研究,不仅有助于理解对应的蛋白质分泌机制,对于疾病的诊断与治疗及新药研发也具有重要意义。以氨基酸组成和位置特异性得分矩阵为替代模型,本文构建了一个基于支持向量机构的多元分类器以快速区分不同类型的革兰氏阴性菌分泌系统蛋白。实验结果表明,本方法对I、II及V型分泌系统蛋白具有较好的预测性能。 展开更多
关键词 革兰氏阴性菌 分泌系统蛋白 支持向量机 位置特异性得分矩阵
下载PDF
以位置特异性得分矩阵和基因本体为特征的蛋白质亚细胞定位预测 被引量:1
15
作者 刘冰静 郭红 《福州大学学报(自然科学版)》 CAS 北大核心 2017年第1期16-24,共9页
提出一种蛋白质亚细胞定位预测方法.该方法以位置特异性得分矩阵和基因本体抽取对应特征,结合支持向量机构建多标签分类模型.充分考虑了蛋白质进化信息对其亚细胞定位的影响,并基于文本分类中涉及到的卡方检验的对数变换思想,构建基因... 提出一种蛋白质亚细胞定位预测方法.该方法以位置特异性得分矩阵和基因本体抽取对应特征,结合支持向量机构建多标签分类模型.充分考虑了蛋白质进化信息对其亚细胞定位的影响,并基于文本分类中涉及到的卡方检验的对数变换思想,构建基因本体注释信息的加权系数对其进行加权处理,从而提高预测的准确率.采用支持向量机作为基分类器构建多标签分类模型,进一步提高预测的准确率.通过在目前该领域两个常用的真实数据集上进行的一系列测试结果表明,该方法能有效提高蛋白质亚细胞定位预测的准确率. 展开更多
关键词 定位预测 蛋白质亚细胞 位置特异性得分矩阵 基因本体 多标签分类
下载PDF
基于聚类的下采样及其在蛋白质-核苷酸绑定位点预测中的应用
16
作者 石大宏 《计算机与数字工程》 2015年第6期972-975,共4页
蛋白质-核苷酸绑定位点预测对于蛋白质功能研究和药物设计有极其重要的作用。单纯依赖生物学实验来获取绑定位点情况的成本大,耗时长。因此,使用模式识别的方法来进行蛋白质-核苷酸预测越来越重要。蛋白质-核苷酸绑定位点预测是一个典... 蛋白质-核苷酸绑定位点预测对于蛋白质功能研究和药物设计有极其重要的作用。单纯依赖生物学实验来获取绑定位点情况的成本大,耗时长。因此,使用模式识别的方法来进行蛋白质-核苷酸预测越来越重要。蛋白质-核苷酸绑定位点预测是一个典型的不平衡学习问题,为了保持样本的平衡性,在稀疏表示方法提取特征的基础上,使用基于聚类的下采样方法进行采样,然后用SVM进行蛋白质-核苷酸绑定位点预测。实验结果说明了方法的可行性和有效性。 展开更多
关键词 位置特异性得分矩阵 稀疏表示 基于聚类的下采样 支持向量机
下载PDF
基于ACC变换和RFE算法的蛋白质亚核定位预测
17
作者 李小苇 刘太岗 +1 位作者 陶珮莹 王春华 《计算机工程与应用》 CSCD 北大核心 2016年第15期83-87,共5页
获取真核细胞中细胞核内蛋白质定位的信息对注解蛋白质功能具有非常重要的意义。针对于利用计算方法预测蛋白质在亚核水平上的定位更具挑战性的问题,提出了基于自互协方差变换与递归特征消除预测蛋白质亚核定位的方法。该方法基于位置... 获取真核细胞中细胞核内蛋白质定位的信息对注解蛋白质功能具有非常重要的意义。针对于利用计算方法预测蛋白质在亚核水平上的定位更具挑战性的问题,提出了基于自互协方差变换与递归特征消除预测蛋白质亚核定位的方法。该方法基于位置特异性得分矩阵利用自互协方差变换构建蛋白质序列的特征向量,采用递归特征消除法进行特征选择,选用支持向量机作为预测工具,并在两个经典数据集SC714和LD504上进行了夹克刀测试。实验结果表明,该方法比大多数已报道的预测方法具有更高的预测准确率。 展开更多
关键词 蛋白质亚核定位 位置特异性得分矩阵 自互协方差变换 递归特征消除
下载PDF
改进CKSAAP结合RFE算法预测蛋白质棕榈酰化位点
18
作者 汤亚东 谢鹭 陈兰明 《计算机工程与应用》 CSCD 北大核心 2019年第5期143-148,共6页
蛋白质棕榈酰化是一种可逆的蛋白质翻译后修饰,在蛋白质稳定性和亚细胞定位等方面发挥重要作用。构建了一种预测蛋白质棕榈酰化位点的新模型(PSSM-CKSAAP-RFE)。采用蕴含进化信息的k-spaced氨基酸对组分方法表征蛋白质序列,通过递归特... 蛋白质棕榈酰化是一种可逆的蛋白质翻译后修饰,在蛋白质稳定性和亚细胞定位等方面发挥重要作用。构建了一种预测蛋白质棕榈酰化位点的新模型(PSSM-CKSAAP-RFE)。采用蕴含进化信息的k-spaced氨基酸对组分方法表征蛋白质序列,通过递归特征消除法进行特征选择;基于上述特征训练支持向量机分类器,并采用夹克刀交叉验证法测试模型性能。研究结果显示,训练集和独立测试集的预测准确率、马修斯相关系数、特异性、敏感性和受试者工作特征曲线下面积分别为98.44%、0.94、98.95%、95.65%和0.990,以及98.41%、0.93、99.39%、92.31%和0.994,优于文献中报道的相关方法,为蛋白质棕榈酰化位点的预测提供了一种新模型。 展开更多
关键词 蛋白质棕榈酰化位点 k-spaced氨基酸对组分 位置特异性得分矩阵 支持向量机 递归特征消除
下载PDF
蛋白质中RNA-结合残基预测的随机森林模型 被引量:10
19
作者 马昕 郭静 孙啸 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2012年第1期50-54,共5页
构建了用于预测蛋白质序列中RNA-结合残基的分类模型.在模型的特征提取方面,除了与功能相关的结构特征和序列正交编码信息以外,还提出了一个新颖的特征PSSM-PP.该特征不仅包含蛋白质序列的进化保守特征,还包含与蛋白质和RNA结合有关的... 构建了用于预测蛋白质序列中RNA-结合残基的分类模型.在模型的特征提取方面,除了与功能相关的结构特征和序列正交编码信息以外,还提出了一个新颖的特征PSSM-PP.该特征不仅包含蛋白质序列的进化保守特征,还包含与蛋白质和RNA结合有关的氨基酸理化特征.在设计模型时,考虑到样本数据量大的问题,选用了快速的随机森林算法.该预测模型总体预测准确率达到87.02%,特异性达到95.62%,敏感性达51.16%,Matthew相关系数为0.533 6.此外,还构建了RNA结合残基的预测平台. 展开更多
关键词 随机森林 位置特异性矩阵 嵌套式交叉验证 RNA-结合残基
下载PDF
蛋白亚细胞定位的预测方法研究 被引量:6
20
作者 王明会 李骜 +1 位作者 谢丹 冯焕清 《北京生物医学工程》 2006年第6期649-653,657,共6页
预测蛋白质的亚细胞定位信息对于了解其功能有重要的意义。选择氨基酸组成、氨基酸对组成、位置特异性打分矩阵三种分类特征以及模糊k近邻、支持向量机两种预测方法,分别进行了测试。对预测结果的分析显示,位置特异性打分矩阵可以提高... 预测蛋白质的亚细胞定位信息对于了解其功能有重要的意义。选择氨基酸组成、氨基酸对组成、位置特异性打分矩阵三种分类特征以及模糊k近邻、支持向量机两种预测方法,分别进行了测试。对预测结果的分析显示,位置特异性打分矩阵可以提高对不同亚细胞器的可区分性;而支持向量机可以更好地利用位置特异性打分矩阵特征进行预测。使用氨基酸组成和位置特异性打分矩阵两种特征,并结合支持向量机,是一种有效的亚细胞定位预测方法。 展开更多
关键词 亚细胞定位 位置特异性打分矩阵 模糊k近邻 支持向量机 生物信息学
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部