期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
蛋白质亚细胞定位的生物信息学研究 被引量:39
1
作者 张松 黄波 +1 位作者 夏学峰 孙之荣 《生物化学与生物物理进展》 SCIE CAS CSCD 北大核心 2007年第6期573-579,共7页
细胞中蛋白质合成后被转运到特定的细胞器中,只有转运到正确的部位才能参与细胞的各种生命活动,如果定位发生偏差,将会对细胞功能甚至生命产生重大影响.蛋白质的亚细胞定位是蛋白质功能研究的重要方面,也是生物信息学中的热点问题,数据... 细胞中蛋白质合成后被转运到特定的细胞器中,只有转运到正确的部位才能参与细胞的各种生命活动,如果定位发生偏差,将会对细胞功能甚至生命产生重大影响.蛋白质的亚细胞定位是蛋白质功能研究的重要方面,也是生物信息学中的热点问题,数据库的构建和亚细胞定位分析及预测加速了蛋白质结构和功能的研究. 展开更多
关键词 亚细胞定位 生物信息学 数据库 预测 蛋白质
下载PDF
蛋白质的亚细胞定位预测研究进展 被引量:11
2
作者 李立奇 万瑛 《免疫学杂志》 CAS CSCD 北大核心 2009年第5期602-604,共3页
蛋白质处于特定的亚细胞位置上才能行使其功能,故研究亚细胞定位对了解蛋白质功能非常重要。随着后基因组时代的来临,蛋白质序列信息增长迅速,而利用实验手段分析蛋白亚细胞定位的不易大规模进行。近年来,通过提取蛋白质的各种特征信息... 蛋白质处于特定的亚细胞位置上才能行使其功能,故研究亚细胞定位对了解蛋白质功能非常重要。随着后基因组时代的来临,蛋白质序列信息增长迅速,而利用实验手段分析蛋白亚细胞定位的不易大规模进行。近年来,通过提取蛋白质的各种特征信息,自动预测蛋白质的亚细胞定位的算法得到了较快的发展,本文拟从蛋白质特征信息的提取、预测算法和预测效果检验等方面,介绍蛋白质亚细胞定位预测领域中研究进展。 展开更多
关键词 蛋白质 亚细胞定位 预测 算法
下载PDF
Predicting Protein Subcellular Localization: Past, Present, and Future 被引量:6
3
作者 Pierre Dnnes Annette Hglund 《Genomics, Proteomics & Bioinformatics》 SCIE CAS CSCD 2004年第4期209-215,共7页
Functional characterization of every single protein is a major challenge of the post-genomic era. The large-scale analysis of a cell's proteins, proteomics, seeks to provide these proteins with reliable annotation... Functional characterization of every single protein is a major challenge of the post-genomic era. The large-scale analysis of a cell's proteins, proteomics, seeks to provide these proteins with reliable annotations regarding their interaction partners and functions in the cellular machinery. An important step on this way is to determine the subcellular localization of each protein. Eukaryotic cells are divided into subcellular compartments, or organelles. Transport across the membrane into the organelles is a highly regulated and complex cellular process. Predicting the subcellular localization by computational means has been an area of vivid activity during recent years. The publicly available prediction methods differ mainly in four aspects: the underlying biological motivation, the computational method used, localization coverage, and reliability, which are of importance to the user. This review provides a short description of the main events in the protein sorting process and an overview of the most commonly used methods in this field. 展开更多
关键词 subcellular localization prediction methods
原文传递
PredSL: A Tool for the N-terminal Sequence-based Prediction of Protein Subcellular Localization 被引量:5
4
作者 Evangelia I. Petsalaki Pantelis G. Bagos +1 位作者 Zoi I. Litou Stavros J. Hamodrakas 《Genomics, Proteomics & Bioinformatics》 SCIE CAS CSCD 2006年第1期48-55,共8页
The ability to predict the subcellular localization of a protein from its sequence is of great importance, as it provides information about the protein's function. We present a computational tool, PredSL, which utili... The ability to predict the subcellular localization of a protein from its sequence is of great importance, as it provides information about the protein's function. We present a computational tool, PredSL, which utilizes neural networks, Markov chains, profile hidden Markov models, and scoring matrices for the prediction of the subcellular localization of proteins in eukaryotic cells from the N-terminal amino acid sequence. It aims to classify proteins into five groups: chloroplast, thylakoid, mitochondrion, secretory pathway, and "other". When tested in a fivefold cross-validation procedure, PredSL demonstrates 86.7% and 87.1% overall accuracy for the plant and non-plant datasets, respectively. Compared with TargetP, which is the most widely used method to date, and LumenP, the results of PredSL are comparable in most cases. When tested on the experimentally verified proteins of the Saccharomyces cerevisiae genome, PredSL performs comparably if not better than any available algorithm for the same task. Furthermore, PredSL is the only method capable for the prediction of these subcellular localizations that is available as a stand-alone application through the URL: http://bioinformatics.biol.uoa.gr/PredSL/. 展开更多
关键词 subcellular localization prediction target peptide transit peptide signal peptide
原文传递
词袋模型在蛋白质亚细胞定位预测中的应用 被引量:5
5
作者 赵南 张梁 +2 位作者 薛卫 王雄飞 任守纲 《食品与生物技术学报》 CAS CSCD 北大核心 2017年第3期296-301,共6页
运用词袋模型结合传统的蛋白质特征提取算法提取蛋白质序列特征,采用K-means算法构建字典,计算获得蛋白质序列的词袋特征,最终将提取的特征值送入SVM多类分类器,对数据集中蛋白质的亚细胞位置进行预测,在一定程度上提高了亚细胞定位预... 运用词袋模型结合传统的蛋白质特征提取算法提取蛋白质序列特征,采用K-means算法构建字典,计算获得蛋白质序列的词袋特征,最终将提取的特征值送入SVM多类分类器,对数据集中蛋白质的亚细胞位置进行预测,在一定程度上提高了亚细胞定位预测的准确率。 展开更多
关键词 词袋模型 K-MEANS 支持向量机 亚细胞定位预测
下载PDF
基于多层次稀疏编码预测蛋白质亚细胞定位 被引量:5
6
作者 陈行健 胡雪娇 薛卫 《生物工程学报》 CAS CSCD 北大核心 2019年第4期687-696,共10页
文中提出了一种简单有效的蛋白质亚细胞区间定位预测方法,为进一步了解蛋白质的功能和性质提供理论基础。运用稀疏编码,结合氨基酸组成信息提取蛋白质序列特征,基于不同字典大小对得到的特征进行多层次池化整合,并送入支持向量机进行分... 文中提出了一种简单有效的蛋白质亚细胞区间定位预测方法,为进一步了解蛋白质的功能和性质提供理论基础。运用稀疏编码,结合氨基酸组成信息提取蛋白质序列特征,基于不同字典大小对得到的特征进行多层次池化整合,并送入支持向量机进行分类。经Jackknife检验,在数据集ZD98、CH317和Gram1253上的预测成功率分别达到95.9%、93.4%和94.7%。实验证明基于多层次稀疏编码的分类预测算法能显著提高蛋白质亚细胞区间定位的预测精度。 展开更多
关键词 稀疏编码 氨基酸组成 多层次池化 支持向量机 亚细胞区间定位
原文传递
SGCL-LncLoc:An Interpretable Deep Learning Model for Improving IncRNA Subcellular Localization Prediction with Supervised Graph Contrastive Learning
7
作者 Min Li Baoying Zhao +4 位作者 Yiming Li Pingjian Ding Rui Yin Shichao Kan Min Zeng 《Big Data Mining and Analytics》 EI CSCD 2024年第3期765-780,共16页
Understanding the subcellular localization of long non-coding RNAs(IncRNAs)is crucial for unraveling their functional mechanisms.While previous computational methods have made progress in predicting IncRNA subcellular... Understanding the subcellular localization of long non-coding RNAs(IncRNAs)is crucial for unraveling their functional mechanisms.While previous computational methods have made progress in predicting IncRNA subcellular localization,most of them ignore the sequence order information by relying on k-mer frequency features to encode IncRNA sequences.In the study,we develope SGCL-LncLoc,a novel interpretable deep learning model based on supervised graph contrastive learning.SGCL-LncLoc transforms IncRNA sequences into de Bruijn graphs and uses the Word2Vec technique to learn the node representation of the graph.Then,SGCL-LncLoc applies graph convolutional networks to learn the comprehensive graph representation.Additionally,we propose a computational method to map the attention weights of the graph nodes to the weights of nucleotides in the IncRNA sequence,allowing SGCL-LncLoc to serve as an interpretable deep learning model.Furthermore,SGCL-LncLoc employs a supervised contrastive learning strategy,which leverages the relationships between different samples and label information,guiding the model to enhance representation learning for IncRNAs.Extensive experimental results demonstrate that SGCL-LncLoc outperforms both deep learning baseline models and existing predictors,showing its capability for accurate IncRNA subcellular localization prediction.Furthermore,we conduct a motif analysis,revealing that SGCL-LncLoc successfully captures known motifs associated with IncRNA subcellular localization.The SGCL-LncLoc web server is available at http://csuligroup.com:8000/SGCL-LncLoc.The source code can be obtained from https://github.com/CSUBioGroup/SGCL-LncLoc. 展开更多
关键词 supervised contrastive learning long non-coding RNA(IncRNA) subcellular localization prediction deep learning Graph Convolutional Network(GCN)
原文传递
葡萄基因组无内含子基因生物信息学及其表达分析 被引量:3
8
作者 李傲 崔梦杰 +4 位作者 刘众杰 陈立德 贾海峰 上官凌飞 房经贵 《南京农业大学学报》 CAS CSCD 北大核心 2018年第4期655-661,共7页
[目的]本文旨在研究葡萄(Vitis vinifera)无内含子基因的结构特征、功能以及表达特点。[方法]对葡萄19条染色体上4 906个(占整个基因组的13.8%)无内含子基因情况进行分析,并研究了无内含子基因的亚细胞结构、GO功能类型以及基因在不同... [目的]本文旨在研究葡萄(Vitis vinifera)无内含子基因的结构特征、功能以及表达特点。[方法]对葡萄19条染色体上4 906个(占整个基因组的13.8%)无内含子基因情况进行分析,并研究了无内含子基因的亚细胞结构、GO功能类型以及基因在不同组织的表达情况。[结果]葡萄无内含子基因数与每条染色体长度和染色体的基因总数存在正相关关系,每条染色体上无内含子基因占染色体上基因总数的1.2%~1.5%,同时无内含子基因在同一条染色体上的分布是不均匀的,更偏向富集于染色体的两端。葡萄无内含子基因的平均长度为997 bp,比总基因的平均长度短,是总基因长度的1/5。葡萄无内含子基因的亚细胞定位表明,基因产物分布在叶绿体上的数最多,线粒体上几乎没有。基因功能预测结果表明,葡萄无内含子基因主要为生长因子、转录调控、电压门控离子通道以及结构蛋白4种,其中更多参与生长调节。葡萄无内含子基因在不同组织中的表达水平低于有内含子的基因。[结论]葡萄无内含子基因与有内含子基因相比长度较短,表达水平较低。 展开更多
关键词 葡萄 无内含子基因 生物信息学 亚细胞定位预测 功能预测 基因表达
下载PDF
胃蛋白酶Pepsin A性质与结构分析 被引量:2
9
作者 董铭洋 《当代化工研究》 2018年第10期177-179,共3页
胃蛋白酶是一种肽链内切酶,它将蛋白质分解成较小的肽(即蛋白酶)。在胃中产生,是人类和许多其他动物消化系统中的主要消化酶之一,在那里它有助于消化食物中的蛋白质。由胃壁中的主要细胞释放的胃蛋白酶原,与胃液的盐酸混合后,胃蛋白酶... 胃蛋白酶是一种肽链内切酶,它将蛋白质分解成较小的肽(即蛋白酶)。在胃中产生,是人类和许多其他动物消化系统中的主要消化酶之一,在那里它有助于消化食物中的蛋白质。由胃壁中的主要细胞释放的胃蛋白酶原,与胃液的盐酸混合后,胃蛋白酶原激活成为胃蛋白酶。本文对胃蛋白酶的基本特性进行了初步分析,通过分析胃蛋白酶氨基酸组成、疏水性表明胃蛋白酶具有酸性蛋白、胶原蛋白、黏蛋白等特征,整体呈现疏水性。利用MEGA软件进行胃蛋白酶系统发育分析,结果表明人与日本猕猴亲缘关系高度相近,而牛和日本猕猴两者的亲缘关系较远。使用PSORTII分析工具对胃蛋白酶亚细胞定位进行预测,结果表明胃蛋白酶主要分布于细胞外。最后,采用同源建模法构建了胃蛋白酶的三级结构,并对建模质量进行了评估,结果表明三级结构预测总体准确。 展开更多
关键词 PepsinA 系统发育分析 亚细胞定位预测 三级结构预测
下载PDF
基于茶蛋白质组学数据分析植物亚细胞定位预测软件的应用 被引量:2
10
作者 刘艳丽 周媛 +3 位作者 曹丹 马林龙 龚自明 金孝芳 《植物科学学报》 CAS CSCD 北大核心 2020年第5期671-677,共7页
以500个茶(Camellia sinensis(L.)O.Ktze.)叶片的蛋白质作为数据集,比较TargetP、WoLF PSORT、LocTree和Plant-mPLoc 4种软件预测亚细胞定位的可信度和灵敏度。结果显示,4种软件预测可信度均高于80%,依次排序为TargetP>LocTree>Wo... 以500个茶(Camellia sinensis(L.)O.Ktze.)叶片的蛋白质作为数据集,比较TargetP、WoLF PSORT、LocTree和Plant-mPLoc 4种软件预测亚细胞定位的可信度和灵敏度。结果显示,4种软件预测可信度均高于80%,依次排序为TargetP>LocTree>WoLF PSORT>Plant-mPLoc。其中,LocTree对细胞质蛋白和分泌蛋白检测灵敏度最高,但对叶绿体蛋白灵敏度最低;Plant-mPLoc检测核蛋白最灵敏,但对细胞质蛋白最不敏感;TargetP检测叶绿体蛋白最灵敏,但仅能区分3个亚细胞器官;WoLF PSORT对分泌蛋白检测灵敏度最低,但对其他蛋白均较灵敏。基于上述结果,该研究针对4种软件提出了合理的使用建议。 展开更多
关键词 蛋白质 亚细胞定位 预测
下载PDF
PSO_BFA优化词袋模型及蛋白质亚细胞定位预测 被引量:2
11
作者 胡雪娇 陈行健 +1 位作者 赵南 薛卫 《计算机工程与应用》 CSCD 北大核心 2020年第1期165-171,共7页
提出了一种基于PSO_BFA优化的词袋模型。传统词袋模型有两个重要参数:窗口大小d和字典大小k。结合粒子群算法和细菌觅食算法产生新的PSO_BFA混合优化算法,在PSO进行局部搜索时,加入BFA的复制和迁移行为,得到PSO_BFA的最优解即为窗口大... 提出了一种基于PSO_BFA优化的词袋模型。传统词袋模型有两个重要参数:窗口大小d和字典大小k。结合粒子群算法和细菌觅食算法产生新的PSO_BFA混合优化算法,在PSO进行局部搜索时,加入BFA的复制和迁移行为,得到PSO_BFA的最优解即为窗口大小和字典大小的最佳组合。将优化词袋模型与蛋白质序列的氨基酸组成算法和伪氨基酸组成算法结合,获得蛋白质序列的词袋特征。实验结果证明,基于PSO_BFA优化的词袋模型能有效提高蛋白质亚细胞定位预测的精度。 展开更多
关键词 词袋模型 粒子群算法 细菌觅食 亚细胞定位预测
下载PDF
细胞核蛋白质磷酸化位点的预测方法研究 被引量:2
12
作者 余中洲 高强 +2 位作者 阴玉涵 张长青 王进 《金陵科技学院学报》 2020年第2期47-51,共5页
以包含细胞核蛋白质磷酸化位点的肽段为对象,将文本向量化方法与机器分类算法相组合,开展了蛋白质磷酸化位点特征筛选和组合模型评价。结果表明:磷酸化位点下游第一个氨基酸及磷酸化位点氨基酸种类是两个重要特征。独热编码与支持向量... 以包含细胞核蛋白质磷酸化位点的肽段为对象,将文本向量化方法与机器分类算法相组合,开展了蛋白质磷酸化位点特征筛选和组合模型评价。结果表明:磷酸化位点下游第一个氨基酸及磷酸化位点氨基酸种类是两个重要特征。独热编码与支持向量机的组合模型综合效果最好,它在训练集上的准确率达91.6%,精准度达94.0%,召回率达89.2%。测试集上的结果表明:该模型也显示出了良好的泛化能力。本模型为亚细胞层面磷酸化调控的精细分析提供了有效方法。 展开更多
关键词 磷酸化位点 亚细胞定位 细胞核 激酶家族 预测模型
下载PDF
乳腺癌致病基因BRCA1的生物信息学分析 被引量:1
13
作者 辛艾玲 《当代化工研究》 2019年第1期186-188,共3页
BRCA1作为乳腺癌关键蛋白参与了乳腺癌和卵巢癌的发生,本文对BRCA1基本特性进行了初步的分析,通过分析其整体的亲疏水性,氨基酸组成,表明BRCA1倾向是核蛋白,整体呈亲水性。使用PSORT2分析工具对BRCA1亚细胞定位进行预测,表明BRCA1蛋白... BRCA1作为乳腺癌关键蛋白参与了乳腺癌和卵巢癌的发生,本文对BRCA1基本特性进行了初步的分析,通过分析其整体的亲疏水性,氨基酸组成,表明BRCA1倾向是核蛋白,整体呈亲水性。使用PSORT2分析工具对BRCA1亚细胞定位进行预测,表明BRCA1蛋白主要分布在细胞核中。利用MEGA软件进行BRCA1系统发育分析,结果表明人BRCA1与猿的BRCA1亲缘关系高度相近。最后,采用同源建模(比较建模)方法构建了BRCA1蛋白的三级结构,从建模质量评估显示预测结果准确。 展开更多
关键词 BRCA1蛋白 三级结构预测 亚细胞定位预测 系统发育分析
下载PDF
葡萄PPR基因家族鉴定与生物信息学分析
14
作者 袁诚 郑焕 +1 位作者 洪奔 陶建敏 《分子植物育种》 CAS 北大核心 2023年第12期3857-3865,共9页
为了研究葡萄PPR(Pentatricopeptide repeats)家族,本研究利用全基因组信息鉴定了葡萄501个PPR家族成员,并对PPR家族成员进行染色体定位,基因功能和进化分析以及组织表达分析。结果表明,葡萄全基因组上501个PPR家族成员中有459个在19条... 为了研究葡萄PPR(Pentatricopeptide repeats)家族,本研究利用全基因组信息鉴定了葡萄501个PPR家族成员,并对PPR家族成员进行染色体定位,基因功能和进化分析以及组织表达分析。结果表明,葡萄全基因组上501个PPR家族成员中有459个在19条染色体上分布,主要分布在1、18号染色体上,其中1号染色体上数目最多为36个;其中118个PPR基因属于P亚家族,383个基因属于PLS亚家族。PPR基因家族中有47.7%的基因属于无内含子基因。亚细胞定位表明大部分PPR基因定位于线粒体。基因功能预测结果表明,葡萄PPR家族主要富集到锌离子结合以及蛋白质结合功能,参与的生物过程主要与细胞壁修饰、细胞成分组织、碳水化合物代谢过程以及氧化还原过程有关。依照系统分化可以把家族成员分成两部分,不同组织的表达水平分析得到的结果显示PPR基因家族基因的表达模式存在差异。 展开更多
关键词 葡萄 PPR基因家族 亚细胞定位 功能预测 基因表达
原文传递
基于机器学习的蛋白质亚细胞定位预测方法 被引量:1
15
作者 李佳楠 李卓 +2 位作者 滕小华 高兴泉 唐友 《安徽农业科学》 CAS 2022年第16期198-204,共7页
蛋白质亚细胞定位预测有助于了解蛋白质性质和功能,理解蛋白质复杂的生理过程和调控机理,对开发新药物等方面有着很大的促进作用。随着人类在蛋白质组学方面研究的不断深入,蛋白质序列数据量呈指数式增长,单纯依靠传统的试验方法已无法... 蛋白质亚细胞定位预测有助于了解蛋白质性质和功能,理解蛋白质复杂的生理过程和调控机理,对开发新药物等方面有着很大的促进作用。随着人类在蛋白质组学方面研究的不断深入,蛋白质序列数据量呈指数式增长,单纯依靠传统的试验方法已无法满足生命科学研究的需要,于是人们将蛋白质亚细胞定位的研究方法转向了机器学习领域,研究机器学习算法变得越来越重要。从蛋白质序列特征的刻画、预测算法、算法评价3个方面阐述现阶段蛋白质亚细胞定位预测的研究进展。最后,总结蛋白质亚细胞定位预测方法方面取得的成果及需要不断完善的3个方面(特征选择、数据处理和改进算法),并提出了未来机器学习在提高预测性能方面的研究重点及重要意义。 展开更多
关键词 蛋白质 亚细胞定位 机器学习 预测算法
下载PDF
Kras基因性质与结构分析
16
作者 陈薄羲 《当代化工研究》 2019年第2期184-186,共3页
Kras蛋白作为肿瘤"开关",参与了大多数肿瘤的突变。本文对Kras基本特性进行了初步地分析,通过分析Kras氨基酸组成、疏水性表明Kras蛋白具有酸性蛋白质、胶原蛋白、核蛋白、能量蛋白、一些RNA结合模体等特征,整体呈现亲水性。... Kras蛋白作为肿瘤"开关",参与了大多数肿瘤的突变。本文对Kras基本特性进行了初步地分析,通过分析Kras氨基酸组成、疏水性表明Kras蛋白具有酸性蛋白质、胶原蛋白、核蛋白、能量蛋白、一些RNA结合模体等特征,整体呈现亲水性。利用MEGA软件进行Kras系统发育分析,结果表明人Kras与大鼠、小鼠的Kras亲缘关系高度相近。使用PSORTII分析工具对Kras亚细胞定位进行预测,表明Kras蛋白主要分布在细胞质中。 展开更多
关键词 KRAS 氨基酸组成分析 系统发育分析 亚细胞定位预测 三级结构预测
下载PDF
SOD1突变蛋白性质与结构分析
17
作者 徐愈强 《当代化工研究》 2019年第1期180-182,共3页
SOD1突变蛋白是最常见的引起肌萎缩性脊髓侧索硬化症(AmyotrophicLateralSclerosis,ALS)的原因之一,本文对SOD1基本特征进行了初步的分析,通过分析其核酸组成与疏水性发现其具有酸性蛋白质以及显著的胶原蛋白的特征,整体呈现亲水性。利... SOD1突变蛋白是最常见的引起肌萎缩性脊髓侧索硬化症(AmyotrophicLateralSclerosis,ALS)的原因之一,本文对SOD1基本特征进行了初步的分析,通过分析其核酸组成与疏水性发现其具有酸性蛋白质以及显著的胶原蛋白的特征,整体呈现亲水性。利用PSORTⅡ工具对SOD1亚细胞定位进行预测,数据表明,其在细胞中的分布均匀,在细胞质、细胞核中都有。使用MEGA我们做了进化树分析,结果表明人SOD1与灵长类动物进化关系最近。在最后,利用比较建模的方法构建了SOD1蛋白的三级结构,从结构来看表明预测结果准确。 展开更多
关键词 SOD1蛋白 亚细胞定位预测 三级结构预测
下载PDF
真核蛋白质的亚细胞位点预测研究进展
18
作者 崔琳 张朝军 +3 位作者 肖卫东 李祥生 李立奇 杨桦 《现代生物医学进展》 CAS 2015年第28期5582-5585,共4页
研究真核蛋白质的亚细胞位点是了解真核蛋白质功能,深入研究蛋白质相关信号通路内在机制的基础。同时,可以为了解疾病发病机制及为新药研发提供帮助。因此,研究真核蛋白质的亚细胞位点意义十分重大。随着基因组测序的完成,真核蛋白质序... 研究真核蛋白质的亚细胞位点是了解真核蛋白质功能,深入研究蛋白质相关信号通路内在机制的基础。同时,可以为了解疾病发病机制及为新药研发提供帮助。因此,研究真核蛋白质的亚细胞位点意义十分重大。随着基因组测序的完成,真核蛋白质序列信息增长迅速,为真核蛋白质亚细胞位点的研究提出了更多的挑战。传统的实验法难以满足蛋白质信息量迅速增长的需求。而采用生物信息学手段处理大规模数据的计算预测方法,可在较短时间内获得大量真核蛋白质亚细胞位点信息,弥补了实验法的不足。因此,运用计算预测法预测真核蛋白质的亚细胞位点成为生物信息学领域的研究热点之一。本文主要从提取真核蛋白质的特征信息、计算预测方法及预测效果的评价三个方面,介绍近年来真核蛋白质亚细胞位点预测的研究进展。 展开更多
关键词 真核蛋白质 亚细胞位点 预测 算法
原文传递
蛋白质亚细胞定位预测研究综述 被引量:5
19
作者 乔善平 闫宝强 《计算机应用研究》 CSCD 北大核心 2014年第2期321-327,共7页
蛋白质亚细胞定位预测对于确定蛋白质功能、揭示分子交互机理、理解复杂生理过程和设计药物靶标等方面都有很大的促进作用。随着后基因组时代中蛋白质序列数据的指数增长,研究基于机器学习的计算性蛋白质亚细胞定位预测方法变得越来越... 蛋白质亚细胞定位预测对于确定蛋白质功能、揭示分子交互机理、理解复杂生理过程和设计药物靶标等方面都有很大的促进作用。随着后基因组时代中蛋白质序列数据的指数增长,研究基于机器学习的计算性蛋白质亚细胞定位预测方法变得越来越重要。为了能够把握该问题的研究状况,从数据集构建、蛋白质特征提取与表示、预测算法设计、算法测试和Web服务的建立等五个方面对蛋白质亚细胞定位预测的研究进行了综述。指出了目前该研究领域需要解决的核心问题及难点问题,分析了当前研究中出现的一些新情况,并对将来的研究方向和研究重点进行了展望。 展开更多
关键词 蛋白质亚细胞定位预测 特征表示 算法设计 算法测试 WEB服务器
下载PDF
基于三层集成多标记学习的蛋白质多亚细胞定位预测 被引量:1
20
作者 乔善平 闫宝强 《计算机应用》 CSCD 北大核心 2016年第8期2150-2156,共7页
针对多标记学习和集成学习在解决蛋白质多亚细胞定位预测问题上应用还不成熟的状况,研究基于集成多标记学习的蛋白质多亚细胞定位预测方法。首先,从多标记学习和集成学习相结合的角度提出了一种三层的集成多标记学习系统框架结构,该框... 针对多标记学习和集成学习在解决蛋白质多亚细胞定位预测问题上应用还不成熟的状况,研究基于集成多标记学习的蛋白质多亚细胞定位预测方法。首先,从多标记学习和集成学习相结合的角度提出了一种三层的集成多标记学习系统框架结构,该框架将学习算法和分类器进行了层次性分类,并把二分类学习、多分类学习、多标记学习和集成学习进行有效整合,形成一个通用型的三层集成多标记学习模型;其次,基于面向对象技术和统一建模语言(UML)对系统模型进行了设计,使系统具备良好的可扩展性,通过扩展手段增强系统的功能和提高系统的性能;最后,使用Java编程技术对模型进行扩展,实现了一个学习系统软件,并成功应用于蛋白质多亚细胞定位预测问题上。通过在革兰氏阳性细菌数据集上进行测试,验证了系统功能的可操作性和较好的预测性能,该系统可以作为解决蛋白质多亚细胞定位预测问题的一个有效工具。 展开更多
关键词 蛋白质多亚细胞定位预测 多标记学习 集成学习 面向对象技术 JAVA
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部