-
题名基于近似熵的伪氨基酸组成预测蛋白质亚核定位
- 1
-
-
作者
张同亮
丁永生
顾全
孙登宽
-
机构
东华大学信息科学与技术学院
-
出处
《生物物理学报》
CAS
CSCD
北大核心
2008年第3期239-244,共6页
-
基金
国家自然科学基金重点项目(60534020)
国家自然科学基金(60775052)
+1 种基金
上海市国际科技合作基金项目(061307041)
教育部高等学校博士点专项基金(20060255006)~~
-
文摘
了解真核细胞中细胞核内蛋白质的定位情况对于新发现蛋白质的功能注释具有重要意义。随着蛋白质数据库中蛋白质序列数量的急速增加,采用计算方法来预测蛋白质亚核定位已经成为蛋白质科学领域研究的热点。根据Chou提出的伪氨基酸组成离散模型,提出了一种新的蛋白质亚核定位预测方法。计算蛋白质序列的近似熵作为附加特征构建伪氨基酸组成,表示蛋白质序列特征,AdaBoost分类算法作为预测工具。与已报道的亚核定位预测方法的性能相比,这种方法具有更高的准确率。
-
关键词
蛋白质亚核定位
伪氨基酸组成
近似熵
ADABOOST分类器
-
Keywords
Protein subnuclear locations
Pseudo amino acid composition
AdaBoost classifier
Approximate entropy
-
分类号
Q61
[生物学—生物物理学]
-
-
题名基于ACC变换和RFE算法的蛋白质亚核定位预测
- 2
-
-
作者
李小苇
刘太岗
陶珮莹
王春华
-
机构
上海海洋大学食品学院
上海海洋大学信息学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2016年第15期83-87,共5页
-
基金
上海市教育委员会科研创新项目(No.13YZ098)
上海高校青年教师培养资助计划(No.ZZhy12028)
上海海洋大学博士科研启动基金
-
文摘
获取真核细胞中细胞核内蛋白质定位的信息对注解蛋白质功能具有非常重要的意义。针对于利用计算方法预测蛋白质在亚核水平上的定位更具挑战性的问题,提出了基于自互协方差变换与递归特征消除预测蛋白质亚核定位的方法。该方法基于位置特异性得分矩阵利用自互协方差变换构建蛋白质序列的特征向量,采用递归特征消除法进行特征选择,选用支持向量机作为预测工具,并在两个经典数据集SC714和LD504上进行了夹克刀测试。实验结果表明,该方法比大多数已报道的预测方法具有更高的预测准确率。
-
关键词
蛋白质亚核定位
位置特异性得分矩阵
自互协方差变换
递归特征消除
-
Keywords
protein subnuclear location
position specific scoring matrix
auto cross covariance transformation
recursive
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
Q51
[自动化与计算机技术—控制科学与工程]
-
-
题名利用进化模糊K近邻及其集成预测蛋白质亚核定位
- 3
-
-
作者
刘立元
陈月辉
马炳先
曹毅
-
机构
济南大学信息科学与工程学院
-
出处
《济南大学学报(自然科学版)》
CAS
北大核心
2010年第4期376-379,共4页
-
基金
国家自然科学基金(60903099)
山东省高等学校科技计划(J09LG14)
-
文摘
针对从蛋白质原始序列中预测蛋白质定位及功能信息这个生物信息学中研究的热点问题,提出进化模糊K近邻算法(Evolutionary Fuzzy K-Nearest Neighbor,EFKNN)直接处理多分类问题的预测模型,用EFKNN及其集成直接从蛋白质序列中预测蛋白质亚核定位。采用5种特征提取算法从蛋白质序列中提取特征,训练了5个基于EFKNN的基分类器,并根据得票量大小原则集成每个基分类器的分类结果作为待测样本的输出。将蛋白质亚核定位预测中常用的数据集SNL9作为训练集,利用jackknife测试方法预测了数据集中每条单定位亚核蛋白,正确率为70.0%,表明该模型可以作为蛋白质亚核定位预测的工具或对现有预测模型和方法的补充。
-
关键词
蛋白质亚核定位
集成学习
进化模糊K近邻
粒子群优化算法
Jackknife验证
-
Keywords
protein subnuclear location
ensemble learning
EFKNN
particle swarm optimization
jackknife test
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-