期刊文献+
共找到93篇文章
< 1 2 5 >
每页显示 20 50 100
用离散量预测蛋白质的结构型 被引量:32
1
作者 吕志清 李前忠 《生物物理学报》 CAS CSCD 北大核心 2001年第4期703-712,共10页
基于蛋白质的结构类型决定于它的二级结构序列的概念,用二级结构序列参数Nα,Nβ,Nβαβ,N(βαβ)构成离散源,并计算离散量D(Xα),D(Xβ),D(Xα/β),D(Xα +β),利用离散增量预测蛋白质的结构类型,它是由这个蛋白质的离散量D(Xn)与四... 基于蛋白质的结构类型决定于它的二级结构序列的概念,用二级结构序列参数Nα,Nβ,Nβαβ,N(βαβ)构成离散源,并计算离散量D(Xα),D(Xβ),D(Xα/β),D(Xα +β),利用离散增量预测蛋白质的结构类型,它是由这个蛋白质的离散量D(Xn)与四个标准离散D(Xα),D(Xβ),D(Xα/β),D(Xα +β)之间离散增量的最小值所决定的 .预测结果表明,准确率分别达到84.8%(标准集)和83.8%(检验集)。 展开更多
关键词 结构型 框架结构 二级结构序列 离散量 离散增量 蛋白质
下载PDF
人类polⅡ启动子的识别 被引量:26
2
作者 吕军 罗辽复 《生物化学与生物物理进展》 SCIE CAS CSCD 北大核心 2005年第12期1185-1191,共7页
依据基因启动子区和非启动子区碱基分布的特征,应用基于多样性增量的二次判别分析(IDQD),对人类polⅡ启动子进行识别,识别精度达到90%以上的水平,优于其他已发表的(包括SVM分类器等)识别算法.使用IDQD算法也能对转录起始位点(TSS)进行... 依据基因启动子区和非启动子区碱基分布的特征,应用基于多样性增量的二次判别分析(IDQD),对人类polⅡ启动子进行识别,识别精度达到90%以上的水平,优于其他已发表的(包括SVM分类器等)识别算法.使用IDQD算法也能对转录起始位点(TSS)进行较准确的预测,10-fold交叉检验结果的敏感性和特异性分别为86%和91%.这些结果表明IDQD是一个有效的分类器. 展开更多
关键词 启动子 多样性增量 二次判别函数 转录起始位点
下载PDF
用离散量的方法识别蛋白质的超二级结构 被引量:16
3
作者 胡秀珍 李前忠 《生物物理学报》 CAS CSCD 北大核心 2006年第6期424-428,共5页
用离散量的方法,对2208个分辨率在2.5I以上的高精度的蛋白质结构中四类超二级结构进行了识别。从蛋白质一级序列出发,以氨基酸(20种氨基酸加一个空位)和其紧邻关联共同为参数,当序列模式固定长取8个氨基酸残基时,对“822”序列模式3交... 用离散量的方法,对2208个分辨率在2.5I以上的高精度的蛋白质结构中四类超二级结构进行了识别。从蛋白质一级序列出发,以氨基酸(20种氨基酸加一个空位)和其紧邻关联共同为参数,当序列模式固定长取8个氨基酸残基时,对“822”序列模式3交叉检验的平均预测精度达到78.1%,jack-knife检验的平均预测精度达到76.7%;当序列模式固定长取10个氨基酸残基时,对“1041”序列模式3交叉检验的平均预测精度达到83.1%,jack-knife检验的平均预测精度达到79.8%。 展开更多
关键词 离散量 离散增量 蛋白质超二级结构
下载PDF
蛋白质亚细胞定位的识别 被引量:11
4
作者 李凤敏 李前忠 《生物物理学报》 CAS CSCD 北大核心 2004年第4期297-306,共10页
根据蛋白质的亚细胞定位,将蛋白质分为12类,用离散量的数学理论,以蛋白质中400个氨基酸二联体数目构成离散源,通过计算离散增量预测蛋白质的亚细胞定位,用Self-consistency和Jackknife两种方法测试均获得较高的预测成功率。结果表明:Sel... 根据蛋白质的亚细胞定位,将蛋白质分为12类,用离散量的数学理论,以蛋白质中400个氨基酸二联体数目构成离散源,通过计算离散增量预测蛋白质的亚细胞定位,用Self-consistency和Jackknife两种方法测试均获得较高的预测成功率。结果表明:Self-consistency方法预测成功率为84.5%,Jackknife方法预测成功率为81.1%。 展开更多
关键词 离散量 氨基酸二联体 亚细胞定位 离散增量
下载PDF
随机森林方法预测膜蛋白类型 被引量:14
5
作者 袁敏 胡秀珍 《生物物理学报》 CAS CSCD 北大核心 2009年第5期349-355,共7页
膜蛋白的类型与其功能是密切相关的,因此膜蛋白类型的预测是研究其功能的重要手段,从蛋白质的氨基酸序列出发对膜蛋白的类型进行预测有重要意义。文章基于蛋白质的氨基酸序列,将组合离散增量和伪氨基酸组分信息共同作为预测参数,采用随... 膜蛋白的类型与其功能是密切相关的,因此膜蛋白类型的预测是研究其功能的重要手段,从蛋白质的氨基酸序列出发对膜蛋白的类型进行预测有重要意义。文章基于蛋白质的氨基酸序列,将组合离散增量和伪氨基酸组分信息共同作为预测参数,采用随机森林分类器,对8类膜蛋白进行了预测。在Jackknife检验下的预测精度为86.3%,独立检验的预测精度为93.8%,取得了好于前人的预测结果。 展开更多
关键词 生物膜蛋白 随机森林法 离散增量 离散傅里叶谱 伪氨基酸组分
原文传递
基于二次判别的果蝇启动子识别 被引量:7
6
作者 林昊 李前忠 《生物物理学报》 CAS CSCD 北大核心 2006年第5期345-350,共6页
通过对果蝇polⅡ启动子和非启动子的序列特征分析,计算了序列每个位点单碱基保守性M1(l)值和六联体保守性M6(l)值。从而分别选取两个区域的六联体频数作为离散源参数,利用离散增量结合二次判别函数(IDQD)对启动子进行了预测。对于从编... 通过对果蝇polⅡ启动子和非启动子的序列特征分析,计算了序列每个位点单碱基保守性M1(l)值和六联体保守性M6(l)值。从而分别选取两个区域的六联体频数作为离散源参数,利用离散增量结合二次判别函数(IDQD)对启动子进行了预测。对于从编码区和内含子中选取的非启动子数据集,启动子的预测成功率分别达到93%和89%。比较结果显示IDQD模型能够有效地提高启动子预测成功率。 展开更多
关键词 POL Ⅱ启动子 离散增量 二次判别函数 六联体
下载PDF
用离散量预测原核生物蛋白质的亚细胞位置 被引量:9
7
作者 陈颖丽 李前忠 《内蒙古大学学报(自然科学版)》 CAS CSCD 北大核心 2003年第5期510-517,共8页
基于不同亚细胞位置中蛋白质的氨基酸组成及序列信息不同这一观点,以单个氨基酸含量及两两组合氨基酸含量为信息构成离散源,分别计算了原核生物蛋白质三类亚细胞位置的标准离散量D(Xe),D(Xp),D(Xc).利用离散增量的概念预测蛋白质的亚细... 基于不同亚细胞位置中蛋白质的氨基酸组成及序列信息不同这一观点,以单个氨基酸含量及两两组合氨基酸含量为信息构成离散源,分别计算了原核生物蛋白质三类亚细胞位置的标准离散量D(Xe),D(Xp),D(Xc).利用离散增量的概念预测蛋白质的亚细胞位置,它是由这个蛋白质的离散量D(X)与三个标准离散量D(Xe),D(Xp),D(Xc)之间离散增量的最小值所决定的.采用Self-consistency检验和Jack-knife检验方法,给出了选择五组不同信息作为离散源中参数时的预测结果.与现有的方法比较,发现用Jack-knife检验法预测extracellular类蛋白质时,给出的离散量方法能够给出最好的预测性能,结果也表明提取更多有效的序列信息是提高预测精度的关键. 展开更多
关键词 蛋白质亚细胞位置 原核生物 离散量 离散增量
下载PDF
多样性指标用于基因中剪切位点的识别 被引量:5
8
作者 张利绒 罗辽复 《生物化学与生物物理进展》 SCIE CAS CSCD 北大核心 2004年第1期77-82,共6页
根据基因剪切位点处的碱基保守性特征 ,和附近位点的碱基组成和关联特征 ,应用多样性指标和二次判别分析 ,对几类模式生物的基因结构进行统一的分析和预测 ,能够较好地识别外显子和内含子及其边界 .计算结果表明 ,对于 4类物种 ,线虫 (C... 根据基因剪切位点处的碱基保守性特征 ,和附近位点的碱基组成和关联特征 ,应用多样性指标和二次判别分析 ,对几类模式生物的基因结构进行统一的分析和预测 ,能够较好地识别外显子和内含子及其边界 .计算结果表明 ,对于 4类物种 ,线虫 (C .elegans) ,拟南芥 (A .thaliana ) ,果蝇 (D .melanogaster)和人类 (human) ,核苷酸水平的识别精度为 92 5 %~ 97 1 % ,外显子水平的识别敏感性为 83 7%~ 94 5 % ,特异性为 87 8%~97 1 % . 展开更多
关键词 剪切位点 多样性增量 二次判别法 外显子 内含子 基因
下载PDF
使用多样性增量预测磷酸化位点 被引量:7
9
作者 张颖 罗辽复 吕军 《内蒙古大学学报(自然科学版)》 CAS CSCD 北大核心 2008年第1期34-39,共6页
磷酸化是蛋白质最重要的翻译后修饰之一.应用基于多样性增量的二次判别分析(Increment of Diversity with Quadratic Discriminant analysis,IDQD)方法对CK2,PKA和PKC三种类型磷酸化位点进行预测,k-fold交叉检验的正确率分别为86%,90%和... 磷酸化是蛋白质最重要的翻译后修饰之一.应用基于多样性增量的二次判别分析(Increment of Diversity with Quadratic Discriminant analysis,IDQD)方法对CK2,PKA和PKC三种类型磷酸化位点进行预测,k-fold交叉检验的正确率分别为86%,90%和85%,独立测试集检验的正确率分别为86%,88%和84%.所得结果高于包括支持向量机在内的现有预测方法. 展开更多
关键词 蛋白质磷酸化位点 多样性增量 二次判别分析
下载PDF
用离散量方法预测蛋白质亚细胞定位 被引量:5
10
作者 李凤敏 李前忠 《内蒙古大学学报(自然科学版)》 CAS CSCD 北大核心 2003年第4期416-419,共4页
根据蛋白质的亚细胞定位,将蛋白质分为四类,用离散量的数学理论,提出了预测蛋白质的亚细胞定位理论方法.利用蛋白质中氨基酸组分,通过计算离散增量和离散有限系数预测蛋白质的亚细胞定位.用Self-consistency和Jackknife两种方法测试均... 根据蛋白质的亚细胞定位,将蛋白质分为四类,用离散量的数学理论,提出了预测蛋白质的亚细胞定位理论方法.利用蛋白质中氨基酸组分,通过计算离散增量和离散有限系数预测蛋白质的亚细胞定位.用Self-consistency和Jackknife两种方法测试均获得较高的预测成功率.结果表明:蛋白质类中包含的蛋白质数越多,预测成功率越高. 展开更多
关键词 离散增量 亚细胞定位 离散有限系数
下载PDF
基于离散增量结合支持向量机方法的凋亡蛋白亚细胞位置预测 被引量:8
11
作者 陈颖丽 李前忠 +1 位作者 杨科利 樊国梁 《生物物理学报》 CAS CSCD 北大核心 2007年第3期192-198,共7页
根据凋亡蛋白的亚细胞位置主要决定于它的氨基酸序列这一观点,基于局部氨基酸序列的n肽组分和序列的亲疏水性分布信息,采用离散增量结合支持向量机(ID_SVM)算法,对六类细胞凋亡蛋白的亚细胞位置进行预测。结果表明,在Re-substitution检... 根据凋亡蛋白的亚细胞位置主要决定于它的氨基酸序列这一观点,基于局部氨基酸序列的n肽组分和序列的亲疏水性分布信息,采用离散增量结合支持向量机(ID_SVM)算法,对六类细胞凋亡蛋白的亚细胞位置进行预测。结果表明,在Re-substitution检验和Jackknife检验下,ID_SVM算法的总体预测成功率分别达到了94.6%和84.2%;在5-fold检验和10-fold检验下,其总体预测成功率也都达到了83%以上。通过比较ID和ID_SVM两种方法的预测能力发现,结合了支持向量机的离散增量算法能够改进预测成功率,结果表明ID_SVM是预测凋亡蛋白亚细胞位置的一种很有效的方法。 展开更多
关键词 凋亡蛋白 离散增量 支持向量机
下载PDF
基于氨基酸亲疏水分布的最小离散增量方法识别蛋白质超家族 被引量:5
12
作者 刘芬 李前忠 《内蒙古大学学报(自然科学版)》 CAS CSCD 北大核心 2006年第4期416-423,共8页
摆脱目前常用的基于特征模体来识别超家族的方法,引入单个氨基酸的物理化学性质(亲疏水性质)及其在氨基酸序列中的分布特征参数(分段的方法),利用最小离散增量算法对属于同一结构类的不同超家族进行了识别,总预测成功率令人满意.选取了... 摆脱目前常用的基于特征模体来识别超家族的方法,引入单个氨基酸的物理化学性质(亲疏水性质)及其在氨基酸序列中的分布特征参数(分段的方法),利用最小离散增量算法对属于同一结构类的不同超家族进行了识别,总预测成功率令人满意.选取了全α类、全β类、α+β类、α/β类中的各4个超家族分别进行了识别.对全α类的4个超家族,se lf-cons istency检验和jack-kn ife检验可达83.0%,81.2%;对全β类的4个超家族,两种检验均为80.9%;对α+β类的4个超家族,两种检验总成功率最高分别为88.6%,88.0%;识别α/β类的4个超家族时两种检验的结果分别为69.3%和67.6%. 展开更多
关键词 亲疏水 分段 离散量 最小离散增量
下载PDF
大肠杆菌σ^(70)启动子的识别 被引量:5
13
作者 张颖 贾芸 吕军 《生物物理学报》 CAS CSCD 北大核心 2007年第6期475-481,共7页
应用多样性增量结合二次判别分析(Increment of Diversity with Quadratic Discriminant analysis,IDQD)方法,对大肠杆菌σ70启动子进行识别。使用受试者操作特性(receiver operating characteristic,ROC)曲线和精度召回率曲线(Precisio... 应用多样性增量结合二次判别分析(Increment of Diversity with Quadratic Discriminant analysis,IDQD)方法,对大肠杆菌σ70启动子进行识别。使用受试者操作特性(receiver operating characteristic,ROC)曲线和精度召回率曲线(Precision Recall Curves,PRC)进行性能评估。10-fold交叉检验给出,在正负集之比为1∶1时,ROC曲线下面积和PRC曲线下面积均为95%。结果表明,IDQD算法有能力应用于原核启动子的识别。识别精度高于现有算法。 展开更多
关键词 大肠杆菌 启动子 多样性增量 二次判别分析
下载PDF
低维输入空间的支持向量机识别人类剪接位点 被引量:3
14
作者 刘利 李前忠 樊国梁 《生物物理学报》 CAS CSCD 北大核心 2008年第1期49-56,共8页
真核生物剪接位点的识别作为基因结构注释的重要环节,一直以来倍受关注。利用离散增量和权重矩阵构成的向量来表示序列,用支持向量机在六维向量空间中寻找最优超平面,从而将真实的剪接位点和虚假的剪接位点进行分类。计算结果表明,利用... 真核生物剪接位点的识别作为基因结构注释的重要环节,一直以来倍受关注。利用离散增量和权重矩阵构成的向量来表示序列,用支持向量机在六维向量空间中寻找最优超平面,从而将真实的剪接位点和虚假的剪接位点进行分类。计算结果表明,利用这样的算法预测人类的剪接位点,有较好的预测效果。与其他的一些算法相比,表现出参数少、精度高等优点。 展开更多
关键词 离散增量 权重矩阵 支持向量机 剪接位点
下载PDF
人类基因组盒式外显子和内含子保留的可变剪接位点预测 被引量:6
15
作者 邢永强 张利绒 罗辽复 《生物物理学报》 CAS CSCD 北大核心 2008年第5期393-401,共9页
信使RNA的可变剪接是真核生物有别于原核生物的基本特征之一,信使RNA前体的可变剪接极大地丰富了高等真核生物蛋白质的多样性,并与生物体的组织特异性密切相关。文章对人类盒式外显子和内含子保留的一些基本特征进行了统计;根据剪接位... 信使RNA的可变剪接是真核生物有别于原核生物的基本特征之一,信使RNA前体的可变剪接极大地丰富了高等真核生物蛋白质的多样性,并与生物体的组织特异性密切相关。文章对人类盒式外显子和内含子保留的一些基本特征进行了统计;根据剪接位点附近的单碱基、碱基二联体和三联体的保守性等特征,利用基于多样性指标的二次判别法,对盒式外显子和内含子保留的供体端和受体端可变剪接位点进行了预测。交叉检验结果表明,盒式外显子供体端和受体端的识别精度分别达到93%、84%以上的水平;内含子保留供体端和受体端的识别精度分别达到89%、81%以上的水平。 展开更多
关键词 盒式外显子 内含子保留 多样性指标 剪接位点
下载PDF
改进的离散增量算法预测27类折叠子的结构类型 被引量:6
16
作者 张怀光 胡秀珍 《内蒙古大学学报(自然科学版)》 CAS CSCD 北大核心 2009年第3期285-290,共6页
蛋白质二级结构预测是三级结构预测的一个非常重要的中间步骤,而折叠子识别和结构类型的准确预测则可以提高二级结构和三级结构预测的准确度.本文从蛋白质的一级序列出发,提出了一种改进的预测算法:以二肽组分、预测的二级结构信息、伪... 蛋白质二级结构预测是三级结构预测的一个非常重要的中间步骤,而折叠子识别和结构类型的准确预测则可以提高二级结构和三级结构预测的准确度.本文从蛋白质的一级序列出发,提出了一种改进的预测算法:以二肽组分、预测的二级结构信息、伪氨基酸组分和位置权重矩阵打分值等特征分别作为参数,输入离散增量算法的单分类器中,通过加权融合单分类器的计算结果,对27类折叠子的结构类型进行了预测,取得了较好的预测结果. 展开更多
关键词 离散增量 伪氨基酸组分 位置权重矩阵 蛋白质折叠子 蛋白质结构类型
下载PDF
预测线虫和酵母基因组中内含子、外显子及基因间序列的离散增量方法 被引量:2
17
作者 鲍卫华 李前忠 《内蒙古大学学报(自然科学版)》 CAS CSCD 北大核心 2004年第1期60-65,共6页
把基因组中的内含子、外显子和基因间序列分为三类序列,从这些序列中取64种三核苷的重复出现次数作为离散源的状态参数,计算三类序列的标准离散量,比较待测序列的离散量与三个标准离散量之间的离散增量值,由离散增量的最小值决定待测序... 把基因组中的内含子、外显子和基因间序列分为三类序列,从这些序列中取64种三核苷的重复出现次数作为离散源的状态参数,计算三类序列的标准离散量,比较待测序列的离散量与三个标准离散量之间的离散增量值,由离散增量的最小值决定待测序列属于哪一类.本文用离散增量方法对线虫和酵母序列进行预测,结果表明,对酵母内含子预测的敏感性为81.5%,对外显子预测的敏感性为88.5%、特异性为99.6%,对基因间序列预测的敏感性为65.4%、特异性为87.5%;若以在相同长度区间的序列为标准离散源,预测相应长度区间的序列,对线虫内含子的预测的敏感性为82.2%、特异性为94.2%,对外显子预测的敏感性为91.1%、特异性为97.5%,对基因间序列预测的敏感性为78.8%. 展开更多
关键词 序列预测 离散量 离散增量
下载PDF
基于N端信号的蛋白质亚细胞定位识别 被引量:2
18
作者 贾芸 赵巨东 吕军 《内蒙古工业大学学报(自然科学版)》 2008年第2期81-87,共7页
对未知蛋白的功能注释是蛋白质组学的主要目标.一个关键的注释是蛋白质亚细胞定位的预测.应用基于多样性增量的二次判别分析(Increment of Diversity with Quadratic Discriminant analysis,IDQD)方法进行蛋白质亚细胞定位预测,对4个植... 对未知蛋白的功能注释是蛋白质组学的主要目标.一个关键的注释是蛋白质亚细胞定位的预测.应用基于多样性增量的二次判别分析(Increment of Diversity with Quadratic Discriminant analysis,IDQD)方法进行蛋白质亚细胞定位预测,对4个植物定位类型和3个非植物定位类型,5-fold交叉检验的总精度分别为87%和91%,所得结果与已有模型相比,预测结果较好. 展开更多
关键词 亚细胞定位 多样性增量 二次判别分析 氨基酸组分 N端信号
下载PDF
一种预测蛋白质结构型的新方法 被引量:1
19
作者 吕志清 李前忠 《内蒙古大学学报(自然科学版)》 CAS CSCD 北大核心 2002年第1期26-30,共5页
基于蛋白质的结构类型决定于它的二级结构序列的概念 ,将蛋白质的二级结构含量和二级结构序列参数 Nα,Nβ,Nβαβ结合起来构成离散源 ,分别计算四种结构类型的标准离散量 D( Xα) ,D( Xβ) ,D( Xα/β) ,D( Xα+β) ,利用离散增量的概... 基于蛋白质的结构类型决定于它的二级结构序列的概念 ,将蛋白质的二级结构含量和二级结构序列参数 Nα,Nβ,Nβαβ结合起来构成离散源 ,分别计算四种结构类型的标准离散量 D( Xα) ,D( Xβ) ,D( Xα/β) ,D( Xα+β) ,利用离散增量的概念 ,蛋白质的结构类型是由这个蛋白质的离散量 D( X)与四个标准离散量之间离散增量的最小值所决定的 .因此 ,对标准集中 35 9个蛋白的结构型进行检测并对检验集中 1 1 7个蛋白质进行结构预测 ,标准集的准确率为 87% ,检验集的预测准确率为 88% 展开更多
关键词 结构型 框架结构 二级结构序列 离散量 离散增量 蛋白质 结构预测 折叠模式
下载PDF
用离散增量结合支持向量机方法预测蛋白质亚细胞定位 被引量:4
20
作者 赵禹 赵巨东 姚龙 《生物信息学》 2010年第3期237-239,244,共4页
对未知蛋白的功能注释是蛋白质组学的主要目标。一个关键的注释是蛋白质亚细胞定位的预测。本文应用离散增量结合支持向量机(ID_SVM)的方法,对阳性革兰氏细菌蛋白的5类亚细胞定位点进行预测。在独立检验下,其总体预测成功率为89.66%。... 对未知蛋白的功能注释是蛋白质组学的主要目标。一个关键的注释是蛋白质亚细胞定位的预测。本文应用离散增量结合支持向量机(ID_SVM)的方法,对阳性革兰氏细菌蛋白的5类亚细胞定位点进行预测。在独立检验下,其总体预测成功率为89.66%。结果发现ID_SVM算法对预测的成功率有很大改进。 展开更多
关键词 蛋白质亚细胞定位 离散增量 支持向量机 阳性革兰氏细菌
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部