期刊文献+
共找到162篇文章
< 1 2 9 >
每页显示 20 50 100
UniProt蛋白质数据库简介 被引量:42
1
作者 罗静初 《生物信息学》 2019年第3期131-144,共14页
UniProt(https://www.uniprot.org/)是国际知名蛋白质数据库,主要包括UniProtKB知识库、UniParc归档库和UniRef参考序列集三部分。UniProtKB知识库是UniProt的核心,除蛋白质序列数据外,还包括大量注释信息。UniProtKB知识库分Swiss-Prot... UniProt(https://www.uniprot.org/)是国际知名蛋白质数据库,主要包括UniProtKB知识库、UniParc归档库和UniRef参考序列集三部分。UniProtKB知识库是UniProt的核心,除蛋白质序列数据外,还包括大量注释信息。UniProtKB知识库分Swiss-Prot和TrEMBL两个子库。Swiss-Prot子库中50多万条序列均由人工审阅和注释,而TrEMBL子库中1.4亿多条序列是由核酸序列数据库EMBL中的蛋白质编码序列翻译所得,并由计算机根据一定规则进行注释。UniParc归档库将存放于不同数据库中的同一个蛋白质归并到一个记录中以避免冗余,并赋予序列唯一性特定标识符。UniRef参考序列集按相似性程度将UniProtKB和UniParc中的序列分为UniRef100、UniRef90和UniRef50三个数据集。UniProt网站为用户提供了高效实用的高级检索系统和大量帮助文档。UniProt数据库每4周发布新版的同时也发布统计报表,用户可通过统计报表了解该数据库的数据量及更新情况、数据类别和物种分布等基本信息,查看常规注释信息、序列特征注释信息和数据库交叉链接等统计数据。UniProt是目前国际上序列数据最完整、注释信息最丰富的非冗余蛋白质序列数据库,自本世纪初创建以来,为生命科学领域提供了宝贵资源。 展开更多
关键词 数据库 蛋白质序列 蛋白质功能 数据库注释 数据库交叉链接 数据库高级检索
下载PDF
我国南方捕鸟蛛一新种的生物化学鉴定(蜘蛛目,捕鸟蛛科) 被引量:16
2
作者 梁宋平 彭贤锦 +1 位作者 黄仁槐 陈平 《生命科学研究》 CAS CSCD 1999年第4期299-304,共6页
采用高效液相色谱(HPLC)、激光解析基质辅助电离飞行时间质谱(MAIDI-TOFMS)和蛋白质序列分析方法,对从我国海南通什地区发现的一种捕鸟蛛与广西虎纹捕鸟蛛(Selenocosm iahuw ena)的毒液进行了... 采用高效液相色谱(HPLC)、激光解析基质辅助电离飞行时间质谱(MAIDI-TOFMS)和蛋白质序列分析方法,对从我国海南通什地区发现的一种捕鸟蛛与广西虎纹捕鸟蛛(Selenocosm iahuw ena)的毒液进行了比较分析. 虽然两种蜘蛛形态十分相似,但其毒液的化学组成和主要毒素的氨基酸序列存在明显的差异,说明两种蜘蛛在进化上有同源性但分化很早.应列为不同种,特将海南发现的蜘蛛新种定名为海南捕鸟蛛,新种Selenocosm ia hainana sp.nov. 展开更多
关键词 蜘蛛毒素 海南捕鸟蛛 新种 蛋白质 序列
下载PDF
一种有效的蛋白质序列聚类分析方法 被引量:15
3
作者 唐东明 朱清新 +1 位作者 杨凡 陈科 《软件学报》 EI CSCD 北大核心 2011年第8期1827-1837,共11页
提出了一种有效的基于仿射传播聚类算法和后处理方法的蛋白质序列聚类方法.在聚类分析蛋白质序列时,为了优化仿射传播聚类算法的聚类结果,采用后处理的方式来提高聚类结果的质量.为了度量蛋白质序列之间的相似度,给出了一种改进的无比... 提出了一种有效的基于仿射传播聚类算法和后处理方法的蛋白质序列聚类方法.在聚类分析蛋白质序列时,为了优化仿射传播聚类算法的聚类结果,采用后处理的方式来提高聚类结果的质量.为了度量蛋白质序列之间的相似度,给出了一种改进的无比对计算方法.在6个蛋白质序列数据集上进行对比实验,实验结果表明,所给出的方法能够有效地分析蛋白质序列. 展开更多
关键词 模式识别 聚类分析 序列分析 蛋白质序列
下载PDF
活性肽搜寻与蛋白模拟水解数据库的建立 被引量:7
4
作者 陈征松 施用晖 +1 位作者 乐国伟 王芳 《计算机与应用化学》 CAS CSCD 北大核心 2007年第3期331-334,共4页
利用Microsoft Office XP中的Access XP数据库软件建立3个数据库系统,蛋白质数据库包含小麦面筋、大米、玉米等常见食物蛋白质序列23739条,活性肽数据库包含ACE抑制肽、免疫肽、阿片肽等生物活性肽序列1396条,以及常见的蛋白质水解酶信... 利用Microsoft Office XP中的Access XP数据库软件建立3个数据库系统,蛋白质数据库包含小麦面筋、大米、玉米等常见食物蛋白质序列23739条,活性肽数据库包含ACE抑制肽、免疫肽、阿片肽等生物活性肽序列1396条,以及常见的蛋白质水解酶信息。数据库与编制的“生物活性肽搜寻与酶解模拟系统”程序配合,实现单条、多条活性肽序列在蛋白质中批量搜寻,并找出活性肽含量的链长百分比,活性肽在蛋白质中的位置和前后氨基酸的种类,实现肽的活性不完全归纳预测活性,实现蛋白质用单酶或者复酶的模拟水解并标出水解产物中活性肽及其功能。 展开更多
关键词 数据库 生物活性肽 食物蛋白质 蛋白质序列 活性肽序列 蛋白酶
原文传递
不同结构类蛋白质序列中的关联特性 被引量:7
5
作者 黄敏 沈晖 肖奕 《生物物理学报》 CAS CSCD 北大核心 2000年第4期755-759,共5页
采用功率谱的方法对不同结构类蛋白质序列进行了研究。结论为 :从统计平均的角度看 ,蛋白质序列并不是一种毫无规律的随机序列 ,它们存在着明显的关联 ,而且不同结构类蛋白质序列具有与它们的结构类相对应的不同的关联特性。
关键词 蛋白质序列 结构类 功率谱 疏水值 关联特性
下载PDF
基于深度神经网络的蛋白质相互作用预测框架 被引量:6
6
作者 刘桂霞 王沫沅 +3 位作者 苏令涛 吴春国 孙立岩 王荣全 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2019年第2期570-577,共8页
为解决实验方法中结果存在较高假阳性率和假阴性率的问题,整合蛋白质特征数据,提出一种基于深度神经网络的蛋白质相互作用预测框架。提取蛋白质的GO语义相似性、序列相似性、蛋白质重要性以及亚细胞定位信息,得到低维度的输入数据。然... 为解决实验方法中结果存在较高假阳性率和假阴性率的问题,整合蛋白质特征数据,提出一种基于深度神经网络的蛋白质相互作用预测框架。提取蛋白质的GO语义相似性、序列相似性、蛋白质重要性以及亚细胞定位信息,得到低维度的输入数据。然后建立深度神经网络,进行预测。通过使用弃权技术,减少网络中复杂的互适应神经元,总体性能得到提高。预测框架在酿酒酵母蛋白质数据集上的准确率达到95.67%,精确度达到96.38%。实验结果表明:提取的特征数据较适合用于蛋白质互作的预测研究,且构建的基于深度神经网络的蛋白质相互作用预测框架具有出色的泛化性能,在多种数据上都能取得较好效果。 展开更多
关键词 人工智能 蛋白质相互作用 蛋白质特征 蛋白质序列 深度神经网络
原文传递
人WASH468和WASH465蛋白质特性辨析
7
作者 郑皑雪 张鲁平 +4 位作者 汤拓 李萍 洪鲜 邓志会 王涛 《医学分子生物学杂志》 CAS 2024年第2期93-99,共7页
目的探讨两种较为公认但序列不同的Wiskott-Aldrich综合征蛋白和富含脯氨酸同源物(Wiskott-Aldrich syndrome protein and SCAR homolog,WASH)的差异。方法使用免疫荧光、免疫共沉淀和激光微辐射等实验分析两种WASH在定位模式、与FAM21... 目的探讨两种较为公认但序列不同的Wiskott-Aldrich综合征蛋白和富含脯氨酸同源物(Wiskott-Aldrich syndrome protein and SCAR homolog,WASH)的差异。方法使用免疫荧光、免疫共沉淀和激光微辐射等实验分析两种WASH在定位模式、与FAM21或Ku蛋白的相互作用、向DNA损伤位点募集速率和蛋白质稳定性方面的差异;比较多种生物中的WASH蛋白质序列和检测多种在生物和医学研究中常用的细胞中的WASH编码序列,分析两种人WASH序列的普遍性和保守性。结果两种WASH展现出类似的内体(endosome)定位模式。WASH468表现出与FAM21更强的相互作用,并且WASH468展现出更强的稳定性。WASH465表现出与Ku蛋白更强的相互作用,并且WASH465展现出向DNA损伤位点更强的募集。多种生物中的WASH序列与人WASH468序列的一致性明显高于WASH465,并且多种在生物和医学研究中常用的细胞中的WASH氨基酸序列均与WASH468一致。结论WASH468和WASH465的生物学特性存在差异,WASH468序列的普遍性和保守性明显高于WASH465,因此WASH468是更保守的人WASH序列。 展开更多
关键词 Wiskott-Aldrich综合征蛋白和富含脯氨酸同源物 蛋白序列 保守性 相互作用 DNA修复
下载PDF
基于深度学习的蛋白质设计研究综述 被引量:1
8
作者 李岩 夏雨 《科技创新与应用》 2023年第20期21-25,共5页
在生命科学领域,蛋白质工程是创造具有改进或新功能蛋白质问题的关键。该文总结近几年深度学习辅助蛋白质工程研究的发展,主要介绍相关的语言模型和生成模型,还从序列和结构的角度介绍相关的研究及目前存在的问题。最后对深度学习辅助... 在生命科学领域,蛋白质工程是创造具有改进或新功能蛋白质问题的关键。该文总结近几年深度学习辅助蛋白质工程研究的发展,主要介绍相关的语言模型和生成模型,还从序列和结构的角度介绍相关的研究及目前存在的问题。最后对深度学习辅助蛋白质工程研究的未来发展进行展望。 展开更多
关键词 深度学习 蛋白质工程 语言模型 生成模型 蛋白质序列 蛋白质结构
下载PDF
基于层级和全局特征结合的蛋白质序列EC编号预测
9
作者 杨帆 韩巧玲 +1 位作者 赵文迪 赵玥 《遗传》 CAS CSCD 北大核心 2024年第8期661-670,共10页
酶功能的识别对理解生命活动的机制、推进生命科学的发展有重要作用。然而现有的酶EC编号预测方法,并未充分利用蛋白质序列信息,在识别精度上仍有所不足。针对上述问题,本研究提出一种基于层级特征和全局特征的EC编号预测网络(EC number... 酶功能的识别对理解生命活动的机制、推进生命科学的发展有重要作用。然而现有的酶EC编号预测方法,并未充分利用蛋白质序列信息,在识别精度上仍有所不足。针对上述问题,本研究提出一种基于层级特征和全局特征的EC编号预测网络(EC number prediction network using hierarchical features and global features,ECPN-HFGF)。该方法首先通过残差网络提取蛋白质序列通用特征,并通过层级特征提取模块和全局特征提取模块进一步提取蛋白质序列的层级特征和全局特征,之后结合两种特征信息的预测结果,采用多任务学习框架,实现酶EC编号的精确预测。计算实验结果表明,ECPN-HFGF方法在蛋白质序列EC编号预测任务上性能最佳,宏观F1值和微观F1值分别达到95.5%和99.0%。ECPN-HFGF方法能有效结合蛋白质序列的层级特征和全局特征,快速准确预测蛋白质序列EC编号,比当前常用方法预测精确度更高,能够为酶学研究和酶工程应用的发展提供一种高效的思路和方法。 展开更多
关键词 酶功能预测 蛋白质序列 深度学习 层级多标签分类 全局特征
下载PDF
利用Transformer的组合聚类算法在蛋白质数据分析中的应用
10
作者 陈祥龙 李海军 +1 位作者 赵福军 袁媛 《无线互联科技》 2024年第14期74-81,共8页
该研究将Transformer模型适配于蛋白质特征降维场景,通过其特有的自注意力机制,赋予模型对长程依赖关系的较好建模性能,同时,多头注意力设计使得模型能够从不同角度捕获特征间的相互作用,进一步提升降维结果的表达力和鲁棒性。文章提出... 该研究将Transformer模型适配于蛋白质特征降维场景,通过其特有的自注意力机制,赋予模型对长程依赖关系的较好建模性能,同时,多头注意力设计使得模型能够从不同角度捕获特征间的相互作用,进一步提升降维结果的表达力和鲁棒性。文章提出了一种新型的GRKM组合聚类算法,在原始K-means算法中引入了灰狼优化算法(Grey Wolf Optimization Algorithm)确定聚类的K值,以随机游走算法(Random Walk)确定初始聚类中心,以马氏距离(Markov Distance)来衡量样本间的相似性。研究中,对5种具有代表性的蛋白质数据集进行了实验验证,得到了改进后算法在轮廓系数以及DB指数等方面相较于改进前都有较大提升的结论。最终的结果分析选取APP蛋白质数据,将蛋白质聚为8类,探讨了各类别的生物功能,在解释性方面也取得了较为明显的效果。所提算法为深入理解蛋白质功能、发现潜在生物标志物以及指导药物设计等实际应用提供了参考工具。 展开更多
关键词 蛋白质序列 Transformer模型 聚类算法 马氏距离 随机游走 灰狼优化算法
下载PDF
稻瘟病菌致病性增强突变体B11的基因分析 被引量:6
11
作者 吴小燕 王教瑜 +8 位作者 张震 井金学 杜新法 柴荣耀 毛雪琴 邱海萍 姜华 王艳丽 孙国昌 《中国水稻科学》 CAS CSCD 北大核心 2009年第6期611-615,共5页
在农杆菌介导转化(AtMT)的稻瘟病菌突变体库中,筛选到一个菌丝生长增快,对大麦致病性增强的突变体B11。Southern杂交分析表明B11中T-DNA为单拷贝插入。通过TAIL-PCR克隆插入位点侧翼序列,序列测定与比对分析显示T-DNA位于假想基因MG0167... 在农杆菌介导转化(AtMT)的稻瘟病菌突变体库中,筛选到一个菌丝生长增快,对大麦致病性增强的突变体B11。Southern杂交分析表明B11中T-DNA为单拷贝插入。通过TAIL-PCR克隆插入位点侧翼序列,序列测定与比对分析显示T-DNA位于假想基因MG01679的编码区内。利用PCR的方法,克隆基因的DNA和cDNA序列。该基因开放阅读框包括1个内含子和2个外显子,编码序列的长度为696 bp,编码231个氨基酸的多肽,编码产物属于ThiJ/PfpⅠ蛋白家族。因此,将该基因命名为MgThiJ1。MgThiJ1蛋白序列与尖胞镰刀菌假想蛋白FOXG_09029有57%的同源性,与禾谷镰刀菌假想蛋白FGSG_08979有54%的同源性。MgThiJ1基因可能为致病过程的负调控因子,其具体作用机制有待进一步研究。 展开更多
关键词 稻瘟病菌 突变体 致病性 基因 基因功能 蛋白序列
下载PDF
蛋白质序列中的关联规则发现及其应用 被引量:4
12
作者 陈双平 郑浩然 +1 位作者 刘海燕 王煦法 《生物物理学报》 CAS CSCD 北大核心 2006年第3期171-176,共6页
随着蛋白质序列-结构分析中使用的机器学习算法越来越复杂,其结果的解释和发现过程也随之复杂化,因此有必要寻找简单且理论上可靠的方法。通过引入原理简单、理论可靠、结果具有很强实际意义的关联规则发现算法,找到了蛋白质序列中数以... 随着蛋白质序列-结构分析中使用的机器学习算法越来越复杂,其结果的解释和发现过程也随之复杂化,因此有必要寻找简单且理论上可靠的方法。通过引入原理简单、理论可靠、结果具有很强实际意义的关联规则发现算法,找到了蛋白质序列中数以万计的模式。结合实例演示了如何将这些模式应用于蛋白质序列分析中,如保守区域发现、二级结构预测等。同时根据这些结果构建了一个二级结构规则库和一种简单的二级结构预测算法,实验结果表明,约81%的二级结构可以由至少一条关联规则预测得到。 展开更多
关键词 蛋白质序列 关联规则 二级结构预测 模式发现
下载PDF
Proteins:From sequence to structure 被引量:2
13
作者 郑伟谋 《Chinese Physics B》 SCIE EI CAS CSCD 2014年第7期107-113,共7页
Protein sequences as special heterogeneous sequences are rare in the amino acid sequence space. The specific sequen- tial order of amino acids of a protein is essential to its 3D structure. On the whole, the correlati... Protein sequences as special heterogeneous sequences are rare in the amino acid sequence space. The specific sequen- tial order of amino acids of a protein is essential to its 3D structure. On the whole, the correlation between sequence and structure of a protein is not so strong. How well would a protein sequence contain its structural information? How does a sequence determine its native structure? Keeping the globular proteins in mind, we discuss several problems from sequence to structure. 展开更多
关键词 proteinS protein sequence protein structures protein folding
下载PDF
生物信息学大实验教学改革的探索与实践 被引量:5
14
作者 马明月 曾垂省 +2 位作者 解增言 王喻 舒坤贤 《生物化工》 2018年第2期103-105,108,共4页
随着科学技术的进步、交叉学科的迅猛发展,社会对生物信息专业学生的知识、能力和素质提出了更高的要求。为了顺应生物信息学学科的快速发展,必须深化教学改革,加强实践性教学环节,加强对学生动手能力的培养。本文针对生物信息学大实验... 随着科学技术的进步、交叉学科的迅猛发展,社会对生物信息专业学生的知识、能力和素质提出了更高的要求。为了顺应生物信息学学科的快速发展,必须深化教学改革,加强实践性教学环节,加强对学生动手能力的培养。本文针对生物信息学大实验,从教学内容、教学手段和教学方法等方面进行了改革探索,以期全面提高教学质量,努力培养高素质的专业人才。 展开更多
关键词 生物信息学 DNA序列 蛋白质序列 教学改革 实践
下载PDF
利用序列和组合图卷积网络预测蛋白质功能 被引量:1
15
作者 秦琪琪 丁学明 王金雷 《小型微型计算机系统》 CSCD 北大核心 2023年第12期2692-2699,共8页
蛋白质功能的准确预测有利于推进生物医学发展,高通量测序技术的快速发展加快了蛋白质序列的提取速度,从而产生了大量未注释的蛋白质,并且新测序序列缺乏结构等生物信息,针对该问题提出了基于序列和组合图卷积网络的蛋白质功能预测模型(... 蛋白质功能的准确预测有利于推进生物医学发展,高通量测序技术的快速发展加快了蛋白质序列的提取速度,从而产生了大量未注释的蛋白质,并且新测序序列缺乏结构等生物信息,针对该问题提出了基于序列和组合图卷积网络的蛋白质功能预测模型(Protein Function Prediction using Sequences and Combined Graph Convolutional Networks, PFP-SCGCN).首先通过深度学习方法捕获蛋白质序列的多维特征信息,再通过多序列比对从蛋白质序列中提取进化耦合信息和氨基酸残基群落,然后利用进化耦合信息和氨基酸残基群落生成序列氨基酸之间两种不同连接程度的邻接矩阵,将这两种邻接矩阵与序列特征信息一起输入给组合图卷积网络进行信息融合,最后通过多个全连接层获得蛋白质功能类别信息.本文还通过分析PFP-SCGCN的特定网络层识别蛋白质功能位点,可帮助人们推测出新序列中的重要氨基酸.模型结果表明,PFP-SCGCN模型的功能预测准确率远高于对比方法,具有较好的鲁棒性,并且可以较准确的识别功能位点. 展开更多
关键词 蛋白质功能预测 功能位点 图卷积网络 蛋白质序列
下载PDF
基于多序列特征提取的蛋白质相互作用预测 被引量:4
16
作者 杜明宇 张晓龙 《计算机工程与设计》 北大核心 2018年第1期86-89,254,共5页
考虑到现有的基于序列的蛋白质相互作用预测方法均采用单一的特征提取方法,具有一定的局限性,提出一种方法。用元学习策略作为分类器融合策略,并集成多种蛋白质序列特征提取方法。在10 702对酿酒酵母蛋白质对数据集上,得到97.28%的预测... 考虑到现有的基于序列的蛋白质相互作用预测方法均采用单一的特征提取方法,具有一定的局限性,提出一种方法。用元学习策略作为分类器融合策略,并集成多种蛋白质序列特征提取方法。在10 702对酿酒酵母蛋白质对数据集上,得到97.28%的预测精度,优于目前现有方法的平均水平,在独立测试集上同样具有优秀的表现,实验结果表明,该方法有效提高了蛋白质相互作用预测的准确率。 展开更多
关键词 蛋白质-蛋白质相互作用 蛋白质序列 特征提取 支持向量机 分类器融合
下载PDF
一种新的蛋白质序列模式挖掘算法 被引量:3
17
作者 郭顺 姜青山 +1 位作者 王备战 史亮 《计算机工程》 CAS CSCD 北大核心 2009年第8期208-210,共3页
针对传统模式挖掘方法挖掘蛋白质序列会生成大量候选模式或多次构造投影数据库,导致效率降低,挖掘过程中会产生不必要的短模式或错误模式等问题,提出基于模式划分的MBioPM算法。理论分析和实验表明,MBioPM算法的性能高于其他相关算法。
关键词 蛋白质序列 模式挖掘 数据挖掘 生物信息学
下载PDF
蛋白质序列的六维表示与相似性分析 被引量:4
18
作者 吴霞 廖波 王天明 《生物技术通讯》 CAS 2004年第4期366-368,共3页
给出了蛋白质序列的一种六维表示方法,根据这种表示方法有3种不同表示形式,利用这3种形式来构造距离矩阵的信息熵,然后通过信息熵向量的欧式距离、夹角来比较序列之间的相似性。
关键词 蛋白质序列 距离矩阵 信息熵 相似性分析 生物信息学
下载PDF
蛋白质亚细胞定位预测中的序列编码技术 被引量:1
19
作者 王正华 张振慧 王勇献 《生物信息学》 2007年第2期82-85,89,共5页
蛋白质序列的编码是亚细胞定位预测问题中的关键技术之一。该文较为详细地介绍了目前已有的蛋白质序列编码算法;并指出了序列编码中存在的一些问题及可能的发展方向。
关键词 蛋白质序列编码 亚细胞定位
下载PDF
用差异显示法从人胎脑基因文库分离一个编码序列 被引量:2
20
作者 杨岐生 林卿 +1 位作者 李奕 谢毅 《中国生物化学与分子生物学报》 CAS CSCD 1999年第6期876-880,共5页
人18周、22周胎儿脑、肝肾组织总m RNA 用DDRT-PCR显示出差异的条带,回收胎脑和肝肾特异性表达的487条电泳条带.其中某些条带用3种组织的cDNA 探针作点杂交,筛选只对胎儿脑总呈阳性的DNA 片段.以其中某... 人18周、22周胎儿脑、肝肾组织总m RNA 用DDRT-PCR显示出差异的条带,回收胎脑和肝肾特异性表达的487条电泳条带.其中某些条带用3种组织的cDNA 探针作点杂交,筛选只对胎儿脑总呈阳性的DNA 片段.以其中某一条带DNA 为探针,从胎儿脑cDNA 文库筛选阳性克隆,得到GC58.经Northern 杂交和DNA 测序,表明它是人脑表达的序列,与数据库中KIAA0515有同源性,并编码一个有274个氨基酸的蛋白质,该蛋白质序列尚未见报道.探讨了DDRT-PCR的条件和假阳性问题. 展开更多
关键词 胎儿 人脑 DDRT-PCR DNA序列 基因分离 假阳性
下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部