期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
玉米AGPase小亚基基因的扩张分析
1
作者 鲁佳林 陈娇 +4 位作者 李瑞雪 王谢琴 张红 于小蓉 刘汉梅 《玉米科学》 CAS CSCD 北大核心 2023年第5期25-33,共9页
采用生物信息学方法分析AGPase家族基因的系统发育关系和基因结构特征,基于玉米B73参考基因组(AGPv4)新鉴定玉米AGPase小亚基编码基因,同时根据序列比对结果重新注释基因组中发生扩张的AGPS片段基因。结果表明,新鉴定并重新注释的ZmAGPS... 采用生物信息学方法分析AGPase家族基因的系统发育关系和基因结构特征,基于玉米B73参考基因组(AGPv4)新鉴定玉米AGPase小亚基编码基因,同时根据序列比对结果重新注释基因组中发生扩张的AGPS片段基因。结果表明,新鉴定并重新注释的ZmAGPS2-3、ZmAGPS2-4、ZmAGPS2-5基因包含1个序列高度相似的外显子,由祖先基因ZmAGPS2-2的多个外显子(无内含子)序列拼接形成。其编码蛋白的保守结构域存在不同程度的缺失,且这3个基因在染色体上的位置无共线性关系,也不相邻。因此推测,ZmAGPS2-3、ZmAGPS2-4和ZmAGPS2-5基因起源方式为反转录转座复制,在演化过程中丢失了部分序列后成为功能缺失的假基因。 展开更多
关键词 玉米 AGPase小亚基 注释 反转录转座复制
原文传递
基于序列相似性和Z曲线方法重注释原核生物蛋白编码基因
2
作者 刘硕 曾志 +1 位作者 曾凡才 杜萌泽 《遗传》 CAS CSCD 北大核心 2020年第7期691-702,I0003,共13页
随着测序技术的不断发展,产生了海量的基因组测序数据,极大地丰富了公共遗传数据资源。同时为了应对大量基因组数据的产生,基因组比较和注释算法、工具不断更新,使得联合多种注释工具得到更准确的蛋白编码基因的注释信息成为可能。目前... 随着测序技术的不断发展,产生了海量的基因组测序数据,极大地丰富了公共遗传数据资源。同时为了应对大量基因组数据的产生,基因组比较和注释算法、工具不断更新,使得联合多种注释工具得到更准确的蛋白编码基因的注释信息成为可能。目前公共数据库的原核生物基因组测序和装配有些是10多年前的,存在大量预测的功能未知的编码基因。为了提升美国国家生物信息中心(National Center for Biotechnology Information,NCBI)数据库中基因组的注释质量,本研究联合使用多种原核基因识别算法/软件和基因表达数据重注释1587个细菌和古细菌基因组。首先,利用Z曲线的33个变量从177个基因组原注释中识别获得3092个被过度注释为蛋白编码基因的序列;其次,通过同源比对为939个基因组中的4447个功能未知的蛋白编码基因注释上具体功能;最后,通过联合采用ZCURVE 3.0和Glimmer 3.02以及Prodigal这3种高精度的、广泛使用且基于算法不同而互补的基因识别软件来寻找漏注释基因。最终,从9个基因组中找到了2003个被漏注释的蛋白编码基因,这些基因属于多个蛋白质直系同源簇(clusters of orthologous groups of proteins, COG)。本研究使用新的工具并结合多组学数据重新注释早期测序的细菌和古细菌基因组,不仅为新测序菌株提供注释方法参考,而且这些重注释后得到的细菌基因序列也会对后续基础研究有所帮助。 展开更多
关键词 细菌 注释 Z曲线 假定ORFs 非蛋白编码ORFs
下载PDF
Shewanella oneidensis MR-1基因组蛋白质编码基因重注释预测及功能分析
3
作者 刘青斌 任景 于家峰 《德州学院学报》 2016年第4期1-10,共10页
公共数据库中蛋白编码基因错误注释问题影响了数据库的使用质量.通过综合运用多种计算方法对在生物能源及环境治理中具有重要应用的Shewanella oneidensis MR-1菌基因组蛋白编码基因进行了重注释,结果得到2个过注释基因,并发现了289个... 公共数据库中蛋白编码基因错误注释问题影响了数据库的使用质量.通过综合运用多种计算方法对在生物能源及环境治理中具有重要应用的Shewanella oneidensis MR-1菌基因组蛋白编码基因进行了重注释,结果得到2个过注释基因,并发现了289个新基因.基于功能已知的蛋白质编码基因表明所采用的过注释算法得到的Ac、MCC、AUC分别为99.90%、0.9982和0.9999.基于BLAST和COG对预测得到的289个欠注释基因进行功能预测表明有152个欠注释蛋白质编码基因得到明确的生物学功能,为今后的深入研究提供了数据支持. 展开更多
关键词 生物能源 SHEWANELLA oneidensis MR-1 注释
下载PDF
基于RNA-Seq技术的毕赤酵母基因组重注释及新型强启动子的发现与序列分析 被引量:4
4
作者 亓飞 蔡孟浩 +1 位作者 周祥山 张元兴 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2014年第2期167-175,共9页
使用RNA-Seq技术,对毕赤酵母进行了转录组测序。基于测序结果,对现有毕赤酵母基因组进行了重注释,修正了基因组序列中的错误位点861处,发现了新转录本249个及可变剪切现象83个,并更正了553个转录本的错误注释。经过表达谱分析,在毕赤酵... 使用RNA-Seq技术,对毕赤酵母进行了转录组测序。基于测序结果,对现有毕赤酵母基因组进行了重注释,修正了基因组序列中的错误位点861处,发现了新转录本249个及可变剪切现象83个,并更正了553个转录本的错误注释。经过表达谱分析,在毕赤酵母中发现了2个新型强启动子,分别命名为P437和P1431,其驱动的转录本的最高转录水平分别为AOX1基因的1.78倍和3.40倍。序列分析显示,P437和P1431序列中存在着多个酵母转录因子的结合位点。 展开更多
关键词 毕赤酵母 RNA-SEQ 基因组注释 启动子
下载PDF
基于Z曲线方法重新注释脑膜炎奈瑟菌MC58株基因组 被引量:1
5
作者 魏闻 郭锋彪 吴映辉 《生物物理学报》 CAS CSCD 北大核心 2011年第6期545-554,共10页
已测序的微生物基因组中包含的注释开放阅读框(open reading frames,ORFs)可以分为两大类:第一类对应于功能已知的蛋白质编码基因;第二类则为功能未知的假设ORFs,其中通常有一部分实际上不编码蛋白质。采用基于Z曲线的方法从属于第一类... 已测序的微生物基因组中包含的注释开放阅读框(open reading frames,ORFs)可以分为两大类:第一类对应于功能已知的蛋白质编码基因;第二类则为功能未知的假设ORFs,其中通常有一部分实际上不编码蛋白质。采用基于Z曲线的方法从属于第一类的功能已知基因出发训练参数,进而确定第二类ORFs中非编码的部分。通过支持向量机的学习及分类,结果显示十重交叉检验平均正确率为98.45%,说明Z曲线联合支持向量机是一种高度准确的基因识别方法。最终,确定216个假设ORFs实际上不编码蛋白质。通过采用Blastp进行序列比对,保留的假设ORFs中有341个在高可靠性的条件下获得了功能信息。根据蛋白质直系同源簇方法进行功能分类,分别有30、53、59和159个新注释的假设ORFs属于信息储存和加工类、细胞加工和信号传递类、新陈代谢类和特征不明显类。另外还有70个不属于其中的任何一类。注释结果比RefSeq及GenBank提供的原注释更加准确,更加完整。 展开更多
关键词 脑膜炎奈瑟菌MC58株 基因组注释 21变量Z曲线 支持向量机
原文传递
牙龈卟啉单胞菌编码基因重注释研究
6
作者 徐晓捷 计得伟 +2 位作者 张欣悦 张无忌 张会雄 《生物信息学》 2015年第4期205-211,共7页
为了确保牙龈卟啉单胞菌生物大分子信息的准确性,对NCBI数据库中的3株牙龈卟啉单胞菌的注释信息进行研究。首先,准备好蛋白质编码与非编码序列正负样本,用基于Z曲线理论的Fisher判别法对正负样本集进行训练,确定一个判断ORF编码或非编... 为了确保牙龈卟啉单胞菌生物大分子信息的准确性,对NCBI数据库中的3株牙龈卟啉单胞菌的注释信息进行研究。首先,准备好蛋白质编码与非编码序列正负样本,用基于Z曲线理论的Fisher判别法对正负样本集进行训练,确定一个判断ORF编码或非编码的阈值t0,由阈值作为判别条件来识别所有的ORFs,判断基因片段是否具有编码蛋白质的功能,由此阈值为判别标准排除掉3株牙龈卟啉单胞菌基因组中错误的基因注释信息。然后,用Prodigal基因预测软件对牙龈卟啉单胞菌进行基因预测,基因预测结果与原始功能已知基因进行比对,挑选出具有不同5’终端的ORFs,将这些具有不同5’终端的ORFs与功能已知的基因片段进行比对,找到重叠率小于20%的候选基因。最后,对这些候选基因用Blast进行序列比对找到满足条件的新基因,并为这些新基因添加功能注释信息。基于以上方法共排除了117个非编码的开放式阅读框,并找到了30个NCBI数据库中缺失的编码蛋白质的新基因。 展开更多
关键词 牙周病 牙龈卟啉单胞菌 基因注释 新基因
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部