期刊文献+

酵母、大肠杆菌和枯草杆菌基因组中短ORF的分布与形成原因 被引量:5

THE ORIGIN AND DISTRIB UTION OF SHORT ORFS IN YEAST,E.coli AND B.subtilis GENOMES
下载PDF
导出
摘要 用终止密码方法计算了酵母、大肠杆菌和枯草杆菌基因组中所有的第一类开阅读框架(记为理论ORF),给出了理论ORF和已知ORF随长度的分布,发现长度大于150个氨基酸后,理论ORF与已知ORF分布基本趋于一致,小于150个氨基酸的理论ORF数目的对数随长度线性变化,并提出这些短ORF是随机产生的猜想;研究了组分约束下的随机DNA序列中ORF数目、ORF的长度与随机序列总长度和GC含量之间的关系,证明了本文猜想的正确性;给出了短的理论ORF中可能的编码序列所占比例的分布曲线,这对识别短的编码序列有参考价值。 Using the terminal codon method proposed by us, th e first kind of ORFs (denoted theoret-ical ORF) are predicted in yeast, Escherichia coli and Bacillus subtilis genomes. The theoretical ORF number and known ORF number verses its length are given. The two distribut ions are consistent with each other while ORF is length larger than 1 50 amino acids. There is a good linear relation between the logarithm of theoretical ORF numbers and its length for the theoretical ORF s horter than 150 amino acids. We suppose that the theoretical ORFs and their linear relation with the length of ORFs come from the randomne ss of the DNA sequences. The relation between ORF distribution and GC content, and be-tween ORF distribution and length for component-constr ained random sequences are analyzed. The results show that our supposi tion is correct. The ratio of the number of known ORF and short the oretical ORF are given. The relation may be useful for gene identific ation.
作者 李宏
出处 《生物物理学报》 CAS CSCD 北大核心 2002年第3期307-312,共6页 Acta Biophysica Sinica
基金 国家自然科学基金(10147204) 内蒙自然科学基金
关键词 酵母 大肠杆菌 枯草杆菌 基因组 短ORF 分布 形成原因 Yeast Escherichia coli Bacillus subtilis Compone nt-constrained random DNA sequences Open reading frame distribution
  • 相关文献

参考文献3

二级参考文献14

共引文献11

同被引文献41

  • 1冯立芹 ,李宏 .基因组中开阅读框架长度的分布模型与基因组进化[J].生物物理学报,2004,20(5):375-381. 被引量:5
  • 2杰弗里佐贝 生物化学 曹凯鸣.李玉民等译[M].上海:复旦大学出版社,1992.. 被引量:1
  • 3杰弗里佐贝 曹凯鸣 李玉民等译.生物化学[M].上海:复旦大学出版社,1992.. 被引量:1
  • 4徐克学.生物数学[M].北京:科学出版社,2002.. 被引量:10
  • 5Clins F S, Patrinos A, Jorsan E, et al. New goals for the U.S. Human Genome Project: 1998 - 2003 [J]. Science, 1998,282(5389) : 682-689. 被引量:1
  • 6Lander E S, Linton L M, Birren B, et al. Initial sequencing and analysis of the human genome [J]. Nature, 2001,409: 860-921. 被引量:1
  • 7Venter J C, Adams M C, Myers E W et al. The sequence of the human genome[J]. Science, 2001, 291 : 1304-1351. 被引量:1
  • 8Burge C. And Karlin S. Prediction of complete gene structures in human genomic DNA[J].J Mol Boil, 1997, 268(1):78-94. 被引量:1
  • 9Snyder E E.And Storrno G D. Identification of protein coding regions in genomic DNA[J]. J Mol Boil, 1995,248(1)1-18. 被引量:1
  • 10Ahschul S F, Madden T, Schaffer A, et al. Gapped BLAST and PSI-BLAST: A new generation of protein database research programs[J]. Nucleic Acids Res., 1997, 25(17):3389-3402. 被引量:1

引证文献5

二级引证文献9

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部