摘要
利用UniGene数据库转录本序列数据,通过生物信息学方法,对已有全长mRNA序列数据的基因进行其转录本5端序列的比对,获得该基因编码区前所有转录本的启始位点信息.通过7种植物17437个基因的分析表明,植物基因平均在171 bp(mRNA水平上)或174 bp(基因组水平上)的区间内转录启始,转录频率分布基本呈正态分布.为此我们研发了基因转录启始频率分析程序包PIFMaker,并基于以上分析获得的数据,建立了植物基因转录频率数据库(PIFdb,http://ibi.zju.edu.cn/bioinplant/).本研究分析基于该数据库第2版(Release 2.0)的数据.
Transcriptional initiation frequency of 17,437 genes from 7 plants was estimated based on data of UniGene database using bioinformatics method. The results indicated that average distanee of transeriptional initiation of plant genes was 171 bp (at mRNA level) or 174 bp (at genomic DNA level) and distribution of their transcriptional initiation frequeneies presented a normal distribution in general. A pipeline program, PIFMaker and a database, PIFdb (Potential transcriptional initiation frequency database), were developed in this study. The data of Release 2.0 of PIFdb database was used in this analysis.
出处
《浙江大学学报(农业与生命科学版)》
CAS
CSCD
北大核心
2006年第2期119-122,共4页
Journal of Zhejiang University:Agriculture and Life Sciences
基金
国家自然科学基金资助项目(3017018190208022)
关键词
转录位点
转录起始频率
UNIGENE
PIFdb
水稻
拟南芥
transcriptional initiation site
transcriptional initiation frequency
UniGene
PIFdb
Oryza sativa
Arabidopsis