DNA序列中“词”的自重叠性对其分布的影响和异常“词”的鉴别

The Influence of Overlapping Words on the Probability Distribution of Words in DNA Sequence and Identification of the ‘Anomalous’ Words

原文传递

导出

摘要从语言学的角度来看基因序列，一个ＤＮＡ序列可以看成是由字母Ａ，Ｇ，Ｃ，Ｔ组成的有限的字符串，以一定的语法和词法结构为转录机器所识别．那么，词在序列中是如何分布的？文中研究了在不同状况下的单词的理论分布，证实了单词（即ＣＯＤＥ）的自重叠性对单词在序列中的概率分布的有极大的影响，并就实例验证了这一点．结合经验分布，提出了两种在ＤＮＡ序列中鉴别异常单词的方法．得出结论：字母Ａ，Ｇ，Ｃ，Ｔ等概率出现和不等概率出现是判别单词是否异常的重要条件． A linguistic approaches to understanding the meaning of DNA sequence have been adopted.A DNA sequence is composed of nucleotides A,C,G,T,and can be transferred under a special ‘morphology’ and ‘grammar’.Which factors will influence the number of the occurrences of words in the DNA text?How to find the ‘anomalous’ words?The theoretic probability distribution of the words is got.And it reveals the highly influence of overlapping capability on the probability distribution.The effect is illustrated with a DNA fragment example.Going with empirical distribution,two ways are presented to find ‘anomalous’ words.

作者陈励王顺芳孟捷唐瑛

机构地区云南大学统计系云南教育学院数理分院

出处《云南大学学报（自然科学版）》 CAS CSCD 1998年第6期432-436,共5页 Journal of Yunnan University(Natural Sciences Edition)

基金云南省应用基础研究基金

关键词单词随机序列自重叠性经验分布 DNA序列 words,random sequences,non random sequences,overlap,empirical distribution

分类号 Q523 [生物学—生物化学]

引文网络
相关文献

参考文献1

1陈瑞环，生物工程学报，1992年，8卷，4期，324页被引量：1

1王莹.海带与裙带菜种群遗传结构的比较研究[J].中国科学院研究生院学报,1998,15(1):74-78.
2杜宪兴,施渭康.白血病抑制因子与发育和干细胞生长、分化[J].生命科学,1996,8(1):27-30. 被引量：12
3黎运喜,张泽钧,孙宜然,谌利民,杨学贵,胡锦矗.唐家河自然保护区高山姬鼠和中华姬鼠夏季生境选择的比较[J].生态学报,2012,32(4):1241-1248. 被引量：7
4毛得奖,朱亚玲,韩宁.假单胞菌铁载体及色素研究[J].微生物学通报,2013,40(3):500-516. 被引量：17
5秦新民,李惠敏,薛妙男,杨继华.沙田柚自交、异交花粉管蛋白双向电泳分析[J].广西植物,2004,24(6):566-569. 被引量：21
6高中信,金昆,马建章,陈华豪.呼伦贝尔草原黄羊冬季食性的研究[J].兽类学报,1995,15(3):203-208. 被引量：31
7胡雪华,陈香,邹天才,周兵.花冠对紫茉莉繁殖适合度的影响[J].广西植物,2013,33(6):763-768. 被引量：4
8张涌,徐永平,郑月茂,卿素珠,赵慧英,曹贵方.山羊胚胎脊髓灰质的发育[J].西北农林科技大学学报（自然科学版）,2003,31(2):13-18. 被引量：3
9郑晓飞.RNA空间编码探析[J].生命的化学,2014,34(4):479-483. 被引量：1
10谷金普,葛继稳,唐佳,吴述园.古夫河着生藻类优势种生态位研究[J].长江流域资源与环境,2014,23(10):1456-1463. 被引量：5

云南大学学报（自然科学版）

1998年第6期

浏览历史

内容加载中请稍等...

DNA序列中“词”的自重叠性对其分布的影响和异常“词”的鉴别

参考文献1

相关作者

相关机构

相关主题

浏览历史