-
题名棘腹蛙线粒体局部重复序列非排序聚类
- 1
-
-
作者
曹跃
夏云
郑渝池
-
机构
中国科学院成都生物研究所两栖爬行动物研究室
中国科学院大学
-
出处
《四川动物》
北大核心
2018年第3期261-267,共7页
-
基金
国家自然科学基金项目(31372181
31572243)
-
文摘
动物线粒体基因组发生局部串联复制后,涉及区域具有多基因拷贝、假基因化、大量插入缺失的特点,难以排序和构建基因树。而不依赖排序的聚类方法理论上可用来归纳和展示这类序列的差异,但未见相关评估和运用。本研究选取棘腹蛙Quasipaa boulengeri 19号个体,以3类常用的基于特定长度(k)子序列集的非排序算法,依次设k值为4、6、8……20,对其轻链复制起点邻近复制区域583~695 bp的序列进行聚类。构建相同个体线粒体1 518 bp蛋白编码序列最大似然树为参照,计算和考查两者间拓扑结构距离和差异。所评估的28种算法中,半数可在主要为8的特定k值下产生和最大似然树拓扑结构相差仅2个节点(11.8%)的聚类树,部分算法在不同k值下均表现不佳,较小的k值(4)适合解析差异程度相对较高的序列间关系。这些结果例证了动物线粒体重复序列非排序聚类的可行性,其中的算法、k值理想组合可能适合类似系统。建议对其他类型的复制重排系统进行类似评估。
-
关键词
棘腹蛙
线粒体DNA
非排序比对
聚类
重复序列
拓扑结构距离
蛋白编码序列
最大似然树
-
Keywords
Quasipaa boulengeri
mitochondrial DNA
alignment-free comparison
clustering
duplication region
Robinson-Foulds distance
protein-coding gene
Maximum Likelihood tree
-
分类号
Q959.5
[生物学—动物学]
-