-
题名蛋白质序列图形变换及其相似性聚类分析
被引量:1
- 1
-
-
作者
潘以红
钱东
朱平
-
机构
江南大学理学院
-
出处
《生命科学研究》
CAS
CSCD
2018年第3期191-200,228,共11页
-
基金
国家自然科学基金资助项目(11271163)
-
文摘
基于氨基酸的疏水性和相对分子质量,先把20种氨基酸分为8类,按不同间隔角度放置于圆周上。根据z轴坐标的划分,建立一个坐标空间。将蛋白质序列中的氨基酸按排列顺序映射到空间坐标系中,得到序列的3D模型。将3D模型转换为20维矩阵图,分析序列中氨基酸对数量特征及相似性。进一步将空间坐标转换为数值序列,进行离散傅里叶变换(discrete Fourier transform,DFT),得到原蛋白质序列的功率谱,将不同长度的功率谱扩展到数据集中最长序列的长度m维。再通过计算功率谱序列间的欧氏距离来度量序列相似性,构建系统发育树。最后对不同数据集进行验证,结果显示:聚类结果与矩阵图的分析相符,且优于其他算法的效果,表明此算法对蛋白质相似性研究具有一定的有效性。
-
关键词
蛋白质序列图形化
蛋白质序列数值化
矩阵图差异分析
离散傅里叶变换(DFT)
系统发育树
-
Keywords
graphical transformation of protein sequence
numerical representations of protein sequence
thedifference analysis of matrix diagrams
discrete Fourier transform (Db-T)
phylogenetic tree
-
分类号
Q516
[生物学—生物化学]
-