在全基因组关联研究(genome-wide association studies,GWAS)中已鉴定到大量与疾病和复杂性状相关的突变位点,其中绝大部分位于基因组上的非编码区,通过多种方式参与到基因表达调控与表型产生的过程中。近年来,如何对这些突变进行系统...在全基因组关联研究(genome-wide association studies,GWAS)中已鉴定到大量与疾病和复杂性状相关的突变位点,其中绝大部分位于基因组上的非编码区,通过多种方式参与到基因表达调控与表型产生的过程中。近年来,如何对这些突变进行系统地注释和鉴定研究是疾病基因组学研究领域的一大挑战。机器学习算法的快速发展为相关研究工作提供了新的契机。结合多组学的数据特征,机器学习方法能够对基因组上的非编码区突变进行大规模与高准确性注释和预测,对于揭示突变的具体致病机制以及指导下游实验验证具有重要的参考价值。本文主要针对机器学习算法在非编码区突变注释研究中的应用进展进行综述,并对当前研究的不足之处和未来的研究方向进行讨论,以期为相关的研究工作提供参考。展开更多
文摘在全基因组关联研究(genome-wide association studies,GWAS)中已鉴定到大量与疾病和复杂性状相关的突变位点,其中绝大部分位于基因组上的非编码区,通过多种方式参与到基因表达调控与表型产生的过程中。近年来,如何对这些突变进行系统地注释和鉴定研究是疾病基因组学研究领域的一大挑战。机器学习算法的快速发展为相关研究工作提供了新的契机。结合多组学的数据特征,机器学习方法能够对基因组上的非编码区突变进行大规模与高准确性注释和预测,对于揭示突变的具体致病机制以及指导下游实验验证具有重要的参考价值。本文主要针对机器学习算法在非编码区突变注释研究中的应用进展进行综述,并对当前研究的不足之处和未来的研究方向进行讨论,以期为相关的研究工作提供参考。