文摘为了更好地了解青峪猪在世代更替过程中遗传结构的变化,更好的保护和利用青峪猪遗传资源,本研究利用50K SNP芯片,对青峪猪保种群内141头(26头公猪,115头母猪)健康成年个体进行SNP测定,通过多种分析软件对青峪猪保种群体和各个世代进行系谱校正,进而实施群体遗传多样性、遗传距离以及遗传结构变化等分析。结果显示,该封闭保种群由3个重叠世代构成,群体有效含量为12头,且整个群体可以分为6个含有公猪的家系和1个不含公猪的家系。其中,第3世代的有效群体含量最少,仅为3头,多态性标记比例随着世代的增加不断下降;141头青峪猪的平均遗传距离为(0.2604±0.0252),26头种公猪的遗传距离为(0.2633±0.0237)。随着繁殖世代的增加,各世代群体的遗传距离有轻微的上升趋势,部分种猪之间的亲缘关系和遗传距离较近;在141头青峪猪群体中共检测到1481个基因组上长纯合片段(runs of hemozygosity,ROH),78.01%的长度在200 Mb以内,基于ROH值计算的近交系数表明整个群体的平均近交系数为0.055,且各世代的近交系数在不断上升,到第3世代时已经达到了0.075。综上所述,通过对青峪猪分子水平的群体遗传结构研究表明,该保种群体在闭锁的继代繁育过程中存在群体遗传多样性损失,需要加强选配或导入外血以确保青峪猪遗传资源的长期保存。
文摘为了比较自动机器学习下不同机器学习模型预测部分猪生长性状与全基因组估计育种值(genomic estimated breeding value,GEBV)的性能,并寻找适合的机器学习模型,以优化生猪育种的全基因组评估方法,本研究利用来自多个公司9968头猪的基因组信息、系谱矩阵、固定效应及表型信息通过自动机器学习方法获取深度学习(deep learning,DL)、随机森林(random forest,RF)、梯度提升机(gradient boosting machine,GBM)和极致梯度提升(extreme gradient boosting,XGB)4种机器学习最佳模型。采用10折交叉验证分别对猪达100 kg校正背膘(correcting backfat to 100 kg,B100)、达115 kg校正背膘(correcting backfat to 115 kg,B115)、达100 kg校正日龄(correcting days to 100 kg,D100)、达115 kg校正日龄(correcting days to 100 kg,D115)的GEBV及其表型进行预测,比较不同机器学习模型应用于猪基因组评估的性能。结果表明:机器学习模型对GEBV的估计准确性高于性状表型;在GEBV预测中,GBM在B100、B115、D100、D115的预测准确性分别为0.683、0.710、0.866、0.871,略高于其他方法;在表型预测中,对猪B100、B115、D100、D115预测性能最好的模型依次为GBM(0.547)、DL(0.547)、XGB(0.672、0.670);在模型训练所需时间上,RF远高于其他3种模型,GBM与DL居中,XGB所需时间最少。综上所述,通过自动机器学习获取的机器学习模型对GEBV预测的准确性高于表型;GBM模型总体上表现出最高的预测准确性与较短训练时间;XGB能够利用最短的时间训练准确性较高的预测模型;RF模型的训练时间远超其他3种模型,且准确性不足,不适用猪生长性状表型与GEBV预测。