期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
第二代测序序列比对方法综述 被引量:14
1
作者 杨烨 刘娟 《武汉大学学报(理学版)》 CAS CSCD 北大核心 2012年第5期463-470,共8页
使用聚合酶合成技术的Illumina和454平台以及使用连接酶合成测序技术的SOLiD平台是目前三种主流的第二代测序平台.对第二代测序平台产生的高通量序列片段进行比对的方法一般分为两步:①预处理,②序列比对.预处理方法有两类,即基于哈希... 使用聚合酶合成技术的Illumina和454平台以及使用连接酶合成测序技术的SOLiD平台是目前三种主流的第二代测序平台.对第二代测序平台产生的高通量序列片段进行比对的方法一般分为两步:①预处理,②序列比对.预处理方法有两类,即基于哈希表的方法和基于后缀trie的Burrows-Wheeler转换思想.序列比对方法也可分为两类,一是空位种子片段索引,二是Smith-Waterman动态规划算法.本文使用Illumina和SOLiD两种平台产生的数据对常用的比对软件SHRiMP,MAQ,BFAST,BWA,BOWTIE等进行了单机测试,结果显示:BOW-TIE在对Illumina平台数据进行比对时,在内存使用、比对速度以及准确性等方面表现比其他几种好,BWA比较适合用于比对SOLiD平台产生的数据.在处理第二代以及以纳米孔技术为标志的第三代测序平台高通量数据时,第二代比对技术仍不能完全满足要求,本文认为以云计算为基础的新序列比对方法是未来研究和发展的一个重要方向. 展开更多
关键词 第二代测序技术 序列比对
原文传递
基于第三代长读段测序数据解析蜜蜂球囊菌基因的可变剪切与可变腺苷酸化 被引量:12
2
作者 杜宇 王杰 +11 位作者 蒋海宾 王秀娜 范元婵 范小雪 祝智威 隆琦 张文德 熊翠玲 郑燕珍 付中民 陈大福 郭睿 《微生物学报》 CAS CSCD 北大核心 2021年第3期667-682,共16页
【目的】蜜蜂球囊菌(Ascosphaera apis,简称球囊菌)是一种专性侵染蜜蜂幼虫的真菌病原,导致的白垩病是严重影响养蜂生产的顽疾,每年给养蜂业造成较大损失。本研究旨在基于已获得的第三代长读段测序数据对球囊菌菌丝(Aam)和孢子(Aas)中... 【目的】蜜蜂球囊菌(Ascosphaera apis,简称球囊菌)是一种专性侵染蜜蜂幼虫的真菌病原,导致的白垩病是严重影响养蜂生产的顽疾,每年给养蜂业造成较大损失。本研究旨在基于已获得的第三代长读段测序数据对球囊菌菌丝(Aam)和孢子(Aas)中基因的可变剪切(alternative splicing,AS)和可变多聚腺苷酸化(alternative polyadenylation,APA)进行深入分析。【方法】利用Astalavista软件鉴定Aam和Aas中基因的AS事件类型。利用IGV浏览器对部分剪切异构体(isoform)的结构进行可视化。通过TAPIS pipeline对Aam和Aas中基因的APA位点进行鉴定。通过MEME软件对Aam和Aas中全长转录本的APA位点上游50bp的序列特征进行分析并对motif进行鉴定。【结果】在Aam中共鉴定到286次AS事件,包括162次RI(Retained intron),87次A3(Alternative 3'splice-site)、32次A5(Alternative 5'splice-site)和5次SE (Skipping exon);在Aas中共鉴定到559次AS事件,包括305次RI、155次A3、85次A5、13次SE和1次MEE (Mutually exclusive exon)。进一步分析发现,现有参考基因组上的多数注释基因结构并不完整;部分注释基因在菌丝和孢子中转录形成的isoform在数量和结构方面均存在差异;部分isoform在参考基因组中没有对应的注释基因。Aam中共鉴定到2748个基因含有1个及以上的APA位点,其中含有1个APA位点的基因数量最多(726,26.42%);Aas中共鉴定到2768个基因含有1个及以上的APA位点,其中含有5个以上APA位点的基因数量最多(1180,42.63%)。部分基因在菌丝和孢子中含有不同的APA位点数。序列特征分析结果显示,球囊菌全长转录本的3'UTR的上下游表现出明显的碱基倾向性,U和A分别富集在3'UTR的上游和下游。此外,在球囊菌全长转录本的APA位点上游鉴定到4个motif,分别是UCUCCU、UCUUCU、CCCACC和CCCCCU。【结论】本研究通过对球囊菌菌丝和孢子中基因的AS和APA进行深入分析,揭示了球囊菌转录组的复杂性, 展开更多
关键词 测序 牛津纳米孔 蜜蜂球囊菌 可变剪切 可变腺苷酸化
原文传递
基于蜜蜂球囊菌纳米孔测序数据的基因非翻译区延长、SSR位点发掘及未注释基因和转录本鉴定 被引量:12
3
作者 杜宇 付中民 +11 位作者 祝智威 王杰 冯睿蓉 王秀娜 蒋海宾 范元婵 范小雪 熊翠玲 郑燕珍 徐国钧 陈大福 郭睿 《昆虫学报》 CAS CSCD 北大核心 2020年第11期1345-1357,共13页
【目的】利用已获得的纳米孔长读段测序数据完善现有的蜜蜂球囊菌Ascosphaera apis参考基因组注释信息,并对未注释的新基因和新转录本进行鉴定和功能注释。【方法】基于已获得的纳米孔长读段测序数据,采用gffcompare软件将蜜蜂球囊菌全... 【目的】利用已获得的纳米孔长读段测序数据完善现有的蜜蜂球囊菌Ascosphaera apis参考基因组注释信息,并对未注释的新基因和新转录本进行鉴定和功能注释。【方法】基于已获得的纳米孔长读段测序数据,采用gffcompare软件将蜜蜂球囊菌全长转录本与参考基因组注释的转录本进行比较,进而对参考基因组注释基因的非翻译区(untranslated region,UTR)进行延长。利用TransDecoder软件对蜜蜂球囊菌基因的开放阅读框(open reading frame,ORF)及相应的氨基酸序列进行预测。通过MISA软件发掘长度在500 bp以上的全长转录本的SSR位点。通过Blast工具将鉴定到的新基因和新转录本比对Nr,KOG,eggNOG,Swiss-Prot,Pfam,GO和KEGG数据库进行功能注释。【结果】共对蜜蜂球囊菌的9481个基因进行了UTR延长,其中5′UTR和3′UTR延长的基因分别有4744和4737个。共预测出10492个完整ORF,其中编码长度分布在0~100和100~200个氨基酸的ORF最多,分别占ORF总数的38.96%和36.90%。共鉴定到5286个SSR,其中单核苷酸重复、二核苷酸重复、三核苷酸重复、四核苷酸重复、五核苷酸重复和六核苷酸重复的SSR分别为1870,826,2398,138,43和11个。共鉴定到1558个新基因,其中有1556,731,330,592,1177,709和589个新基因可分别被注释到Nr,Swiss-Prot,Pfam,KOG,eggNOG,GO和KEGG数据库。此外,还鉴定到14403条新转录本,其中有14376,8524,7276,7405,12035,7891和6855条新转录本可分别被注释到上述7个数据库。【结论】本研究利用已获得的纳米孔长读段测序数据对蜜蜂球囊菌的完整ORF进行了预测,对参考基因组的已注释基因进行了UTR延长,对未注释的SSR位点进行了发掘,此外还鉴定到大量未注释的新基因和新转录本,并对它们进行了功能注释。研究结果较好地完善了现有的蜜蜂球囊菌的基因组注释,为其组学和分子生物学研究的深入开展提供了基础。 展开更多
关键词 蜜蜂球囊菌 测序技术 全长转录组 基因组 蜜蜂 白垩病
下载PDF
深度学习在DNA存储读段重建的应用
4
作者 姚翔宇 刘希晨 +2 位作者 昝乡镇 许鹏 刘文斌 《广州大学学报(自然科学版)》 CAS 2024年第3期1-7,共7页
DNA存储技术是一项着眼于未来的具有划时代意义存储技术,它将数字信息编码为核苷酸序列,然后通过化学合成将序列写入DNA分子,最后通过DNA测序技术读取信息。相较于电子存储技术,其在信息密度、数据安全性以及保存年限等方面具有极大的... DNA存储技术是一项着眼于未来的具有划时代意义存储技术,它将数字信息编码为核苷酸序列,然后通过化学合成将序列写入DNA分子,最后通过DNA测序技术读取信息。相较于电子存储技术,其在信息密度、数据安全性以及保存年限等方面具有极大的优势。然而在DNA存储技术的数据读取端,测序读段存在着大量碱基替换、插入和删除错误,因此需进行读段重建来恢复原始数据。读段重建方法要求高成功率以及一定的时效性,以实现文件可靠存取并提高DNA存储技术的读写效率。文章介绍了现有的基于深度学习的读段重建模型,通过对模型架构、重建理念以及纠错能力等方面的比较指出了目前研究的局限性,并展望了未来深度学习在读段重建中可能的研究方向。 展开更多
关键词 DNA存储技术 碱基错误 重建 深度学习
下载PDF
基于MapReduce的基因读段定位算法 被引量:2
5
作者 涂金金 杨明 郭丽娜 《模式识别与人工智能》 EI CSCD 北大核心 2014年第3期206-212,共7页
RNA-seq测序技术的高速发展所产生的海量数据在执行效率上给原有读段定位算法带来严峻的挑战.为此,提出基于MapReduce的不跨越剪切位的空位种子索引算法(PSeqMap)和跨越剪切位的空位种子索引算法(PJuncSeqMap),以及一种负载平衡解决方案... RNA-seq测序技术的高速发展所产生的海量数据在执行效率上给原有读段定位算法带来严峻的挑战.为此,提出基于MapReduce的不跨越剪切位的空位种子索引算法(PSeqMap)和跨越剪切位的空位种子索引算法(PJuncSeqMap),以及一种负载平衡解决方案.该算法利用MapReduce框架实现空位种子索引算法的并行化,在拟南芥菜基因数据集上的实验结果表明文中提出的算法能够充分利用集群的存储和计算能力,高效处理海量基因数据. 展开更多
关键词 定位 SeqMap MAPREDUCE
下载PDF
基于MapReduce的基因读段定位改进算法 被引量:1
6
作者 涂金金 杨明 郭丽娜 《计算机科学》 CSCD 北大核心 2015年第8期82-85,共4页
由于高通量测序技术产生了海量基因读段数据,并行的基因读段定位算法成为近年来的研究热点。对基因匹配算法进行研究,提出了一种基于MapReduce的基因读段定位改进算法,并且通过在读段定位过程中融入生物信息以及利用Hadoop分布式缓存机... 由于高通量测序技术产生了海量基因读段数据,并行的基因读段定位算法成为近年来的研究热点。对基因匹配算法进行研究,提出了一种基于MapReduce的基因读段定位改进算法,并且通过在读段定位过程中融入生物信息以及利用Hadoop分布式缓存机制,在一定程度上降低了算法的复杂度。在拟南芥菜基因数据集上进行的实验表明,该算法能够有效提高算法执行效率,减少算法执行时间。 展开更多
关键词 定位 MAPREDUCE SeqMap
下载PDF
下一代测序技术数据中的选择性剪切计算识别方法研究
7
作者 邹权 李旭斌 +2 位作者 林子雨 江弋 林琛 《电子学报》 EI CAS CSCD 北大核心 2012年第2期350-357,共8页
随着测序技术的发展,下一代测序技术(Nex-t Generation Sequencing)给生物信息学领域研究带来了新的机遇和挑战.由于选择性剪切(alternative splicing,AS)在真核生物基因表达和蛋白质多样性方面的重要性,识别选择性剪切位点一直都是研... 随着测序技术的发展,下一代测序技术(Nex-t Generation Sequencing)给生物信息学领域研究带来了新的机遇和挑战.由于选择性剪切(alternative splicing,AS)在真核生物基因表达和蛋白质多样性方面的重要性,识别选择性剪切位点一直都是研究的重点.下一代测序技术的出现,使得选择性剪切研究的计算方法不断地变化.介绍了选择性剪切过去和目前研究的状况,然后总结了基于RNA-seq数据的选择性剪切研究方法、软件以及数据库,并利用了RNA-seq数据比较了相关软件,最后讨论了选择性剪切中计算方法的发展方向和前景. 展开更多
关键词 下一代测序技术 RNA-SEQ 选择性剪切 剪切位点 定位 生物信息学
下载PDF
多条件多样本RNA-Seq数据的剪切异构体表达水平估计
8
作者 张礼 马越 吴东洋 《智能系统学报》 CSCD 北大核心 2021年第6期1126-1135,共10页
当处理多条件多样本RNA-Seq测序数据时,现有方法忽略了读段分布样本之间存在高度相似性的特点。本文提出了一个基于多条件多样本RNA-Seq测序数据剪切异构体表达水平估计方法 MCMS-Seq。该方法建立了一个联合偏差估计模型来提取读段分布... 当处理多条件多样本RNA-Seq测序数据时,现有方法忽略了读段分布样本之间存在高度相似性的特点。本文提出了一个基于多条件多样本RNA-Seq测序数据剪切异构体表达水平估计方法 MCMS-Seq。该方法建立了一个联合偏差估计模型来提取读段分布在样本之间的相似性特征,同时考虑读段分布受全局偏差和局部偏差的影响。此外,增加了L_(2)/L_(1)组稀疏约束和L_(1)稀疏约束两个正则化项,用来体现基因和剪切异构体之间存在稀疏特性,以及消除技术性误差和数据噪声的影响。通过多个真实数据集的验证,MCMS-Seq方法能获得更为准确的剪切异构体表达水平,同时也能提供更有意义的生物性解释。 展开更多
关键词 转录组测序技术 多条件 多样本 剪切异构体 表达水平估计 稀疏特性 分布偏差 数据噪声
下载PDF
关于指导低年级朗读教学的几点思考
9
作者 许陈 《读与写(中旬)》 2021年第12期65-65,共1页
朗读是语文教学的重要组成部分,也是阅读教学过程中的一个重要环节,通过科学的朗读训练可以增强学生的阅读能力,促进学生语言和思维的发展。教师应该有层次、有意识的关注教学过程中字词句段的朗读,并给予正确有效的指导,使学生能在低... 朗读是语文教学的重要组成部分,也是阅读教学过程中的一个重要环节,通过科学的朗读训练可以增强学生的阅读能力,促进学生语言和思维的发展。教师应该有层次、有意识的关注教学过程中字词句段的朗读,并给予正确有效的指导,使学生能在低年段就打下良好的朗读基础。 展开更多
关键词 教学 好词 好句
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部