期刊文献+
共找到40篇文章
< 1 2 >
每页显示 20 50 100
无向de-Bruijn图的超级边连通性和限制性边连通度 被引量:20
1
作者 吕长虹 张克民 《应用数学学报》 CSCD 北大核心 2002年第1期29-35,共7页
super- 和限制性边连通度是两个比边连通度更能刻画网络可行性的参数.本文证明了无向 de-Bruijn图 UB(d,n)是 super-( )对n 4,我们证明了 UB(2,n)的限制性边连通度为4;CB(2.3)的限制... super- 和限制性边连通度是两个比边连通度更能刻画网络可行性的参数.本文证明了无向 de-Bruijn图 UB(d,n)是 super-( )对n 4,我们证明了 UB(2,n)的限制性边连通度为4;CB(2.3)的限制性边连通度是3.对d 3,我们指出 UB(d、n)(n 3)的限制性边连通度 ,满足Zd-2< 4d-4. 展开更多
关键词 无向de-bruijn 超级边连通 限制性边连通度 可靠性
原文传递
基于最大权值路径算法的DNA多序列比对方法 被引量:8
2
作者 霍红卫 肖智伟 《软件学报》 EI CSCD 北大核心 2007年第2期185-195,共11页
针对生物序列分析中的多序列比对问题,当输入数据量比较大时,人们提出了很多启发式的算法来改善计算速度和比对结果.提出了用于进行全局DNA多序列比对的一种方法:MWPAlign(maximum weighted path alignment).该算法把序列信息用deBruij... 针对生物序列分析中的多序列比对问题,当输入数据量比较大时,人们提出了很多启发式的算法来改善计算速度和比对结果.提出了用于进行全局DNA多序列比对的一种方法:MWPAlign(maximum weighted path alignment).该算法把序列信息用deBruijn图的形式表示,并将输入序列的信息记录在图的边上,这样,就将求调和序列的问题转化为求图的最大权值路径问题,使多序列比对问题的时间复杂度降低到几乎线性.实验结果显示:MWPAlign是可行的多序列比对算法,尤其对于变异率低于5.2%的大量序列数据,相对于CLUSTALW(cluster alignments weight),T-Coffee和HMMT(hidden Markov model training)有较好的比对结果和运算性能. 展开更多
关键词 多序列比对 de bruijn 调和序列 最大权值路径
下载PDF
高通量测序中序列拼接算法的研究进展 被引量:6
3
作者 周卫星 石海鹤 《计算机科学》 CSCD 北大核心 2019年第5期36-43,共8页
高通量测序(High-throughput Sequencing,HTS)技术是继第一代测序技术之后发展起来的一种新型测序方式,又被称为下一代测序技术。与第一代测序技术中采用基于Sanger方法的自动、半自动毛细管测序方法不同,高通量测序技术采用了基于焦磷... 高通量测序(High-throughput Sequencing,HTS)技术是继第一代测序技术之后发展起来的一种新型测序方式,又被称为下一代测序技术。与第一代测序技术中采用基于Sanger方法的自动、半自动毛细管测序方法不同,高通量测序技术采用了基于焦磷酸测序的并行测序技术,是对传统测序技术的一项重要技术突破,它不仅克服了第一代测序技术高成本、低通量、低速度的缺点,而且能满足现代分子生物学和基因组学快速发展的需求,达到低成本、高通量以及快速的目的。相较于第一代测序数据,高通量测序数据具有典型的长度短、覆盖度不均匀以及准确率低的特点,同时第三代测序技术虽保持了高通量测序技术边测序边合成的思想,但采用了更为高效的单分子实时测序技术和纳米孔测序技术,具有高通量、低成本和测序数据长的优势。因此,要获得完整的全基因组基因序列,生物学家就需要使用一种技术将短测序reads拼装成一条完整的基因单链序列。在这种情况下,序列拼接算法应运而生。首先,介绍了序列拼接算法的发展背景以及高通量测序技术的相关概念,分析了高通量测序技术在序列拼接算法中所具有的优势;其次,通过总结序列拼接算法的发展成果,按基于greedy策略、基于Overlap-Layout-Consensus (OLC)策略和基于De Bruijn Graph (DBG)策略的分类对序列拼接算法进行阐述;最后,探讨了序列拼接算法的相关研究方向和发展趋势。 展开更多
关键词 高通量测序技术 序列拼接算法 GREEDY Overlap-Layout-Consensus de bruijn graph
下载PDF
图的圈边连通度和圈弧连通度 被引量:2
4
作者 朱虹州 孟吉翔 《新疆大学学报(自然科学版)(中英文)》 CAS 2021年第6期655-664,共10页
令G是一个简单图.G的圈边连通度cλ(G)定义为E(G)的一个子集F的最小基数,其中G−F不连通且至少有两个分支包含圈.令D是一个有向图.D的圈弧连通度λ_(c)(D)定义为A(D)的一个子集S的最小基数,其中D−S不强连通且至少有两个强连通分支包含有... 令G是一个简单图.G的圈边连通度cλ(G)定义为E(G)的一个子集F的最小基数,其中G−F不连通且至少有两个分支包含圈.令D是一个有向图.D的圈弧连通度λ_(c)(D)定义为A(D)的一个子集S的最小基数,其中D−S不强连通且至少有两个强连通分支包含有向圈.在文章中,我们研究了无向二元Kautz图、无向de Bruijn图和无向二元广义de Bruijn图的圈边连通度.而且,我们获得了Kautz有向图、de Bruijn有向图和广义de Bruijn图的圈弧连通度. 展开更多
关键词 圈边连通度 圈弧连通度 debruijn Kautz图 广义de bruijn
下载PDF
Genome Sequencing Using Graph Theory Approach
5
作者 Shepherd Chikomana Xiaoxue Hu 《Open Journal of Discrete Mathematics》 2023年第2期39-48,共10页
Genome sequencing is the process of determining in which order the nitrogenous bases also known as nucleotides within a DNA molecule are arranged. Every organism’s genome consists of a unique sequence of nucleotides.... Genome sequencing is the process of determining in which order the nitrogenous bases also known as nucleotides within a DNA molecule are arranged. Every organism’s genome consists of a unique sequence of nucleotides. These nucleotides bases provide the phenotypes and genotypes of a cell. In mathematics, Graph theory is the study of mathematical objects known as graphs which are made of vertices (or nodes) connected by either directed edges or indirect edges. Determining the sequence in which these nucleotides are bonded can help scientists and researchers to compare DNA between organisms, which can help show how the organisms are related. In this research, we study how graph theory plays a vital part in genome sequencing and different types of graphs used during DNA sequencing. We are going to propose several ways graph theory is used to sequence the genome. We are as well, going to explore how the graphs like Hamiltonian graph, Euler graph, and de Bruijn graphs are used to sequence the genome and advantages and disadvantages associated with each graph. 展开更多
关键词 DNA Sequencing Hamiltonian graph Euler graph de bruijn graph NUCLEOTIde
下载PDF
产生二元M序列的一个新算法 被引量:3
6
作者 芮义鹤 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2006年第10期1327-1329,1340,共4页
de Bruijn序列是一类最长的非线性移位寄存器序列,也称它为M序列。文章在纯轮换移位寄存器的状态图中,定义了圈的“夫妻数”,并利用“夫妻数”的特性,给出了二元M序列的一个新的生成算法,其算法能生成2s.g(n,s)个n级M序列。
关键词 de bruijn序列 并圈 状态图 桥状态
下载PDF
DNA序列拼接中de Bruijn图结构的研究 被引量:2
7
作者 王东阳 任世军 王亚东 《智能计算机与应用》 2011年第2X期20-25,30,共7页
基因组测序是生物信息学中最基本的研究方向之一,然而大多数生物的基因组都不可能一次性获得,需要利用序列拼接技术对实验中获得的DNA片段进行拼接操作。目前,测序过程中获得的DNA片段越来越短,基于Euler路径的拼接算法在处理这种... 基因组测序是生物信息学中最基本的研究方向之一,然而大多数生物的基因组都不可能一次性获得,需要利用序列拼接技术对实验中获得的DNA片段进行拼接操作。目前,测序过程中获得的DNA片段越来越短,基于Euler路径的拼接算法在处理这种短片段拼接时具有优势。在Euler路径算法中,一个关键的步骤是deBruijn图的构建,一直以来,构建deBruijn图的方式总是让后一个κ-mer与前一个κ-mer之间有κ-1个碱基的交叠,相邻的两个κ-mer之间相互错开一位。但文中的研究发现,如果有边连接的两个κ-mer之间有κ-2个或者更少的碱基相交叠,会对deBruijn图结构复杂性产生重要影响。针对这些影响进行详细分析,并设计实验进行验证,实验结果表明,κ-mer之间的错位数变化对deBruijn图结构复杂性有显著影响。 展开更多
关键词 生物信息学 基因组测序 DNA序列拼接 Euler路径 de bruijn
下载PDF
一种针对大规模Read Mapping的高效DBG索引方法
8
作者 于长永 李俊杰 +1 位作者 马海涛 赵宇海 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第6期770-776,共7页
为了能够回答生物信息学中关于de Bruijn graph(DBG)的两个问题——①对于任意的k-mer,回答其是否为DBG的顶点,②对于DBG的任意顶点,回答其邻接信息(入边和出边),提出了一种针对大规模read mapping的高效DBG索引方法.本文将以上两个问... 为了能够回答生物信息学中关于de Bruijn graph(DBG)的两个问题——①对于任意的k-mer,回答其是否为DBG的顶点,②对于DBG的任意顶点,回答其邻接信息(入边和出边),提出了一种针对大规模read mapping的高效DBG索引方法.本文将以上两个问题转化为非重复多路径上的k-mer和(k+1)-mer的确切查找问题,并利用FM-index进行解决.首先,对给定的参考序列进行压缩,即非重复多路径的发现,从而压缩了序列中大量存在的重复(k+1)-mer.其次,基于非重复多路径FM-index对DBG进行索引.查找k-mer是否出现在DBG上,若找到,给出该k-mer的直接前驱和直接后继结点,从而提高时空效率.最后,在62种大肠杆菌菌株的基因组上进行实验.实验结果表明,所提出的方法可以高效地对多参考序列的DBG进行索引. 展开更多
关键词 de bruijn graph 索引 read mapping(序列映射) FM-index 参考序列
下载PDF
De novo assembly of transcriptome from next-generation sequencing data
9
作者 Xuan Li Yimeng Kong +2 位作者 Qiong-Yi Zhao Yuan-Yuan Li Pei Hao 《Frontiers of Electrical and Electronic Engineering in China》 CSCD 2016年第2期94-105,共12页
Reconstruction of transcriptome by de novo assembly from next generation sequencing (NGS) short-sequence reads provides an essential mean to catalog expressed genes, identify splicing isoforms, and capture the expre... Reconstruction of transcriptome by de novo assembly from next generation sequencing (NGS) short-sequence reads provides an essential mean to catalog expressed genes, identify splicing isoforms, and capture the expression detail of transcripts for organisms with no reference genome available. De novo transcriptome assembly faces many unique challenges, including alternative splicing, variable expression level covering a dynamic range of several orders of magnitude, artifacts introduced by reverse transcription, etc. In the current review, we illustrate the grand strategy in applying De Bruijn Graph (DBG) approach in de novo transcriptome assembly. We further analyze many parameters proven critical in transcriptome assembly using DBG. Among them, k-met length, coverage depth of reads, genome complexity, performance of different programs are addressed in greater details. A multi-k-mer strategy balancing efficiency and sensitivity is discussed and highly recommended for de novo transcriptome assembly. Future direction points to the combination of NGS and third generation sequencing technology that would greatly enhance the power of de novo transcriptomics study. 展开更多
关键词 TRANSCRIPTOME de novo assembly de bruijn graph next generation sequencing k-mer length RNA splicing PERFORMANCE
原文传递
基于de Bruijn图的M序列递归升级构造方法 被引量:1
10
作者 郭辉 柏森 +2 位作者 阳溢 宋斌 李淑云 《计算机工程》 CAS CSCD 北大核心 2015年第8期144-149,161,共7页
高级M序列具有良好的伪随机特性和安全特性,广泛应用于信息安全领域,如何快速有效生成高级M序列一直是研究的热点。在图论知识的基础上,给出一种新的M序列递归升级构造方法,根据n级de Bruijn图中的一条Hanilton回路构成n级M序列、Euler... 高级M序列具有良好的伪随机特性和安全特性,广泛应用于信息安全领域,如何快速有效生成高级M序列一直是研究的热点。在图论知识的基础上,给出一种新的M序列递归升级构造方法,根据n级de Bruijn图中的一条Hanilton回路构成n级M序列、Euler回路构成n+1级M序列的原理,在已知一条二元n级M序列的条件下,将M序列转换为de Bruijn图中一条Hamilton回路,求出该Hamilton回路的补路,得到一条Euler回路,从而构成n+1级M序列,据此依次递归生成一条更高级的M序列。利用NIST SP 800-22随机数测试标准对生成的高级M序列进行测试,结果表明,该方法生成的高级M序列测试值都大于0.01,满足随机性要求。 展开更多
关键词 信息安全 M序列 de bruijn NIST SP800-22随机数测试 HAMILTON回路 Euler回路
下载PDF
基于de Bruijn图的序列拼接算法研究与实现 被引量:1
11
作者 李飞菲 《现代计算机(中旬刊)》 2016年第1期3-6,25,共5页
序列拼接算法是DNA测序过程中的关键技术。随着新一代测序技术的发展,如何实现高通量、高效率测序已经成为生物信息学领域的重要挑战,序列拼接算法也在逐渐改进以提高拼接效果。基于de Bruijn图的序列拼接算法是目前使用最广泛的方法之... 序列拼接算法是DNA测序过程中的关键技术。随着新一代测序技术的发展,如何实现高通量、高效率测序已经成为生物信息学领域的重要挑战,序列拼接算法也在逐渐改进以提高拼接效果。基于de Bruijn图的序列拼接算法是目前使用最广泛的方法之一,对其进行分析研究,利用C++编程实现该算法,并对实验结果进行分析。 展开更多
关键词 新一代测序技术 高通量测序 基因拼接 de bruijn
下载PDF
二元de Bruijn序列的一个生成算法 被引量:1
12
作者 芮义鹤 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2009年第1期139-141,共3页
文章在纯轮换移位寄存器的状态图中,定义了圈的"比重",并利用"比重"的特性,给出了2元deBruijn序列的一个生成算法,其算法速度较快;同时该算法能生成2s.g(n,s)个n级de Bruijn序列,其中1≤s≤2(n-24),g(n,s)=n-2l-6-[... 文章在纯轮换移位寄存器的状态图中,定义了圈的"比重",并利用"比重"的特性,给出了2元deBruijn序列的一个生成算法,其算法速度较快;同时该算法能生成2s.g(n,s)个n级de Bruijn序列,其中1≤s≤2(n-24),g(n,s)=n-2l-6-[n-l 2+l1-6]。 展开更多
关键词 de bruijn序列 并圈 状态图 桥状态
下载PDF
基于de Bruijn图和序列比对的长序列混合纠错算法 被引量:1
13
作者 刘刚 《现代计算机》 2022年第5期32-37,45,共7页
第三代测序技术产生的长序列错误率非常高,现有的长序列纠错算法还有待进一步提升纠错质量。本文通过遍历k值可变de Bruijn图来扩展连接种子形成种子序列,使得序列路径覆盖长序列中未与短序列比对的区域;采用序列比对来纠正长序列与短... 第三代测序技术产生的长序列错误率非常高,现有的长序列纠错算法还有待进一步提升纠错质量。本文通过遍历k值可变de Bruijn图来扩展连接种子形成种子序列,使得序列路径覆盖长序列中未与短序列比对的区域;采用序列比对来纠正长序列与短序列对准的区域,并使用种子序列路径来纠正长序列未与短序列对准的区域。在模拟数据集和真实数据集上的实验结果表明,与已有的长序列混合纠错算法相比,本文的算法获得较高质量的纠错序列。 展开更多
关键词 长序列纠错 混合纠错 序列比对 de bruijn
下载PDF
Model of Overlapping Messages with Degenerate Coding
14
作者 Valery Kirzhner Zeev Volkovich 《Applied Mathematics》 2012年第2期188-197,共10页
Superposition of signals in DNA molecule is a sufficiently general principle of information coding. The necessary re-quirement for such superposition is the degeneracy of the code, which allows placing different messa... Superposition of signals in DNA molecule is a sufficiently general principle of information coding. The necessary re-quirement for such superposition is the degeneracy of the code, which allows placing different messages on the same DNA fragment. Code words that are equivalent in the informational sense (i.e., synonyms) form synonymous group and the entire set of code words is partitioned into synonymous groups. This paper is dedicated to constructing and analyzing the model of synonymous coding. We evaluate some characteristics of synonymous coding as applied to code words of length two although many definitions may be extended for words of arbitrary length. 展开更多
关键词 OVERLAPPING MESSAGES deGENERATE CODING Sequence COMPACTING de bruijn graph DNA TRIPLET Code
下载PDF
序列组装在蛋白质测序技术中的方法
15
作者 陆翼 葛成 +3 位作者 徐晴 蔡标 孔韧 常珊 《现代计算机》 2023年第4期18-24,48,共8页
从头测序技术是应用于蛋白质组学的测序方法。与其他测序技术相比,从头测序技术的优势是在不依赖数据库搜索和无需PCR扩增的基础上对DNA或者蛋白质进行测序。目前,从头测序技术也广泛应用于蛋白质组学领域。研究人员为了将测序技术所得... 从头测序技术是应用于蛋白质组学的测序方法。与其他测序技术相比,从头测序技术的优势是在不依赖数据库搜索和无需PCR扩增的基础上对DNA或者蛋白质进行测序。目前,从头测序技术也广泛应用于蛋白质组学领域。研究人员为了将测序技术所得的短序列reads进一步组装成一条完整的序列,就需要使用序列组装方法。首先,介绍了测序技术的发展背景、从头测序技术的概念以及序列组装算法的出现;其次,总结了基于Overlap⁃Layout⁃Consensus策略、deBruijn图策略和Greedy策略的序列组装算法的具体概念和成果;最后,阐述了序列组装算法面临的挑战。 展开更多
关键词 从头测序 序列组装算法 debruijn
下载PDF
基因组装算法:调研
16
作者 连帅彬 戴宪华 《计算生物学》 2013年第2期7-14,共8页
基因测序技术在过去的二十几年里取得了突飞猛进的发展,随着以高通量,短读取,低成本为特点的新一代基因测序技术的问世,测序一个物种全基因的时间和成本大大降低。基于下一代测序技术的全基因组装算法和软件相继开发出来,目前比较成熟... 基因测序技术在过去的二十几年里取得了突飞猛进的发展,随着以高通量,短读取,低成本为特点的新一代基因测序技术的问世,测序一个物种全基因的时间和成本大大降低。基于下一代测序技术的全基因组装算法和软件相继开发出来,目前比较成熟的基因组装算法大约有二十种左右。由于基因组装问题本身的复杂性,目前还没有针对不同组装算法的具体设计步骤,操作环境,应用范围等方面的调研。基于此本文简要调研了现有的十二种具有代表性的基因组装算法,系统的分析了每种算法的设计步骤,算法原理,操作环境以及应用。这篇调研对于如何设计基因组装算法,对于不同的基因数据如何选择更加合适的基因组装算法和软件提供了一定的指导。 展开更多
关键词 基因组装 de bruijn 下一代测序技术(NGS)
下载PDF
de Bruijn定理的推广(英文)
17
作者 杜清晏 《数学进展》 CSCD 北大核心 2008年第6期729-748,共20页
de Bruijn定理是一种重要的组合计数方法,本文以非常自然的方式推广了这种方法.P-图是图G在其顶点上的置换群P作用下形成的轨道.文中引进了P-图,P-图的色容指标,P-图关于色置换群H的色权多项式以及色对称与全色对称图等概念,建立了色权... de Bruijn定理是一种重要的组合计数方法,本文以非常自然的方式推广了这种方法.P-图是图G在其顶点上的置换群P作用下形成的轨道.文中引进了P-图,P-图的色容指标,P-图关于色置换群H的色权多项式以及色对称与全色对称图等概念,建立了色权多项式的计算公式和一系列的组合公式及性质. 展开更多
关键词 组合计数 de bruijn 色等价类 色权多项式
下载PDF
DBCAN:一种基于de Bruijn图的高效P2P模型
18
作者 毕海波 《现代计算机》 2020年第1期16-20,共5页
DBCAN是一种基于de Bruijn图的结构化P2P网络路由模型,采用de Bruijn图作为P2P覆盖网络拓扑结构,网络中的每个节点都负责维护虚拟2维笛卡尔坐标空间中的一块区域,实现数据命名与分布、节点邻居关系、路由算法、数据的发布等。实验仿真表... DBCAN是一种基于de Bruijn图的结构化P2P网络路由模型,采用de Bruijn图作为P2P覆盖网络拓扑结构,网络中的每个节点都负责维护虚拟2维笛卡尔坐标空间中的一块区域,实现数据命名与分布、节点邻居关系、路由算法、数据的发布等。实验仿真表明,该路由模型的节点度、负载均衡和路由路径长度等性能均优于CAN、Koorde等结构化路由模型。 展开更多
关键词 路由 定位 分布式哈希表 de bruijn
下载PDF
无向二元De Bruijn图的边割计数(英文)
19
作者 欧见平 《内蒙古师范大学学报(自然科学汉文版)》 CAS 2004年第1期17-21,共5页
利用无向二元DeBruijn图UB(2 ,n)的极大限制边连通性计算了它的边割数 ,确定了阶至多为 3的边割数 .同时 ,给出了 4阶边割数的一个上界 ,认为此上界是紧的 .
关键词 无向二元de bruijn 连通性 边割 上界
下载PDF
基于de Bruijn图的基因组索引结构设计
20
作者 国宏哲 王亚东 《智能计算机与应用》 2019年第1期1-5,13,共6页
随着高通量测序技术的快速发展和测序成本的逐渐降低,个体基因组测序已成为研究不同物种的基因型、变异情况和相关疾病的重要手段。然而,由于基因组上的大量重复序列和高变异区域,日益增大的测序数据量以及测序技术的局限等因素,如何准... 随着高通量测序技术的快速发展和测序成本的逐渐降低,个体基因组测序已成为研究不同物种的基因型、变异情况和相关疾病的重要手段。然而,由于基因组上的大量重复序列和高变异区域,日益增大的测序数据量以及测序技术的局限等因素,如何准确且快速地将大量测序数据比对到参考基因组面临巨大挑战。阐述基于哈希思想的基因组数据的存储和索引方法。本文说明基于seed-and-extension思想的基本比对思路。本文提出一个基于de Bruijn图模型的索引结构DBG-index以及该索引的3层结构数据存储方式。分析该索引结构的特性并提出种子的基本操作方法。该索引结构利用图模型特性可以有效组织基因组上的重复序列,从而在整体上减少了候选种子数量并极大提高了比对速度。 展开更多
关键词 基因组 索引 序列映射 de bruijn
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部