期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于k-mer词频向量的九种DNA序列相似性计算方法比较分析 被引量:2
1
作者 张小丹 李喆 +3 位作者 卫泽刚 刘策 余凯哲 魏月华 《科学技术创新》 2023年第21期106-111,共6页
序列相似性计算是生物序列分析的前提和基础,传统的序列相似性分析方法需要借助双序列比对,如Needleman-Wunsch(NW)序列比对算法。面对海量序列数据,基于序列比对的相似性计算方法具有较高的时间复杂度。为快速得到序列间相似性,可以通... 序列相似性计算是生物序列分析的前提和基础,传统的序列相似性分析方法需要借助双序列比对,如Needleman-Wunsch(NW)序列比对算法。面对海量序列数据,基于序列比对的相似性计算方法具有较高的时间复杂度。为快速得到序列间相似性,可以通过提取序列k-mer信息,利用序列k-mer词频向量进行计算。本文从序列k-mer词频向量提取及基于k-mer词频向量的九种相似性计算方法进行了详细介绍,并用两种数据集进行了比较分析。实验结果表明,基于k-mer词频相似性计算方法比标准NW算法速度至少快103倍,但不同的k-mer词频计算方法得到的相似性与标准NW算法差别较大,相对而言,欧式距离在两个数据集的相似性结果与NW方法更接近,在计算大规模序列相似性时,可以作为优先选择的方法。 展开更多
关键词 序列对比 k-mer词频 Needleman-Wunsch算法 序列相似性
下载PDF
基于16S rRNA序列物种鉴定的改进向量空间模型算法 被引量:1
2
作者 祝斌 亓合媛 马俊才 《计算机系统应用》 2018年第9期163-169,共7页
在物种鉴定领域中,权威方法是基于BLAST的序列比对算法,然而该算法出现计算量过于庞大,运算效率低以及资源消耗较高等问题.为解决以上问题,本文借鉴经典文献中的K-String组份向量方法,对向量空间模型作出改进,将其应用于基于16S rRNA序... 在物种鉴定领域中,权威方法是基于BLAST的序列比对算法,然而该算法出现计算量过于庞大,运算效率低以及资源消耗较高等问题.为解决以上问题,本文借鉴经典文献中的K-String组份向量方法,对向量空间模型作出改进,将其应用于基于16S rRNA序列的物种鉴定领域,并在巴拿赫空间的理论体系下,对改进向量空间模型算法中的遗传距离公式进行等价替换,给出不同范数背景下对应的遗传距离公式,供科研人员参考.本文从计算效率和物种鉴定效果两个方面来判断改进算法的性能,最终得到如下结论:欧几里得空间下的内积范数从计算效率上较经典的blast算法具有显著优势,而其分类效果在检出率这一方面,达到了比对结果的一致性. 展开更多
关键词 16S RRNA基因序列 改进向量空间模型算法 序列对比 物种鉴定 分类
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部