期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
双序列比对基础和应用实例 被引量:1
1
作者 罗静初 《生物信息学》 2023年第1期1-19,共19页
首先介绍序列比对的分子生物学基础,即核酸序列基本单元核苷酸和蛋白质序列基本单元氨基酸。文中以精心设计的图表列出四种核苷酸和二十种氨基酸的名称、性质和分类。第2节简述序列比对基础,包括相似性和同源性基本概念、整体比对和局... 首先介绍序列比对的分子生物学基础,即核酸序列基本单元核苷酸和蛋白质序列基本单元氨基酸。文中以精心设计的图表列出四种核苷酸和二十种氨基酸的名称、性质和分类。第2节简述序列比对基础,包括相似性和同源性基本概念、整体比对和局部比对、点阵图方法、动态规划和启发式算法、计分矩阵和空位罚分,以及常用软件和分析平台。第3节介绍核酸序列比对中常用计分矩阵DNAfull,蛋白质序列比对中常用计分矩阵BLOSUM62和PAM250。第4-8节则以血红蛋白、多肽毒素、植物转录因子、癌胚抗原和唾液酸酶为例,介绍双序列比对的具体应用。通过这些实例,说明如何选择分析平台和比对程序、如何设置计分矩阵和空位罚分,如何分析比对结果及其生物学意义。文末进行简要总结。 展开更多
关键词 双序列比对 相似性和同源性 整体比对和局部比对 点阵图 计分矩阵 空位罚分 血红蛋白 多肽毒素 植物转录因子 癌胚抗原 唾液酸酶
下载PDF
基于网络模块性的蛋白质序列聚类 被引量:5
2
作者 梅娟 何胜 +2 位作者 王正祥 石贵阳 李炜疆 《食品与生物技术学报》 CAS CSCD 北大核心 2010年第1期123-127,共5页
蛋白质的远同源性探测是结构基因组学和功能基因组学的主要研究任务之一。一些具有一定相似结构和功能、但序列相似性却较低的蛋白质组成蛋白质超家族,则远同源性探测问题等价于对蛋白质超家族的识别问题。作者提出了一种基于模块性的... 蛋白质的远同源性探测是结构基因组学和功能基因组学的主要研究任务之一。一些具有一定相似结构和功能、但序列相似性却较低的蛋白质组成蛋白质超家族,则远同源性探测问题等价于对蛋白质超家族的识别问题。作者提出了一种基于模块性的聚类算法ModuleFind,该方法通过最大化蛋白质网络的模块性来寻找具有较强集团结构的划分。在蛋白质结构分类数据库(SCOP)超家族层次上进行的实验表明,该方法得到的聚类结果更接近分类基准,且具有较高的F-测度值。 展开更多
关键词 蛋白质网络 序列相似性 远同源性 模块性 聚类 蛋白质结构分类数据库
下载PDF
基于相似性摘要算法的应用与研究
3
作者 肖锦琦 《现代计算机(中旬刊)》 2018年第1期15-18,共4页
算法可以将任意大小的数据转换成一段极短的摘要信息,并通过摘要信息计算两组数据的相似程度,在电子犯罪取证调查、恶意软件检测、垃圾邮件过滤等安全领域极具应用价值。将相似性摘要算法分为基于内容分割的分片哈希算法、特征提取算法... 算法可以将任意大小的数据转换成一段极短的摘要信息,并通过摘要信息计算两组数据的相似程度,在电子犯罪取证调查、恶意软件检测、垃圾邮件过滤等安全领域极具应用价值。将相似性摘要算法分为基于内容分割的分片哈希算法、特征提取算法以及局部敏感哈希算法等三个类别,分别讨论其特点和适用范围,以及在恶意软件以及文本文件等应用场景中测试相似性检测效果,同时指出现有算法的不足以及研究方向。 展开更多
关键词 相似性摘要 局部敏感哈希 同源性检测 数据指纹
下载PDF
Use Chou’s 5-Steps Rule to Predict Remote Homology Proteins by Merging Grey Incidence Analysis and Domain Similarity Analysis 被引量:15
4
作者 Weizhong Lin Xuan Xiao +1 位作者 Wangren Qiu Kuo-Chen Chou 《Natural Science》 2020年第3期181-198,共18页
Detecting remote homology proteins is a challenging problem for both basic research and drug development. Although there are a couple of methods to deal with this problem, the benchmark datasets based on which the exi... Detecting remote homology proteins is a challenging problem for both basic research and drug development. Although there are a couple of methods to deal with this problem, the benchmark datasets based on which the existing methods were trained and tested contain many high homologous samples as reflected by the fact that the cutoff threshold was set at 95%. In this study, we reconstructed the benchmark dataset by setting the threshold at 40%, meaning none of the proteins included in the benchmark dataset has more than 40% pairwise sequence identity with any other in the same subset. Using the new benchmark dataset, we proposed a new predictor called “dRHP-GreyFun” based on the grey modeling and functional domain approach. Rigorous cross-validations have indicated that the new predictor is superior to its counterparts in both enhancing success rates and reducing computational cost. The predictor can be downloaded from https://github.com/jcilwz/dRHP-GreyFun. 展开更多
关键词 REMOTE homology PROTEINS Grey Model DOMAIN similarity Chou’s 5-Steps Rules
下载PDF
面向代码相似性检测的相似哈希改进方法 被引量:9
5
作者 李玫 高庆 +3 位作者 马森 张世琨 胡文蕙 张兴明 《软件学报》 EI CSCD 北大核心 2021年第7期2242-2259,共18页
代码相似性检测(code similarity detection)是软件工程领域的基本任务之一,其在剽窃检测、许可证违反检测、软件复用分析以及漏洞发现等方向均起着重要作用.随着软件开源化的普及以及开源代码量的高速增长,开源代码在各个领域的应用日... 代码相似性检测(code similarity detection)是软件工程领域的基本任务之一,其在剽窃检测、许可证违反检测、软件复用分析以及漏洞发现等方向均起着重要作用.随着软件开源化的普及以及开源代码量的高速增长,开源代码在各个领域的应用日益频繁,给传统的代码相似性检测方法带来了新的挑战.现有的一些基于词法、语法、语义的检测方法存在算法较为复杂、对解析工具有依赖性、消耗资源高、可移植性差、候选对比项数量较多等问题,在大规模代码库上有一定的局限性.基于相似哈希(simhash)指纹的代码相似性检测算法将代码降维至1个指纹,能够在数据集规模较大的情况下实现快速相似文件检索,并通过海明距离阈值控制匹配结果的相似度范围.通过实验对现有的基于代码行粒度的相似哈希算法进行验证,发现其在大规模数据集下存在行覆盖问题,即高频行特征对低频行特征的覆盖现象,导致结果精确度较低.受TF-IDF算法思想启发,针对上述问题创新性地提出了分语言行筛选优化方法,通过各种语言的行筛选器对代码文件行序列进行筛选,从而消除高频出现但语义信息包含较少的行对结果的影响.对改进前后方法进行一系列对比实验,结果表明,改进后的方法在海明距离阈值为0~8的情况下都能够实现高精确度的相似文件对检索,当阈值为8时在两个数据集下的精确度较改进前的方法分别提升了98.6%和52.2%.在所建立的130万个开源项目、386486112个项目文件的大规模代码库上进行了实验,结果表明所提方法能够快速检测出待测文件的相似文件结果,平均单个文件检测时间为0.43s,并取得了97%以上的检测精度. 展开更多
关键词 代码相似性检测 代码同源分析 大数据 相似哈希 代码指纹生成
下载PDF
基于蛋白质相互作用网络挖掘物种内的功能相似蛋白质 被引量:3
6
作者 宋宝兴 桑青 +1 位作者 王芬 张德礼 《生物物理学报》 CAS CSCD 北大核心 2011年第9期789-800,共12页
本文基于图论(graph theory)思想挖掘功能相似蛋白质。将蛋白质相互作用网络(protein-protein interaction network,PPI)转化为图,使用1-hop方法把相互作用网络拆分为子图。应用最短路径法,依次把拆分得到的每一个子图与所有子图进行两... 本文基于图论(graph theory)思想挖掘功能相似蛋白质。将蛋白质相互作用网络(protein-protein interaction network,PPI)转化为图,使用1-hop方法把相互作用网络拆分为子图。应用最短路径法,依次把拆分得到的每一个子图与所有子图进行两两比对,寻找最优比对结果,挖掘物种内有相似功能的蛋白质。应用该方法对构建的人类蛋白质相互作用网络进行比对,共挖掘到1081对功能相似蛋白质。该方法的特点是数据量偏小、较可靠。计算结果中还出现了一些序列相似度较低、用序列比对的方法难以挖掘到的功能相似蛋白质。通过对结果的分析可以发现,趋同进化和同源有时很难区分。本实验的全部数据、程序和结果可在网站http://bina.biositemap.com上查询。 展开更多
关键词 功能相似蛋白质 同源 蛋白质相互作用网络
原文传递
联想与英语同源格
7
作者 孙锐 《重庆理工大学学报(社会科学)》 CAS 2007年第11期127-129,150,共4页
联想主要表现为相似联想、邻接联想和对比联想。分析这3种联想方式在英语同源词及同源格的产生与运用中的作用。论述这3种联想方式对英语同源词产生的影响及其在同源格语义结构上的体现。
关键词 相似联想 邻接联想 对比联想 同源词 同源格
下载PDF
酵母蛋白质的序列相似性分析
8
作者 陈素 刘向明 《中南民族大学学报(自然科学版)》 CAS 2002年第4期40-42,共3页
介绍了蛋白质序列相似性分析的进展 ,并以对酵母蛋白质所做的工作为例 ,详细说明了蛋白质序列相似性分析的过程和有关算法 ,阐明了将蛋白质的结构分析和功能预测结合起来对序列相似性分析的意义 ,还针对蛋白质结构分析和功能预测的方法 ... 介绍了蛋白质序列相似性分析的进展 ,并以对酵母蛋白质所做的工作为例 ,详细说明了蛋白质序列相似性分析的过程和有关算法 ,阐明了将蛋白质的结构分析和功能预测结合起来对序列相似性分析的意义 ,还针对蛋白质结构分析和功能预测的方法 ,提出了一些目前存在的问题 ,作为以后研究工作的出发点 . 展开更多
关键词 酵母 蛋白质 序列相似性分析 同源性 生物化学 结构分析 功能预测
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部